主成分分析

2022-11-26 06:57:06 字數 675 閱讀 4859

從數學的角度來看,主成分分析是一種降維處理技術。假設有n個地理樣本,每個樣本有p個變數,這樣就構成了n*p階地理資料矩陣:

一般來說,地理資料的指標具有不同的量綱,有的在指標數量級上差異很大,在進行分析時會出現新的問題。所以,在主成分分析前,要對原始資料進行標準化處理。原始資料無量綱化的計算公式為:

,如果記原來的變數指標為x1,x2,….xp它們的綜合指標,即變數指標為

z1,z2….zm()

21一liixi+112xz+…+l一。x,式中,係數,lij由以下原則決定:(1) zi與zj(,)相互無關(2)z1是x、,x2,x3,…,xp的一切線性組合中方差最大者; zm是與z1,z2….

zm-1,都不相關的xl,x2,x3,…,xp的所有線性組合中方差最大者。

這樣決定的新變數指標z1,z2….zm-1, 分別叫原始變數xl,x2,x3,…,xp的第一,第二,…,第m個主成分。其中z1在總方差中所佔的比值最大,z2….

zm的方差依次遞減。在實際問題的分析中,常常挑選前幾個最大的主成分,從而減少了變數的數目,又抓住了問題的本質,簡化了變數之間的關係。以上的分析發現,確定主成分就是找出原來變數xj(j=1, 2,…p)在諸主成分zi(i=1,2,…m)上的載荷iij(i=1,2,…m,j=1,2,…,p)由數學上易於知道,它們分別是x1,x2,….

xp的相關矩陣的m個較大的特徵值所對應的特徵向量。

SPSS主成分分析 5

2 朱士鵬,周琳,秦趣.貴州省縣域經濟實力時空差異分析 j 重慶師範大學學報 自然科學版 2013,01 106 111.聚類分析 中國區域生態效率評價 基於生態足跡方法 一文定義區域生態效率計算模型為 區域生態效率 區域gdp 區域生態足跡 區域人均gdp 區域人均生態足跡,並以2007 年截面資...

主成分分析與聚類分析

附表1 原始資料 附表2附表3 附表4附表5 分析 由上表可知,後四個主成分的累計貢獻率為0.622288 0.127037 0.083765 0.053039 0.88613大於85 主成分分析效果很好。下面選取後四個主成分進行分析。後四個特徵根對應的特徵向量如下表6 附表6則四個主成分表示式如下...

主成分分析 得分排名

多元分析上機作業 4 學號 200930980106 姓名 何斌年級專業 10級統計1班指導老師 劉金山 1.假定我們研究的經濟問題共涉及兩個指標 產值和利稅,其中產值以百萬元計,利稅以萬元計,的原始資料矩陣如下 1 從協方差陣出發,進行主成分分析,要求給出 特徵根分解結果 方差貢獻率 因子符合矩陣...