主成分分析详解

作者&投稿:德凭 (若有异议请与网页底部的电邮联系)
主成分分析法源解析~

比值法可以定性地解释研究区PAHs的污染来源,但是不能进行定量的描述,且还有一定的局限性。因此本研究将通过对PAHs数据的因子分析和多元回归分析,可以半定量地了解各种污染源对研究区PAHs总量的贡献率。
主成分分析(PrincipalComponentsAnalysis,PCA)和因子分析是进行数据降维的常用方法,是把多个变量(指标)化为少数几个可以反映原来多个变量的大部分信息的综合变量(综合指标)的一种方法。主成分分析可直接将数据映射到唯一正交坐标系,因子分析可以进一步通过旋转坐标系,使被提取出来的因子具有最小的协方差,使每个因子代表的变量更明显,从而支持污染源识别。Wangetal.(2009)运用空间和多元分析对北京表土(0~10cm)PAHs的分布特征和污染来源进行了研究,结果表明,煤的燃烧和汽车尾气的排放、石油源及焦炭源分别是商业区、市内和郊区的主要污染源,这与北京的能源消耗及功能区划的空间分布特征密切相关。
对污灌区表土的14种PAHs进行主成分分析,结果表明,前两个因子说明了100%的方差,其中第一个主成分F1占方差的68.36%,第二个主成分F2占方差的31.64%,因此这两个主因子可以说明PAHs的污染来源。
由表4.13可以看出,第一个主成分F1在变量苯并[a]芘、苯并[b]荧蒽、苯并[g,h,i]苝、苯并[k]荧蒽、二苯并[a,h]蒽、二氢苊、芘、屈、茚并[1,2,3-cd]芘上有高的正负荷,同时也可以看出大部分是高环的PAHs。根据文献报道(Harrisonetal.,1996;Mastraletal.,1996),荧蒽、芘、屈、苯并[k]荧蒽是煤燃烧产物的典型标志。屈、苯并[b]荧蒽、苯并[g,h,i]苝、苯并[k]荧蒽、二苯并[a,h]蒽、苯并[a]芘、茚并[1,2,3-cd]芘表征汽车尾气的排放(Simciketal.,1999;Motelay-Masseietal.,2007)。因此,第一主成分F1可表征的污染源为煤的燃烧和汽车尾气的排放。
表4.13 污灌区土壤的方差极大旋转后的主因子载荷


注:提取方法为主成分分析法。施转方法为Varimax与Kaiser规范化。3次迭代汇成的旋转。
第二个主成分F2在萘、菲、芴、荧蒽、苊上有较高的正负荷,反映的是低环的PAHs。据Simciketal.(1999)的研究发现,二氢苊、菲、芴是焦炭源的主要产物。蒽和苊是石油源的主要产物,其中包括在生产和运输过程中石油及其相关产品的泄漏和溢洒。因此第二个主成分F2可表征的污染源为焦炭源和石油源。
运用SPSS对主因子分析所得的结果进行多元回归分析,进一步估算每种PAHs源的贡献率,因变量为PAHs总量的标准化分数,自变量为各因子的得分,得出的回归方程为
∑PAHs=0.393F1+0.919F2
各因子的贡献率根据公式 计算,其中Ai为每个因子的回归系数。
根据上述公式可以计算出,污灌区土壤PAHs污染中两个主因子的贡献率分别为F1(煤的燃烧和汽车尾气)30%,F2(焦炭源和石油源)70%。可见主成分分析法再次说明了污灌区土壤剖面PAHs的主要来源为石油源和燃烧源的输入,其中石油源的输入比重较大,这一结果与比值法所得结果相吻合。
对再生水灌区表土的PAHs进行主成分分析,结果表明,前两个因子说明了100%的方差,其中第一个主成分F1占方差的79.39%,第二个主成分F2占方差的20.61%,因此这两个主因子可以说明PAHs的污染来源。
由表4.14可以看出,第一个主成分F1在变量苯并[a]芘、苯并[b]荧蒽、苯并[g,h,i]苝、苯并[k]荧蒽、蒽、二苯并[a,h]蒽、苊、芘、屈、茚并[1,2,3-cd]芘、荧蒽上有高的正负荷,同时也可以看出大部分是高环的PAHs。根据上面的文献报道可得出,第一主成分F1可表征的污染源为煤的燃烧、汽车尾气的排放和石油源。
表4.14 再生水灌区土壤的方差极大旋转后的主因子载荷


第二个主成分F2在菲、芴上有较高的正负荷,反映的是低环的PAHs。第二个主成分F2可表征的污染源为焦炭源。
运用SPSS对主因子分析所得的结果进行多元回归分析,进一步估算每种PAHs源的贡献率,得出的回归方程为
∑PAHs=0.980F1+0.198F2
根据因子贡献率公式可以计算出,再生水灌区土壤PAHs污染中两个主因子的贡献率分别为F1(煤的燃烧、汽车尾气、石油源)83.2%,F2(焦炭源)16.8%。可见再生水灌区土壤剖面PAHs的主要来源为煤的燃烧、汽车尾气的排放和部分石油源的输入。
对清灌区表土的PAHs进行主成分分析,结果表明,前两个因子说明了100%的方差,其中第一个主成分F1占方差的69.72%,第二个主成分F2占方差的30.28%,因此这两个主因子可以说明PAHs的污染来源。
由表4.15可以看出,第一个主成分F1在变量苯并[a]芘、苯并[b]荧蒽、苯并[g,h,i]苝、苯并[a]蒽、荧蒽、芘、屈、茚并[1,2,3-cd]芘上有高的正负荷,同时也可以看出主要是高环的PAHs。根据上面的文献报道可得出,第一主成分F1可表征的污染源为煤的燃烧、汽车尾气的排放。
表4.15 清灌区土壤的主因子载荷


注:用主成分分析法提取出两个因子。
第二个主成分F2在菲、芴上有较高的正负荷,反映的是低环的PAHs。第二个主成分F2可表征的污染源为焦炭源。
运用SPSS对主因子分析所得的结果进行多元回归分析,进一步估算每种PAHs源的贡献率,得出的回归方程为
∑PAHs=0.981F1+0.193F2
根据因子贡献率公式可以计算出,再生水灌区土壤PAHs污染中两个主因子的贡献率分别为F1(煤的燃烧、汽车尾气)83.6%,F2(焦炭源)16.4%。可见清灌区土壤剖面PAHs的主要来源为煤的燃烧和汽车尾气的排放。
从以上分析可以看出,3个灌区土壤的PAHs污染来源主要是煤的燃烧、汽车尾气的排放、焦炭源和石油源,只是各个污染源所占的比重不同而已。因此控制北京地区汽车的保有量,加强清洁能源的推广,继续缩减煤炭在能源结构中的比重,并加强石油储藏、运输过程中的管理,可以有效地减少PAHs的污染。
这里需要说明的是,由于PAHs在环境中可能会因挥发、淋滤、降解、光解等过程而产生损失或丢失,造成“源”信息的失真,在一定程度上影响了其有效地示踪环境中该类污染物的来源。如本研究中由于污水的长期灌溉,使低环的PAHs会向下层土壤中迁移,因此表土中低环PAHs的含量会不断地发生变化,从而导致表土的PAHs的组成发生相应的变化,进而影响PAHs的来源分析。此外灌溉用水沿渠道流动水质的改变也会影响到PAH来源的判别。

主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。又称主分量分析。
在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。

  一、主成分分析
  1、简介
  在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
  2、原理
  设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上处理降维的一种方法。
  二、主成分分析的基本思想及步骤
  1、基本思想
  主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
  2、步骤
  Fp=a1iZX1+a2iZX2+……+apiZXp   其中a1i, a2i, ……,api(i=1,……,m)为X的协方差阵Σ的特征值所对应的特征向量,ZX1, ZX2, ……, ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响[注:本文指的数据标准化是指Z标准化]。   A=(aij)p×m=(a1,a2,…am,),Rai=λiai,R为相关系数矩阵,λi、ai是相应的特征值和单位特征向量,λ1≥λ2≥…≥λp≥0 。   进行主成分分析主要步骤如下:   1. 指标数据标准化(SPSS软件自动执行);   2. 指标之间的相关性判定;   3. 确定主成分个数m;   4. 主成分Fi表达式;   5. 主成分Fi命名;





你想知道什么》


语文句子成分分析详解 一个句子都有什么组成
1、句子是由词或词组构成的,是具有一定语调并表达一个完整意思的语言运用单位。根据用途和语气,句子可以分为陈述句、疑问句、祈使句、感叹句。根据结构可分为单句和复句。2、句子的组成叫句子成分,也叫句法成分。子中,词之间有一定的组合关系,按照不同系,可以把句子分为不同的组成成分。句子成分由...

语文句子成分分析
一般完整的句子成分的排列为:定语(修饰主语)主语 状语 谓语 补语 定语(修饰宾语)宾语 句子成分符号:主语 = 谓语 - 宾语 ~ 定语 ( ) 状语 [ ] 补语 < >主语、谓语、宾语是句子的主干,定语、状语、补语是句子的枝叶,一般来说,句子主干已经可以把意思表达清楚,而枝叶只是修饰一下,是意思表达得更精确、明了。

英语句子成分分析,每种还要举至少5个例子,详解各个单词在该句中做什 ...
一、句子成分(一)句子成分的定义:构成句子的各个部分叫做句子成分。句子成分有主要成分和次要成分;主要成分有主语和谓语;次要成分有表语、宾语、定语、状语、补足语和同位语。(二)主语:主语是一个句子所叙述的主体,一般位于句首。但在there be结构、疑问句(当主语不疑问词时)和倒装句中,主语位于谓语、助动词或情态...

求英语句子成分分析详解
同位语是在名词或代词之后并列名词或代词对前者加以说明的成分,近乎于后置定语。如: We students should study hard. \/ (students是we的同位语,都是指同一批‘学生’) We all are students. \/ (all是we的同位语,都指同样的‘我们’) 七、独立成分:有时句子中会有一些与句子没有语法联系的成分,称为句子独立成...

主成分分析详解
一、主成分分析 1、简介 在用统计分析方法研究这个多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先...

语文句子成分详细解析
语文划分句子成分的详解 什么是句子 句子是由词或词组构成的,是具有一定语调并表达一个完整意思的语言运用单位。根据用途和语气,句子可以分为陈述句、疑问句、祈使句、感叹句。根据结构可分为单句和复句。句子成分的名称及符号 名称:主语、谓语、宾语、定语、状语、补语。符号:主语=谓语- 宾语 ~定语...

Olay四款小白瓶详解,成分对比分析,再也不会分不清小白瓶了
说小白瓶区别前我们先来简单了解下烟酰胺成分。烟酰胺又称维生素B3,是比较安全的成分,它在抑制黑色素沉着、抗炎等方面有很好的疗效。烟酰胺的美白功效主要是:抑制黑色素向角质细胞的转运和增加角质层的新陈代谢。能维持肌肤含水量,促进真皮层微循环。其浓度在 2%-5% 这个区间对治疗晒斑和色素沉着有...

求英语句子成分详解。我想学语法
英语语法——英语句子成分分析句子是按照一定的语法规律组成的,表达一个完整的意义。一个句子一般由两部分构成,即主语部分和谓语部分,这两部分也叫做句子的主要成分。句子的次要成分包括宾语,定语,状语,表语等。句子成分是句子中起一定功用的组成部分。1)主语:是一句的主体,是全句述说的对象,常用名词,数词或代词担任...

详解主成分分析PCA
主成分分析( Principal components analysis),简称PCA,是最主要的数据降维方法之一。本文从PCA的思想开始,一步一步推导PCA。对于 , 。我们希望 从 维降到 维,同时希望信息损失最少。比如,从 维降到 :我们既可以降维到第一主成分轴,也可以降维到第二主成分轴。那么如何找到这这...

初中英语句子成分分析
英语句子成分结构详解 一、英语语句基本结构分析: (一)主谓宾结构: 1、主语:可以作主语的成分有名词(如boy),主格代词(如you),数词,动词不定式,动名词等。主语一般在句首。注意名词单数形式常和冠词不分家! eg: The boy comes from America. He made a speech. Two and two is four. To be a teacher is...

市北区18964922501: 主成分分析法 - 搜狗百科
辛茂得治:[答案] 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标.在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术.它是一个线性变换.这个变换把数据变换...

市北区18964922501: 主成分分析是一种什么方法?主成分分析是一种什么方法?
辛茂得治: 主成分分析:是把几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关的一种数学降维的方法

市北区18964922501: 谁能用通俗易懂的语言讲解一下什么是PCA主成分分析 -
辛茂得治: 主成分分析(Principal Component Analysis,PCA), 将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法.又称主分量分析. 在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息. 主成分分析首先是由K.皮尔森对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形.信息的大小通常用离差平方和或方差来衡量.

市北区18964922501: 主成分分析有什么用? -
辛茂得治:[答案] 主成分分析最主要的用途在于“降维”. 举个例子,你要做一项分析,选中了20个指标,你觉得都很重要,但是20个指标对于你的分析确实太过繁琐,这时候,你就可以采用主成分分析的方法进行降维. 20个指标之间会有这样那样的相互关系,相互...

市北区18964922501: 怎么解读SPSS做出的主成分分析结果 -
辛茂得治: 主要看1.方差解释表里的累积方差贡献率,以此确定主成分,一般都是>=85%. 2.主成分载荷矩阵. 你可以参考SPSS教材,里面有结果分析说明

市北区18964922501: 什么是主成分分析方法? -
辛茂得治: 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标. 在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术.它是一个线性变换.这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推.主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征.这是通过保留低阶主成分,忽略高阶主成分做到的.这样低阶成分往往能够保留住数据的最重要方面.但是,这也不是一定的,要视具体应用而定.

市北区18964922501: 总体的主成份分析? -
辛茂得治:[答案] 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标.在实际问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素.这些涉及的因素一般称为指标,在多元统计分析中也称为变量.因为...

市北区18964922501: 主成分分析,聚类分析,因子分析的基本思想以及他们各自的优缺点. -
辛茂得治:[答案] 主成分分析就是将多项指标转化为少数几项综合指标,用综合指标来解释多变量的方差- 协方差结构.综合指标即为主成分.所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关. 因子分析是研究如何以最少的信息丢失,将众多...

市北区18964922501: SPSS的主成分分析主要是解决什么问题? -
辛茂得治:[答案] spss的主成分分析主要应用在因子分析里,目的是将原来很多的因素,通过他们内在的相关分析,整合成新的一个或多个相对独立的综合因素,来代表原来散乱的因素.例如我们测量客户满意度,设计了10个题目,那数据收集完后,就可以通过因子...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网