主成分分析法的应用分析

作者&投稿:脂锦 (若有异议请与网页底部的电邮联系)
主成分分析和聚类分析应用在哪些领域~

主成分分析法在过程中产生新变量,而聚类分析法在过程中没有产生新变量。
主成分分析法:一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。
聚类分析法:理想的多变量统计技术,主要有分层聚类法和迭代聚类法。是研究分类的一种多元统计方法。你现在有了每个样本的主成分分值,用这些分值,对这些样本进行分类。 就是说,每个样本现在有三个值了,就是三个主成分的值,现在要看看那些样本比较相似。


在社会调查中,对于同一个变量,研究者往往用多个不同的问题来测量一个人的意见。这些不同的问题构成了所谓的测度项,它们代表一个变量的不同方面。主成分分析法被用来对这些变量进行降维处理,使它们“浓缩”为一个变量,称为因子。
在用主成分分析法进行因子求解时,我们最多可以得到与测度项个数一样多的因子。如果保留所有的因子,就起不到降维的目的了。但是我们知道因子的大小排列,我们可以对它们进行舍取。哪有那么多小的因子需要舍弃呢?在一般的行为研究中,我们常常用到的判断方法有两个:特征根大于1法与碎石坡法。
因为因子中的信息可以用特征根来表示,所以我们有特征根大于1这个规则。如果一个因子的特征根大于1就保留,否则抛弃。这个规则,虽然简单易用,却只是一个经验法则(rule of thumb),没有明确的统计检验。不幸的是,统计检验的方法在实际中并不比这个经验法则更有效(Gorsuch, 1983)。所以这个经验法则至今仍是最常用的法则。作为一个经验法则,它不总是正确的。它会高估或者低估实际的因子个数。它的适用范围是20-40个的测度项,每个理论因子对应3-5个测度项,并且样本量是大的 ( 3100)。
碎石坡法是一种看图方法。如果我们以因子的次序为X轴、以特征根大小为Y轴,我们可以把特征根随因子的变化画在一个坐标上,因子特征根呈下降趋势。这个趋势线的头部快速下降,而尾部则变得平坦。从尾部开始逆向对尾部画一条回归线,远高于回归线的点代表主要的因子,回归线两旁的点代表次要因子。但是碎石坡法往往高估因子的个数。这种方法相对于第一种方法更不可靠,所以在实际研究中一般不用。
抛弃小因子、保留大因子之后,降维的目的就达到了。 在对社会调查数据进行分析时,除了把相关的问题综合成因子并保留大的因子,研究者往往还需要对因子与测度项之间的关系进行检验,以确保每一个主要的因子(主成分)对应于一组意义相关的测度项。为了更清楚的展现因子与测度项之间的关系,研究者需要进行因子旋转。常见的旋转方法是VARIMAX旋转。旋转之后,如果一个测度项与对应的因子的相关度很高(>0.5)就被认为是可以接受的。如果一个测度项与一个不对应的因子的相关度过高(>0.4),则是不可接受的,这样的测度项可能需要修改或淘汰。
用主成分分析法得到因子,并用因子旋转分析测度项与因子关系的过程往往被称为探索性因子分析。
在探索性因子分析被接受之后,研究者可以对这些因子之间的关系进行进一步测试,比如用结构方程分析来做假设检验。 1问题的提出主成分分析是一种降维的方法,便于分析问题,在诸多领域中都有广泛的应用。但有些教科书与论文使用主成分分析时,出现了一些错误与不足,不能解决实际问题。如一些多元统计分析的教材中,用协方差矩阵的主成分分析出现了如下错误与不足:①没有明确和判断该数据降维的条件是否成立。②主成分系数的平方和不为1。③没有明确和判断所用数据是否适合作单独的主成分分析。④选取的主成分对原始变量没有代表性。以下从相关性等理论与结果上依次解决上述问题,并给出相应建议。2数据在行为与心理研究中,常常要求分析某种身份的人的行为特征,如本例中的小学生的日常行为特征,从而根据这些特征引导小学生向更积极的行为态度发展。这里用文献[1]的数据见表1,其来自某课题组的调查结果。课题组对北方某小学480名5~6年级学生的日常行为进行调查,共调查了11项指标如下:S1~对老师提问的反应、S2~对班级事务的关心、S3~自习课上的表现、S4~对家庭作业的态度、S5~关心同学的程度、S6~对待劳动的态度、S7~学习上的特殊兴趣、S8~对待体育锻炼的态度、S9~在娱乐上的偏好、S10~解决问题的思考方式、S11~对未来的打算
  
主成分分析法和层次分析法异同
1.基于相关性分析的指标筛选原理
两个指标之间的相关系数,反映了两个指标之间的相关性[1]。相关系数越大,两个指标反映的信息相关性就越高[1]。而为了使评价指标体系简洁有效,就需要避免指标反映信息重复[1]。通过计算同一准则层中各个评价指标之间的相关系数,删除相关系数较大的指标,避免了评价指标所反映的信息重复[2]。通过相关性分析,简化了指标体系,保证了指标体系的简洁有效[2]。
2.基于主成分分析的指标筛选原理
(1)因子载荷的原理
通过对剩余多个指标进行主成分分析,得到每个指标的因子载荷。因子载荷的绝对值小于等于1,而绝对值越是趋向于1,指标对评价结果越重要[3]。
(2)基于主成分分析的指标筛选原理
因子载荷反映指标对评价结果的影响程度,因子载荷绝对值越大表示指标对评价结果越重要,越应该保留;反之,越应该删除。1通过对相关性分析筛选后的指标进行主成分分析,得到每个指标的因子载荷,从而删除因子载荷小的指标,保证筛选出重要的指标[2]。
3.相关性分析和主成分分析相同点
一是,基于相关性分析的指标筛选和基于主成分分析的指标筛选,均是在准则层内进行指标的筛选处理,准则层之间不进行筛选。这种做法的原因是,通过人为地划分不同准则层,反映评价事物不同层面的状况,避免误删反应信息不同的重要指标[2]。
二是,基于相关性分析的指标筛选和基于主成分分析的指标筛选的思路,均是筛选出少量具有代表性的指标[2]。
4.相关性分析和主成分分析不同点
一是,两次筛选的目的不同:基于相关性分析的指标筛选的目的是删除反应信息冗余的评价指标。基于主成分分析的指标筛选的目的是删除对评价结果影响较小的评价指标[2]。
二是,两次筛选的作用不同:基于相关性分析的指标筛选的作用是保证蹄选出的评价指标体系简洁明快。基于主成分分析的指标简选的目的是筛选出重要的指标[2]。
[1]迟国泰,曹婷婷,张昆.基于相关主成分分析的人的全面发展评价指标体系的构建[J].系统工
程理论与实践,2013,32(1):112-119.
[2]李鸿禧.基于相关主成分分析的港口物流评价研究[D].辽宁大连:大连理工大学,2013.
[3]孙慧,刘媛媛,张娜娜.基于主成分分析的煤炭产业竞争力实证研究[J].资源与产业,2012,14(1):145-149.




主成分计算权重全步骤梳理!
一、研究场景 主成分分析用于对数据信息进行浓缩,比如总共有20个指标值,是否可以将此20项浓缩成4个概括性指标。除此之外,主成分分析可用于权重计算和综合竞争力研究。即主成分分共有三个实际应用场景:二、SPSSAU操作 SPSSAU左侧仪表盘“进阶方法”→“主成分”;三、SPSSAU一般步骤 第一步:判断是否...

什么是主成分分析,如何进行检验?
如果原始变量之间的线性相关程度很小, 它们之间不存在简化的数据结构, 这时进行主成分分析实际是没有意义的。所以, 应用主成分分析时, 首先要对其适用性进行统计检验。主成分分析检验方法有巴特莱特球性检验,KMO检验等,本文主要介绍KMO检验。

spss主成分分析的原理是什么?
主成分分析用于对数据信息进行浓缩,比如总共有20个指标值,是否可以将此20项浓缩成4个概括性指标。除此之外,主成分分析可用于权重计算和综合竞争力研究。即主成分分共有三个实际应用场景:信息浓缩:将多个分析项浓缩成几个关键概括性指标;权重计算:利用方差解释率值计算各概括性指标的权重;综合竞争力...

大学生学业成绩及综合素质的统计分析
本文提出基于学分制的学生学业成绩评价模型———学分权平均标准成绩,并通过实例分析比较了这种方法比学分权平均原始成绩方法的科学性、合理性。在综合素质评价方面,本论文采用蜘蛛网评价法,有利于向用人单位提供各方面信息,了解学生的综合情况。 【关键词】学分制主成分分析法 蜘蛛网图评价法 专业素质 综合素质 [...

主成分分析的目的
5、用矩阵P对原始数据进行线性变换,得到新的数据矩阵Z,每一列就是一个主成分。6、根据主成分的方差解释比例、累积方差解释比例、碎石图等指标,确定最终保留的主成分个数。7、对保留的主成分进行命名、解释和应用,如权重计算、综合评价等。主成分分析的优缺点:优点:1、数据降维 PCA能够将高维数据...

金属化学成分检测有哪些方法
化学成分可以通过化学的、物理的多种方法来分析鉴定,目前应用最广的是化学分析法和光谱分析法,此外,设备简单、鉴定速度快的火花鉴定法,也是对钢铁成分鉴定的一种实用的简易方法。 化学分析法:根据化学反应来确定金属的组成成分,这种方法统称为化学分析法。化学分析法分为定性分析和定量分析两种。通过...

矿物成分分析方法
矿物化学成分的分析方法有常规化学分析,电子探针分析,原子吸收光谱、激光光谱、X射线荧光光谱,等离子光谱和极谱分析,中子活化分析及等离子质谱分析等。 在选择成分分析方法时,应注意检测下限和精密度。 检测下限(又称相对灵敏度)指分析方法在某一确定条件下能够可靠地检测出样品中元素的最低含量。显然,检测下限与不同的...

如何用主成分分析法确定指标权重?
在SPSS中,主成分分析是通过设置因子分析中的抽取方法实现的,如果设置的抽取方法是主成分,那么计算的就是主成分得分,另外,因子分析和主成分分析尽管原理不同,但是两者综合得分的计算方法是一致的。层次分析法根据问题的性质和要达到的总目标,将问题分解为不同的组成因素,并按照因素间的相互关联影响...

主成分分析法有什么缺点?
主成分分析法的缺点: 1、在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。 2、主成分的解释其含义一般多少带有点模糊...

人体成分分析仪的基本介绍
人体成分分析仪具有广泛的应用前景,可应用与内科、外科、儿科、产科、重症监护、康复、运动医学、和美容。在健康营养学中,被认为是健康产业划时代的成果:减肥健康咨询管理系统,一位优秀的健康顾问,它为每个测试者提供独立的健康分析数据。 人体成份分析仪统计法,测量人体成分:体重、肥胖度判断、身体...

冀州市13690962799: 主成分分析有什么用? -
狐娅单唾:[答案] 主成分分析最主要的用途在于“降维”. 举个例子,你要做一项分析,选中了20个指标,你觉得都很重要,但是20个指标对于你的分析确实太过繁琐,这时候,你就可以采用主成分分析的方法进行降维. 20个指标之间会有这样那样的相互关系,相互...

冀州市13690962799: 主成分分析应用领域及如何应用 -
狐娅单唾: http://www.antpedia.com/?uid-6771-action-viewspace-itemid-16924 应用主成分分析SPME/GC-MS法鉴别人体气味的研究

冀州市13690962799: 如何有效利用主成分分析进行综合评价 -
狐娅单唾: 主成分分析方法是一种将多个指标化为少数几个不相关的综合指标(即主成分)的多元统计分析方法.由于其具有消除各指标不同量纲的影响,以及消除指标间相关性所带来的信息重叠等优点,近几年,该方法在社会经济、管理、自然科学等众...

冀州市13690962799: 主成分分析,聚类分析,因子分析的基本思想以及他们各自的优缺点. -
狐娅单唾:[答案] 主成分分析就是将多项指标转化为少数几项综合指标,用综合指标来解释多变量的方差- 协方差结构.综合指标即为主成分.所得出的少数几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关. 因子分析是研究如何以最少的信息丢失,将众多...

冀州市13690962799: 主成分分析在数学建模中的应用及详细的步骤 -
狐娅单唾: 分析步骤: 1. 数据标准化;求相关系数矩阵; 2. 一系列正交变换,使非对角线上的数置0,加到主对角上; 3. 得特征根系(即相应那个主成分引起变异的方差),并按照从大到小的顺序把特征根排列; 4. 求各个特征根对应的特征向量; 5. ...

冀州市13690962799: SPSS的主成分分析主要是解决什么问题? -
狐娅单唾:[答案] spss的主成分分析主要应用在因子分析里,目的是将原来很多的因素,通过他们内在的相关分析,整合成新的一个或多个相对独立的综合因素,来代表原来散乱的因素.例如我们测量客户满意度,设计了10个题目,那数据收集完后,就可以通过因子...

冀州市13690962799: 主成分回归分析可应用于哪些具体的方面?还有主成分回归分析与多元线性回归的区别?
狐娅单唾: 主成分回归跟多元线性回归没有本质区别的,主成分回归用的还是回归分析. 所谓的主成分回归的意思是,当自变量非常多,就像一个满意度调查的问卷,其中涉及满意度的各项指标的问题非常多,可能有30个或50个,这个时候就不适合直接用回归把这么多问题同时纳入自变量.而是应该首先对这些问题进行主成分分析,找出能够代表这么多问题的几个主要的内在维度,然后用这几个维度作为自变量进行回归分析. 另外,当自变量之间存在共线性,比如有几个自变量都是反映的一个问题,此时就需要用主成分分析,先将这些自变量浓缩,便于计算. 长期兼职论文数据分析、问卷调查数据分析、报告撰写等qq94168195

冀州市13690962799: 主成分分析和聚类分析应用在哪些领域 -
狐娅单唾: 主成分分析法在过程中产生新变量,而聚类分析法在过程中没有产生新变量. 主成分分析法:一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列. 聚类分析法:理想的多变量统计技术,主要有分层聚类法和迭代聚类法.是研究分类的一种多元统计方法.你现在有了每个样本的主成分分值,用这些分值,对这些样本进行分类. 就是说,每个样本现在有三个值了,就是三个主成分的值,现在要看看那些样本比较相似.

冀州市13690962799: 主成分分析和因子分析的异同及应用 -
狐娅单唾: 第一:两种的函数构成相反,因子分析在于发现潜在的影响因素,是可观测自变量之外潜在的因素,主成分则是自变量的系数聚合; 第二:因子分析给出zhidao的重要结果又两个,第一个是因子的命名,也就是潜在的因素,需要命名.第二个是每个因子所占的权重,附加的可以得到每个变量所占的权重.而主成分分析则主要是综合得分和得分的比较. 第三:如果仅从因子综合得分和主成分得分用于综合评价的话,没什么大地区别,计算出各自得分后进行大小排序,比较,就是结果了.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网