多重共线性是什么意思?怎么判断多重共线性?

作者&投稿:戈强 (若有异议请与网页底部的电邮联系)
~

共线性是指信息具有重叠关系,比如X1为身高,X2为体重,二者具有一定的信息重叠,身高和体重都可以表示身体的轮廓情况。当共线性问题过于严重时,比如某两项之间相关系数大于0.8甚至0.9时,那么进行某些分析(尤其是回归分析,比如线性回归,二元logit回归等等各类回归研究方法时)时,会对模型带来影响,严重情况时会导致模型无法拟合出结果。因而应该重视共线性问题。

通常情况下,共线性问题的表现是两两项之间具有高度的相关关系,比如相关系数大于0.8。还有一种情况是绝对的共线性,即二者相关系数值为1,即信息具有绝对的重叠性,比如类别数据进行哑变量处理后,并没有少放一个参照项到模型中,即会导致模型出现异常等。

共线性问题分析的判断标准上,通常有两种,分别是Pearson相关系数和VIF法。二者的数学原理均是判断信息重叠情况,但二者出来分析出来的结论可能并不相同。如果是Pearson相关系数法,通常以其绝对值大于0.8作为标准,如果是VIF值法,通常以VIF值>10作为判断标准。

本文档出于演示需要,首先准备一份数据,共有10个X,1个Y,并且进行二元Logit回归。操作如下图所示:

第1次操作时,SPSSAU提示数据质量异常。猜测很可能有共线性问题等,但当前共有10个X和1个Y,具体共线性问题是什么并不知道,因而使用共线性分析。操作如下图所示:

最终共线性分析后得到下图:

图中使用红底色标识出共线性问题的项,从图中可以‘横向’看时,X2和X8与其它项出现相关系数绝对值为1,即绝对共线性问题,此两项一定需要从模型中移除出去。当然也可以‘纵向’看时,X1和X2与其它项出现相关系数绝对值为1即绝对共线性。至于移除X1和X8,也或者X1和X2,事实上两种处理均可。因为移除后就不会继续存在绝对共线性问题。

当然也可以查阅SPSSAU提供的智能分析文字,里面会有详细的分析说明,SPSSAU当前操作的智能分析建议如下:



多重共线性是指线性回归模型中的解释变量之间由于存在较精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

多重共线性诊断方法 
  

1、自变量相关系数矩阵R诊断法:

研究变量的两两相关分析,如果自变量间的相关系数值很大,则认为存在多重共线性。但无确定的标准判断相关系数的大小与共线性的关系。有时,相关系数值不大,也不能排除多重共线性的可能。

2、方差膨胀因子(the variance inflation factor,VIF)诊断法:

方差膨胀因子表达式为:VIFi=1/(1-R2i)。其中Ri为自变量xi对其余自变量作回归分析的复相关系数。当VIFi很大时,表明自变量间存在多重共线性。该诊断方法也存在临界值不易确定的问题,在应用时须慎重。

判断:VIFj>10时,说明自变量x与其余自变量之间存在严重的多重共线关系,这种多重共线性可能会过度地影响最小二乘估计值。
  

3、容忍值(Tolerance,简记为Tol)法:

容忍值是VIF的倒数,即Tol=1/VIF。其取值在0~1之间,Tol越接近1,说明自变量间的共线性越弱。

4、多元决定系数值诊断法:

假定多元回归模型p个自变量,其多元决定系数为R2y(X1,X2,…,Xp),分别构成不含其中某个自变量(Xi,i=1,2,…,p)的p个回归模型,并应用最小二乘法准则拟合回归方程,求出它们各自的决定系数R2i(i=1,2,…,p)。

如果其中较大的一个R2k与R2y很接近,就表明该自变量在模型中对多元决定系数的影响不大,说明该变量对Y总变异的解释能力可由其他自变量代替。很有可能是其他自变量的线性组合。因此,该自变量进入模型后就有可能引起多重共线性问题。

5、条件数与特征分析法:

在自变量的观测值构成的设计矩阵X中,求出变量相关系数R的特征值,如果某个特征值很小(如小于0.05 ),或所有特征值的倒数之和为自变量数目的5倍以上,表明自变量间存在多重共线性关系。

参考资料:

百度百科——共线性




多重共线性是什么意思?
多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在...

多重共线性是什麽意思啊?
共线性是指回归模型中的各个解释变量之间不存在线性关系,“多重共线性”一词常常用来表示解释变量之间具有较高的共线性程度,但又不是完全共线性的情形。多重共线性这种现象,在回归分析中普遍存在,具体表现如下:1、在某一时间段或某一个项目中,公司做的某一个决策,往往由很多小方案组成(比如同时...

多重共线性是什么意思?怎么判断多重共线性?
共线性是指信息具有重叠关系,比如X1为身高,X2为体重,二者具有一定的信息重叠,身高和体重都可以表示身体的轮廓情况。当共线性问题过于严重时,比如某两项之间相关系数大于0.8甚至0.9时,那么进行某些分析(尤其是回归分析,比如线性回归,二元logit回归等等各类回归研究方法时)时,会对模型带来影响,严...

多重共线性是什么意思?
完全共线性的例子:在一个计量经济学研究的过程中,解释变量之间存在函数关系,如果有四个解释变量x1、x2、x3、x3,其中x1=2x2,则说明存在多重共线性。检验多重共线性的方法 通常会在Eviews软件中进行检验。将数据录入软件中后,我们用相关系数矩阵或VIF法判断是否存在多重共线性。得到相关系数矩阵的操...

多重共线性是什么意思?
检验多重共线性的统计量有:简单相关系数矩阵、变量显著性与方程显著性综合。检验多重共线性此法简单易行;但要注意两变量的简单相关系数包含了其他变量的影响,并非它们真实的线性相关程度的反映,一般在0.8以上可初步判定它俩之间有线性相关。多重共线性的用途:多重共线性检验的目的是为了弄清"各个...

多重共线性的意思是什么啊?
尤其是对共线性较强的变量之间。岭回归估计是通过最小二乘法的改进允许回归系数的有偏估计量存在而补救多重共线性的方法,采用它可以通过允许小的误差而换取高于无偏估计量的精度, 因此它接近真实值的可能性较大。灵活运用岭回归法, 可以对分析各变量之间的作用和关系带来独特而有效的帮助。

多重共线性的VIF是什么意思?
多重共线性是指解释变量之间存在高度相关性的情况。在多重共线性诊断中,方差膨胀因子(Variance Inflation Factor,VIF)是一种常用的衡量解释变量间共线性程度的指标。方差膨胀因子计算基于回归模型,度量了给定其他解释变量的情况下一个解释变量方差增加的倍数。方差膨胀因子的计算公式为VIF = 1 \/ (1 -...

vif是什么意思?多重共线性怎么检验?
1、多重共线性是指自变量之间存在线性相关关系,即一个自变量可以是其他一个或几个自变量的线性组合。若存在多重共线性,计算自变量的偏回归系数时矩阵不可逆。2、其表现主要有:整个模型的方差分析结果与各个自变量的回归系数的检验结果不一致,专业判断有统计学意义的自变量检验结果却无意义,自变量的系数或...

VIF是什么意思?
SPSS中VIF是什么?SPSS中VIF是指多重共线性检验中的方差膨胀因子。它用来检验自变量之间是否存在高度相关性。如果VIF的值较高,表明自变量之间高度相关,存在多重共线性问题。因为多重共线性会导致回归系数不准确、显著性水平降低、模型不稳定等问题,所以必须对其进行检验。SPSS中如何进行VIF检验?在SPSS中...

vif是什么意思
VIF是方差膨胀因子的简称。VIF是统计学术语,特别是在多元线性回归模型中经常被使用。其主要功能是衡量一个变量与其他变量间存在的多重共线性程度。具体来说,如果一个变量的VIF值较高,说明该变量与其他自变量存在较高的相关性,这可能影响模型的稳定性和预测精度。在进行数据分析时,研究者通常会用VIF来...

临猗县13966199190: 求助如何判断存在多重共线性的变量 -
湛骆罗尼: 判断方法1:特征值,存在维度为3和4的值约等于0,说明存在比较严重的共线性. 判断方法2:条件索引列第3第4列大于10,可以说明存在比较严重的共线性. 判断方法3:比例方差内存在接近1的数(0.99),可以说明存在较严重的共线性

临猗县13966199190: 什么是多重共线性? -
湛骆罗尼: 您好! 经济学是非实验型科学,经济数据是被动生成和由从事经济研究的人员被动获得,而且经济数据的获得是不可控的,大多数情况下,人们并不能按照自己的设计与要求获得相应的经济数据.所以,为建模研究而取得的样本数据常常不能提供足够的信息,以至于导致多重共线性的产生. 多重共线性的概念 所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确.一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系. 抱歉,只能查到一点,希望能帮的到您...

临猗县13966199190: 多重共线性 -
湛骆罗尼: 所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确.一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系. 完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性. 2.多重共线性产生的原因 主要有3各方面: (1)经济变量相关的共同趋势 (2)滞后变量的引入 (3)样本资料的限制

临猗县13966199190: 如何判断一个多元回归分析模型中是否存在多重共线性问题 -
湛骆罗尼:[答案] 用eviews计算,看各参数的T检验及F检验是否通过,如果F检验通过,但是有两个以上T检验不通过,就有很大的可能是多重共线性了. 还有就是看模型中所用的变量之间会不会明显相关,就像,货币供应量和工资之类的. 可以尝试直接联立两个变量...

临猗县13966199190: 是否有完全的多重共线性 -
湛骆罗尼: 将所有回归中要用到的变量依次作为因变量、其他变量作为自变量进行回归分析,可以得到各个变量的膨胀系数VIF以及容忍度tolerance,如果容忍度越接近0,则共线性问题越严重,而VIF是越大共线性越严重,通常VIF小于5可以认为共线性不严重,宽泛一点的标准小于10即可.

临猗县13966199190: probit模型多重共线性怎么检验 -
湛骆罗尼: 在SPSS中有专门的选项的.例如在回归分析中,线性回归-统计量-有共线性诊断. 多重共线性:自变量间存在近似的线性关系,即某个自变量能近似的用其他自变量的线性函数来描述. 多重共线性的后果: 整个回归方程的统计检验Pa

临猗县13966199190: 在线性回归分析中如何解决多重共线性的问题 -
湛骆罗尼: 对多重共线性的两点认识: ①在实际中,多重共线性是一个程度问题而不是有无的问题,有意义的区分不在于有和无,而在于多重共线性的程度.②多重共线性是针对固定的解释变量而言,是一种样本的特征,而非总体的特征. 消除多重共线性的方法: 1.增加样本容量 2.利用先验信息改变 3.删除不必要的解释变量:参数的约束形式 4.其它方法:逐步回归法,岭回归(ridge regression),主成分分析(principal components ). 这些方法spss都可以做的,你在数据分析的子菜单下可以找到相应的做法. 删除不必要的方法的时候,最好使用一下逐步回归法,这样比较科学一点. 主成分分析的方法使用比较简单科学,本人介意用该方法.

临猗县13966199190: 多重共线性,是导致整个模型还是系数线性关系不显著呢? -
湛骆罗尼: 多重共线性的典型表现是线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确.由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系.主要产生原因是经济变量相关的共同趋势,滞后变量的引入,样本资料的限制. 判断是否存在多重共线性的方法有特征值,存在维度为3和4的值约等于0,说明存在比较严重的共线性.条件索引列第3第4列大于10,可以说明存在比较严重的共线性.比例方差内存在接近1的数,可以说明存在较严重的共线性.

临猗县13966199190: 如何判断一个二元回归分析模型中是否存在多重共线性问题 -
湛骆罗尼: 用eviews计算,看各参数的T检验及F检验是否通过,如果F检验通过,但是有两个以上T检验不通过,就有很大的可能是多重共线性了. 还有就是看模型中所用的变量之间会不会明显相关,就像,货币供应量和工资之类的. 可以尝试直接联立两个变量的方差,看变量间的R平方是不是很接近1,越接近1,说明多重共线性越明显. 希望对你有用

临猗县13966199190: 多元线性回归多重共线性检验及避免方法,简单点的 -
湛骆罗尼: 多重共线性指自变量问存在线性相关关系,即一个自变量可以用其他一个或几个自变量的线性表达式进行表示.若存在多重共线性,计算自变量的偏回归系数β时,矩阵不可逆,导致β存在无穷多个解或无解. 而在使用多元线性回归构建模型过程...

你可能想看的相关专题

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网