多重共线性介绍

作者&投稿:延衬 (若有异议请与网页底部的电邮联系)
什么是多重共线性~

多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。
多重共线性产生的原因主要有3各方面:
1、经济变量相关的共同趋势。
2、滞后变量的引入。
3、样本资料的限制。

多重共线性的主要影响:
完全共线性下参数估计量不存在;近似共线性下OLS估计量非有效。
多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)。
参数估计量经济含义不合理;变量的显着性检验失去意义,可能将重要的解释变量排除在模型之外。
模型的预测功能失效。变大的方差容易使区间预测的“区间”变大,使预测失去意义。

多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。
一般来说,由于经济数据的限制使得模型设计不当,导致设计矩阵中解释变量间存在普遍的相关关系。完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性
产生原因
1、经济变量相关的共同趋势
2、滞后变量的引入
3、样本资料的限制

扩展资料
影响
1、完全共线性下参数估计量不存在
2、近似共线性下OLS估计量非有效
多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)如果方差膨胀因子值越大,说明共线性越强。相反 因为,容许度是方差膨胀因子的倒数,所以,容许度越小,共线性越强。
解决方法
1、排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用。
2、差分法
时间序列数据、线性模型:将原模型变换为差分模型。
3、减小参数估计量的方差:岭回归法(Ridge Regression)。
参考资料来源:百度百科——多重共线性

多重共线性,是指线性回归模型中的若干解释变量或全部解释变量的样本观测值之间具有某种线性关系。

(1)多重共线性的产生与后果

回归模型中存在多重共线性问题,将给模型的估计带来一系列后果。如果解释变量之间存在完全的多重共线性,那么无法估计模型参数,参数估计的方差将为无穷大,这将使回归模型的普通最小二乘法估计完全失效;对于不完全多重共线性可能产生的后果主要有:①各个解释变量对被解释变量的影响很难精确鉴别;②模型回归参数估计量的方差会很大,这将使得进行显著性检验时认为回归参数的值与零无显著差异。从而导致将相应的解释变量从模型中剔除,但这并不是因为该解释变量对被解释变量无影响作用,而只是由于样本数据不适于精确区分各解释变量的单独影响;③模型参数的估计量对删除或增加少量的观测值以及删除一个不显著的解释变量都可能非常敏感。

(2)多重共线性的检验

对于一个给定的线性回归模型和一组样本数据,其解释变量的样本数据中是否存在多重共线性以及共线性的严重程度有多大,这个问题显然需要用一定的方法来进行检验。实践中,常用的检验方法主要有简单相关系数检验法、容限度(ToLerance)法、方差扩大因子(VIF,VarianceInfLationFactor)法、特征值和条件指数(Eigen-valueandConditionIndexes)法、Theil多重共线性效应系数法等。本文采用的是简单相关系数检验法。

(3)多重共线性的处理

对于给定的样本数据,如果其存在较严重的多重共线性,那么就必须采取一些措施进行处理,以减轻其不良影响。常用的处理方法有删除不重要的解释变量、追加样本信息、利用非样本先验信息、改变解释变量形式、逐步回归法等。本文采用的是删除不重要的解释变量的处理方法。

依据简相关关系的多重共线性分析结果,本研究选择含水率、TOC和粘土矿物含量来作为分析影响土壤理化参数与有机氯农药之间的相关关系的主要因子。




多重共线性的实质是什么为什么会出现多重共线性
多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。所谓多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。一般来说,由于经济数据的限制使得模...

多重共线性会给回归分析带来什么影响
多重共线性就是说自变量间存在某种函数关系,会造成分析误差,使其对自变量效应的分析不准确。如果你的两个自变量间(X1和X2)存在函数关系,那么X1改变一个单位时,X2也会相应地改变,此时你无法做到固定其他条件,单独考查X1对因变量Y的作用,你所观察到的X1的效应总是混杂了X2的作用,这就造成了分...

多重共线性介绍
多重共线性,是指线性回归模型中的若干解释变量或全部解释变量的样本观测值之间具有某种线性关系。(1)多重共线性的产生与后果 回归模型中存在多重共线性问题,将给模型的估计带来一系列后果。如果解释变量之间存在完全的多重共线性,那么无法估计模型参数,参数估计的方差将为无穷大,这将使回归模型的普通...

多重共线性是什么意思?怎么判断多重共线性?
共线性是指信息具有重叠关系,比如X1为身高,X2为体重,二者具有一定的信息重叠,身高和体重都可以表示身体的轮廓情况。当共线性问题过于严重时,比如某两项之间相关系数大于0.8甚至0.9时,那么进行某些分析(尤其是回归分析,比如线性回归,二元logit回归等等各类回归研究方法时)时,会对模型带来影响,严...

什么是多重共线性?有哪些作用?
多重共线性是指一个或多个自变量之间存在高度相关性的情况。在多元回归分析中,如果两个或更多的自变量之间存在较高的相关系数(通常大于0.8),那么就会出现多重共线性问题。多重共线性的存在会对回归模型产生以下影响:1.参数估计不稳定:当存在多重共线性时,回归系数的估计值可能会变得不稳定,即...

多重共线性的含义是什么?
共线性是指回归模型中的各个解释变量之间不存在线性关系,“多重共线性”一词常常用来表示解释变量之间具有较高的共线性程度,但又不是完全共线性的情形。多重共线性这种现象,在回归分析中普遍存在,具体表现如下:1、在某一时间段或某一个项目中,公司做的某一个决策,往往由很多小方案组成(比如同时...

什么是多重共线性?
多重共线性会使线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。具体影响如下:1、参数估计量经济含义不合理;2、变量的显著性检验失去意义,可能将重要的解释变量排除在模型之外;3、模型的预测功能失效。变大的方差容易使区间预测的“区间”变大,使预测...

什么是多重共线性现象?如何处理它?
多重共线性是一个普遍存在的现象,它不会导致系数有偏,但会影响估计的效率,表现在显著性的降低上。如果多重共线性对结果的显著性影响不大,可以不予处理。多重共线性实质上是数据问题,即高度相关的变量之间具体观测值未必存在高度相关性,反之亦然。因此,可以通过扩大样本容量、增加观测值、利用不同...

vif是什么意思?多重共线性怎么检验?
1、多重共线性是指自变量之间存在线性相关关系,即一个自变量可以是其他一个或几个自变量的线性组合。若存在多重共线性,计算自变量的偏回归系数时矩阵不可逆。2、其表现主要有:整个模型的方差分析结果与各个自变量的回归系数的检验结果不一致,专业判断有统计学意义的自变量检验结果却无意义,自变量的系数或...

多重共线性的典型表现是什么?判断是否存在多重共线性的方法有哪些_百度...
2.常用的评价指标有两个:(1)容许度和膨胀因子(VIF)。容许度=1-Rj^2。其中的R是第j个自变量与其余变量进行回归时的判定系数。容许度越接近1,表示多重共线性越弱。膨胀因子:膨胀因子是容许度的倒数。膨胀因子越接近1(膨胀因子理论最小值是1),表示解释变量之间的多重共线性越弱,通常膨胀...

英吉沙县15173472393: 多重共线性(经济学术语) - 搜狗百科
袁狮思密: 多重共线性检验,最好的软件是SPSS,它会自动给出全部共线性检验指标,如图: 后一个是最主要的VIF(方差膨胀因子)检验,它大于5,有共线.大于10,共线严重. 这个表给出了更多的共线性检验方法,比如第3列条件索引(其实是条件指数),它大于10共线,大于30严重共线.

英吉沙县15173472393: 请问在经济数学中 singular matrix是什么意思,谢谢
袁狮思密: singular matrix是奇异矩阵的意思,出现这种情况主要还是由于经济变量之间存在多重共线性.

英吉沙县15173472393: 预测变量之间存在部分属性存在线性相关会带来一些什么问?预测变量之
袁狮思密: 多个自变量线性相关,多重共线性啊,结果应该就这几个: 1、部分检验失效,比如变量的显著性检验 2、得到的参数估计值失效 3、模型的预测失效 以上的问题都是相关联的,一步错步步错! 第一步最好做相关性检验,看检验结果进行分析和处理,比如相关性分析,vif检验等. 如果实在是存在线性关联比较大,可以排除相应变量或者增加样本量到足够大 仅供参考

英吉沙县15173472393: 如何操作自变量之间的相关性检验
袁狮思密: 自变量相关系数过高(大于0.9或者0.8)的话的确应该引起注意,很可能存在多重共线性,你可以利用回归分析里面提供的共线性诊断来印证一下.对于多重共线性,很多人会采取中心化的方式,说那样可以减轻多重共线性,就是把每列自变量减去各自的均值,这个方法最常见不过实际操作中感觉没很大用,你可以自己试试.类似的,还有一些数据变换方法如对数变换之类的,也有人用.再一个就是可以增大样本量,因为有的研究者指出样本量小是造成多重共线性的原因之一还有就是可以试试删除一些极端值、异常值再看看,这个方法就不是那么对症下药,但也是对数据进行了整理,可以试试.

英吉沙县15173472393: 简述模型设定背后的经济学原理 -
袁狮思密: #计量经济学的定义计量经济学是以一定的经济理论和统计资料为基础,运用数学、统计学方法与电脑技术,以建立经济计量模型为主要手段,定量分析研究具有随机性特性的经济变量关系.主要内容包括理论计量经济学和应用经济计量学.#计...

英吉沙县15173472393: 什么是方差膨胀因子vif
袁狮思密: 方差膨胀因子vif是指解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比.VIF的取值大于1.VIF值越接近于1,多重共线性越轻,反之越重.当多重共线性严重时,应采取适当的方法进行调整.容忍度的值界于0至1之间,当容忍度值较小时,表示此自变量与其他自变量之间存在共线性.容忍度这个变量回归系数的估计值不够稳定,则回归系数的计算值也会有很大误差.方差膨胀系数是容忍度的倒数,VIF越大,表示自变量的容忍度越小,越有共线性问题.

英吉沙县15173472393: OLS模型适合用来做哪些分析? -
袁狮思密: OLS(Ordinary Least Squares)模型是回归分析中一种常用的参数估计方法,它通过最小化观测值与模型预测值之间的残差平方和来估计模型的系数.然而,在某些情况下,OLS模型可能失去意义或不适用.以下是导致OLS模型没有意义的几种情...

你可能想看的相关专题

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网