怎么检验变量之间的多重共线性
在SPSS中有专门的选项的。例如在回归分析中,线性回归-统计量-有共线性诊断。
多重共线性:自变量间存在近似的线性关系,即某个自变量能近似的用其他自变量的线性函数来描述。
多重共线性的后果:
整个回归方程的统计检验Pa,但所有偏回归系数的检验均无统计学意义。
偏回归系数的估计值大小明显与常识不符,甚至连符号都是相反的。比如拟合结果表明累计吸烟量越多,个体的寿命就越长。
在专业知识上可以肯定对应变量有影响的因素,在多元回归分析中却Pa,不能纳入方程
去掉一两个变量或记录,方程的回归系数值发生剧烈抖动,非常不稳定。
多重共线性的确认:
做出自变量间的相关系数矩阵:如果相关系数超过0.9的变量在分析时将会存在共线性问题。在0.8以上可能会有问题。但这种方法只能对共线性作初步的判断,并不全面。
容忍度(Tolerance):有 Norusis 提出,即以每个自变量作为应变量对其他自变量进行回归分析时得到的残差比例,大小用1减决定系数来表示。该指标越小,则说明该自变量被其余变量预测的越精确,共线性可能就越严重。陈希孺等根据经验得出:如果某个自变量的容忍度小于0.1,则可能存在共线性问题。
方差膨胀因子(Variance inflation factor, VIF): 由Marquardt于1960年提出,实际上就是容忍度的倒数。
特征根(Eigenvalue):该方法实际上就是对自变量进行主成分分析,如果相当多维度的特征根等于0,则可能有比较严重的共线性。
条件指数(Condition Idex):由Stewart等提出,当某些维度的该指标数值大于30时,则能存在共线性。
多重共线性的对策:
增大样本量,可部分的解决共线性问题
采用多种自变量筛选方法相结合的方式,建立一个***的逐步回归方程。
从专业的角度加以判断,人为的去除在专业上比较次要的,或者缺失值比较多,测量误差比较大的共线性因子。
进行主成分分析,用提取的因子代替原变量进行回归分析。
进行岭回归分析,它可以有效的解决多重共线性问题。
进行通径分析(Path Analysis),它可以对应自变量间的关系加以精细的刻画。Spss可以进行比较基本的通径分析,但复杂的模型需要使用SPSS公司的另外一个软件AMOS来进行。
检验多重共线性的方法
检验多重共线性的方法如下:
1、简单相关系数检验法
proc corr data=abc;var x1-x4;run;
2、方差扩大因子法
proc reg data=abc;model y=x1-x4/vif;run;
3、直观分析法(略)
4、逐步回归检测法
这在SAS中有多重筛选解释变量的方法:forward、backword、stepwise、maxr、minr、rsquare,主要采用stepwise
proc reg data=abc;model y=x1-x4/selection=stepwise sle=0.05 sls=0.10;run; quit;
5、特征值和病态指数
proc reg data=abc;model y=x1-x4/collin;run;
三、多重共线性的补救措施
1、提出变量法(根据前面的检测剔除掉vif值大的变量……略)
2、增大样本容量(略)
3、变换模型形式
常使用变量的差分方式,一阶差分形式如下:
data abc;set abc;x1lag1=lag(x1);x2lag1=lag(x2);x3lag1=lag(x3);x4lag1=lag(x4);ylag1=lag(y);
if nmiss(x1lag1,x2lag1,x3lag1,x4lag1,ylag1)0 then delete;dx1=x1-x1lag1;dx2=x1-x2lag1;dx3=x1-x3lag1;dx4=x1-x4lag1;dy=x1-ylag1;run;proc reg data=abc;model y=x1-x4;run;quit;
[转] 如何用SPSS检验多重共线性
1、用SPSS打开统计表以后,按照分析→回归→线性的顺序进行点击。
2、下一步会弹出一个新的对话框,需要将因变量和自变量放入其中。
3、这个时候在统计量窗口勾选共线性诊断这一项,如果没问题就确定继续。
4、这样一来等得到图示的相关结果以后,即可检验多重共线性了。
计量经济学中多重共线性的检验方法有哪些
1、简单相关系数矩阵法(辅助手段)
此法简单易行;但要注意两变量的简单相关系数包含了其他变量的影响,并非它们真实的线性相关程度的反映,一般在0.8以上可初步判定它俩之间有线性相关。
2、变量显著性与方程显著性综合判断
(修正)可决系数大,F值显著大于临界值,而值不显著;那么可认为存在多重共线性。
3、辅助回归
将每个解释变量对其余变量回归,若某个回归方程显著成立,则该解释变量和其余变量有多重共线性。
(4)方差扩大(膨胀)因子法
(5)直观判断法
增加或者减少一个解释变量,或者改变一个观测值时,回归参数发生较大变化。重要解释变量没有通过t检验。有些解释变量的回归系数符号与定性分析的相反。
扩展资料:
解决方法
(1)、排除引起共线性的变量
找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用。
(2)、差分法
时间序列数据、线性模型:将原模型变换为差分模型。
(3)、减小参数估计量的方差:岭回归法(Ridge Regression)。
参考资料:百度百科-多重共线性
eviews多重共线性检验步骤
通过检验x1 x2 x3 之间的相关系数r,若任意两者之间接近1,则说明二者之间存在相关性,即存在多重共线性。
在输入好数据的基除上,可见x2与x3之间的r=0.785534,很接近1,所以x2、x3之间存在共线性,即存在多重共线性问题。
通常,如果出现R^2和F值都很大,而t值很小情况,则说明存在多重共线性
扩展资料
补充:
步骤与OLS检验相同,都是通过Quick--Estimate Equation,在对话框中输入Y C X1 X2 X3即可。
解释变量之间存在高度线性相关性。尽管方程整体线性回归拟合较好,但X1 X2 X3 X7变量的参数t值并不显著, X3 X6 系数的符号与经济意义相悖。表明模型确实存在严重的.多重共线性。
总结:
1、正确使用EVIEWS。
2、能根据计算结果进行多重共线性检验和出现多重共线性时的补救。
3、数据为demo data2。
多重共线性的检验方法
,出现了相关系数与回归方程系数符号相反的问题,经过研究,确认是多重共线性问题并探索了解决方法。
在此将多重共线性的相关知识整理如下。
解释变量理论上的高度相关与观测值高度相关没有必然关系,有可能两个解释变量理论上高度相关,但观测值未必高度相关,反之亦然。所以多重共线性本质上是数据问题。
造成多重共线性的原因有一下几种:
1、解释变量都享有共同的时间趋势;
2、一个解释变量是另一个的滞后,二者往往遵循一个趋势;
3、由于数据收集的基础不够宽,某些解释变量可能会一起变动;
4、某些解释变量间存在某种近似的线性关系;
判别:
1、发现系数估计值的符号不对;
2、某些重要的解释变量t值低,而R方不低
3、当一不太重要的解释变量被删除后,回归结果显著变化;
检验;
1、相关性分析,相关系数高于0.8,表明存在多重共线性;但相关系数低,并不能表示不存在多重共线性;
2、vif检验;
3、条件系数检验;
解决方法:
1、增加数据;
2、对模型施加某些约束条件;
3、删除一个或几个共线变量;
4、将模型适当变形;
5、主成分回归
处理多重共线性的原则:
1、 多重共线性是普遍存在的,轻微的多重共线性问题可不采取措施;
2、 严重的多重共线性问题,一般可根据经验或通过分析回归结果发现。如影响系数符号,重要的解释变量t值很低。要根据不同情况采取必要措施。
3、 如果模型仅用于预测,则只要拟合程度好,可不处理多重共线性问题,存在多重共线性的模型用于预测时,往往不影响预测结果;
关于多重共线性检验和多重共线性检验方法的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。