日历
网志分类
· 所有网志
· 传播理论
· 新媒体技术
· 研究方法
· 统计分析
· SPSS Syntax
· 论文写作
· 讲习班事务
· 杂项·家庭作业·数据
· 留学问答
· 未分类
站内搜索
友情链接
· 我的歪酷
· 竹家庄blogspot版(2009)
· 竹家庄MSN版(2007-08)
· 自学资源链接
· 家庭作业
你从哪里来
Locations of visitors to this page
你从哪里来之二

订阅 RSS

0267563

歪酷博客

竹家庄


« 上一篇: 解释变量关系时必须考虑的四个问题 下一篇: 因子分析中的人为因素 »
庄主 @ 2006-04-03 11:13

问(小马 @ 2006-03-30):关于自变量独立贡献的又一疑问。最近阅读文献时,发现有的研究者在确定自变量的独立贡献时仅仅是计算当这个自变量引入时决定系数增加了多少,这种增加是否显著。这种方法和计算semipartial correlation有什么区别呢?这两种方法效果是否等同?

答:前者一般叫hierarchical regression (HR回归)中的incremental change in R2 (ΔR2),与 semipartial R2(SPR2)的异同取决于自变量进入回归模型的方式。假定有如下回归模型:

Y = b0 + b1X1 + b2X2 + b3X3,

如果先放入X1,得到R21,再放入X2,得到R22和ΔR22(= R22 - R21),最后放入X3,得到R23和ΔR23= R23 - R22。这里的ΔR23与SPR23完全一样;但ΔR22与SPR22不一样(ΔR22大于SPR22)(请试一下),因为ΔR22包含了由于X3与X2的相关关系而对Y的影响(注意:这时X3还没有进入回归模型而被控制)。也就是说,在做HR回归时,只有最后一个ΔR2是准确的,先前进入的ΔR2都含有部分水平。我历来不提倡HR回归、而提倡One-less回归。如要检验上述模型,需要运算四个回归方程:

Y = b0 + b1X1 + b2X2 + b3X3,       【方程0】
Y = b0 + b2X2 + b3X3,                    【方程1】
Y = b0 + b1X1 + b3X3,                    【方程2】
Y = b0 + b1X1 + b2X2                 【方程3】

从而分别得到R20、R21、R22和R23。然后从R20中分别减去R21、R22和R23而得到ΔR21、ΔR22和ΔR23。这时的ΔR21、ΔR22和ΔR23就与SPR21、SPR22和SPR23完全相同(不信也试一下)。如你能理解其中道理,那就说明你基本理解回归分析了。

当然,在我们大众传播研究中,HR回归是很流行的。原因可能起源30年前我们学科的一位大师开始使用这种方法,如先放入个人背景变量、再放进媒体使用变量、最后放入态度变量,从而分解出这三组变量的影响。这种做法的理论根据是按照这三组变量发生的时间次序,当然有其道理,所以广为接受。尤其是该老师教的学生众多,学生的学生更多,代代相传,就成了我们学科的主流做法。我对该大师素来敬仰(当年差一点转投他门下)、但对这种方法却一直不敢苟同,因为如上所说,先进入回归模型的变量的影响被扩大、后进入的变量影响被缩小。

好了,又一段竹家庄的一面之词,也算是给大家多一种选择。



最新评论


小马

2006-04-03 18:46

可否这样理解?
祝老师:
semipartial correlation 是对自变量贡献的一种相对保守的估计?或者说这种方法才是对其真正贡献的估计?



吉祥宝贝

2006-04-03 19:56

庄主,偶接着“拿因子分析说事”。(1)看了几篇因子分析的文献,怎么感觉统计分析的人为因素太大?一作者声明遵循了选择因子的原则(如卡方/自由度=(2,5),结果是卡方/自由度=7,自主决定因子的时候都又改口说其他指标尚可,该指标留下,真是奇怪啊。
(2)EFA与SEM在验证指标的效度上后者是否更为精确和全面?



吉祥宝贝

2006-04-03 20:05

错误更正,上述EFA应为CFA:验证性因子分析:Confirmatory Factor Analysis。



CN

2006-04-03 23:07 网址: http://www.blogcn.com/user18/robertgao/index.html

已知目前工资Y与工作年限X1、起点工资X2与前期工作时间X3的回归方程如下。(One-less回归)
Y =-10266.62+ 173.20X1 + 1.92X2 -22.50X3 ,R20=.804,SPR1=.102,SPR2=.887,SPR3=-.138
Y = 3850.718 + .886X2 -.137X3, R21=.79
Y = 24332.657+.084X1 -.098X3, R22=.017
Y = -12120.8 + .102X1 + .882X2, R23=.785
ΔR21= 0.011,ΔR22=0.787,ΔR23=0.019

由上可知,工作年限可以独自解释目前工资水平的1%,起点工资可以独自解释目前工资水平的78.7%,前期工作时间可以独自解释目前工资水平的1.9%.

按照HR回归的方式,先放入X1,得到R21=0.007,再放入X2,得到R22=0.785和ΔR22(= R22 - R21=0.778),最后放入X3,得到R23=0.804和ΔR23(= R23 - R22=0.019)。验证了ΔR23=SPR23;但怎么我得出R22=0.785,ΔR2 =0.778  小于SPR22=0.787。也就是说,放入两个自变量后的决定系数还小于单独一个变量的解释水平。这很奇怪,难道工作年限起了干扰作用吗?



CN

2006-04-04 20:45

忙活了半夜一头雾水。今天重新做了几遍(汗,很象家庭作业抄写课文啊~),报告新发现:HR回归放入工作年限X1的回归方程不显著,方程是不成立的。先放入其他两个变量都不会出现异常。



jinjb

2006-04-14 10:14

祝老师总是能把问题讲得非常的清楚!竹家庄博客的确是武汉班的继续,起着一种“清道夫”式的作用——传道解惑。



祝迎春

2006-05-11 16:48

在心理学进取之路论坛有这个的详细解释甚至spss操作步骤,呵呵。最近国内心理学的用hierarchical regression (分层线性回归)比较多。不过我们有结构方程阿 ,更好啊
祝老师认为呢?你有该大师的原始论文吗?给我一个学习,谢谢。我也姓祝哦^.^



庄主

2006-05-12 11:08

我还没有时间去核实,但估计你说的是“hierarchical linear model” (HLM),是多层面分析(multilevel analysis)中的一种。多层面与我上面说的HR(其实是分段输入而已,这里用"hierarchical"是不确切的)是两回事,前者涉及数据来自个体及其团体(所以叫”多层“),后者数据是同一层面只是变量之间先后进入回归而已。

除了HLM以外,GLM、SEM(和其它一些方法)都可以用来解决多层面问题。多层面分析是90年代开始流行的工具(对传播学来说则还是很陌生的),SEM是80年代开始流行的,而HR则是70年代时候的一种思想。古典的不一定不好,但HR则属于当时对correlated errors认识不足时的产物。

至于具体人名,我不便直点。你在900916中用"stepwise regression"+"media effects"之类的词,应该可以搜到。



池中鱼

2007-12-18 18:21 匿名 219.239.*.*

请庄主讲一下Suppressor Variables吧


评论 / 个人网页 / 扔小纸条
* 昵称

已经注册过? 请登录

新用户请先注册 以便能显示头像及追踪评论回复

Email
网址
* 评论
表情
 


 

分类小组论坛
杂谈 , 娱乐、八卦 , 文学、艺术 , 体育 , 旅游、同城 , 象牙塔 , 情感 , 时尚、生活 , 星座 , 科技

请注意遵守中华人民共和国法律法规, 如威胁到本站生存, 将依法向有关部门报告, 同时本站的相关记录可能成为对您不利的证据.

相关法律法规
全国人大常委会关于维护互联网安全的决定
中华人民共和国计算机信息系统安全保护条例
中华人民共和国计算机信息网络国际联网管理暂行规定
计算机信息网络国际联网安全保护管理办法
计算机信息系统国际联网保密管理规定