日历
网志分类
· 所有网志
· 传播理论
· 新媒体技术
· 研究方法
· 统计分析
· SPSS Syntax
· 论文写作
· 讲习班事务
· 杂项·家庭作业·数据
· 留学问答
· 未分类
站内搜索
友情链接
· 我的歪酷
· 竹家庄blogspot版(2009)
· 竹家庄MSN版(2007-08)
· 自学资源链接
· 家庭作业
你从哪里来
Locations of visitors to this page
你从哪里来之二

订阅 RSS

0213979

歪酷博客

竹家庄


« 上一篇: 如何处理并列排序 (tied ranks) 下一篇: 我合格吗? »
庄主 @ 2006-03-13 17:46

问 (小马 @ 2006-03-10): 请问在社会科学的研究中,多元回归的决定系数多大是可以接受的?这个研究的目的是,要在进入方程的自变量中找出几个作为预测变量。

答:这是一个非常实用的问题,但不幸的是没有标准回答。以下几点也许能有所帮助。

首先要将多元回归(multiple regression)决定系数 (R2)分解成三部分:纯属自变量的部分 (net contribution by independent variables)、纯属控制变量的部分 (net contribution by control variables)、自变量和控制变量混合的部分 (overlapped contribution between independent and control variables)。三者中,第二部分的大小对我们传播学研究没有什么意义(注意,这是“祝氏一面之词”之一,其他学者不一定同意),所以应该忽略不计。如,我们检验下述回归模型:

消费观念i = b0 + b1看电视时间i+ b2年龄i
假定总的R2 = 70%(非常非常好)、其中纯属年龄的R2 = 65%,剩下的5%纯属看电视或看电视与年龄的混合影响(不一定是交互影响噢)。这时我们需要考虑的是 5%是否有价值、而不是70%。同意吗?

好,我们继续讨论R2 = 5%是否有价值的问题。这时要关心的是这部分“解释变差”(explained variance)在95%的置信水平上是否显著,如果不显著,那就没有必要继续讨论了,结论很简单,这个多元回归模型没什么价值(即该模型中的自变量没什么影响)。
如果是显著的,也不一定等于这个模型(及其自变量)就有价值。这正是没有标准答案的地方。统计显著性 (statistical significance)是一个模型有无价值的必要条件、但还不是充分条件。其充分条件是这部分解释变差的大小要有“社会显著性”(social significance)。到底多大有社会显著性?见仁见智。

我的看法是要与文献中该因变量和该自变量的纪录作比较。如果该因变量很难被(该自变量或其它自变量)解释(如有关R2从来没有超过2%),你得到了5%,那就很好了;同理,如果该自变量在其它控制变量和自变量的基础上还能独自解释5%(甚至2%), 那我觉得也是能够接受的(上签)。相反,如果文献中该因变量或自变量经常有较大的解释或被解释力(10%、20%、。。。)而你的模型还只有5%,那就没什么大不了(中下签或以下)。

最后,更严格地说,我们要关心的是纯属自变量部分的解释变差。如果自变量和控制变量混合影响太大,说明还有重要的第三者没有被引入模型。



最新评论


小马

2006-03-13 20:35

祝老师:
谢谢您!
那么请问从技术上讲,如何确定每个自变量解释了多少R2呢?使用多元层级回归吗?
使用时进入模型的自变量顺序有什么要求?解释结果时又需要注意什么呢?



SL

2006-03-18 10:07

确定每个自变量解释的R2可以从changed R2那里看.进入模型的自变量的顺序影响结果吗?我用数据练习过,看起来是不影响什么的.
谢谢庄主这么精彩的解释.庄主关于控制变量的解释变差(在传播学中没有意义)的观点在竹家庄已强调过好几次,我一直以为是widely accepted knwoledge,今天才知道是庄主个人观点(我严重赞同).
许多采用扩散的研究都表明,在新技术开始扩散的早期(如penerate rate 低于10%),人口统计变量起决定性的作用,是对采用行为最有解释力的变量;只有越过crucial point之后,它的解释力才变弱.如果我们现在研究的正是某项新技术扩散的早期,那怎么办呢?
另外还有一个问题,我注意到很多有研究都会以一种理论作为自己的主要解释框架,如关于影响采用的因素,有的主要是社会认知理论,有的主要是使用满足理论,不知道我用权衡需求作为主要的解释框架,是不是可以?(象经典案例9那种unified model较少些)


2006-03-27 00:22

祝老师,请教一个相关分析中遇到的问题:
如果两个变量在理论假设里是有相关关系的,
当这两个变量是定比变量的时候,对二者做相关分析,皮尔逊相关系数为0.065,双侧显著性检验P<0.001,这怎么解释呢?有的人说相关系数小于0.4就说明没有相关性,而有的人说显著性检验显著,就说明两个变量有相关关系,并且两者的相关比较显著。
而当两个变量为定序变量的时候,肯德尔相关系数同样非常小(小于0.1),但显著性检验依然是显著相关的。
这样的情况怎么取舍呢?如何解释呢?



SL

2006-03-27 16:04

原来在wh05.woxie.com讨论过这个问题,刚才回去翻了半天,也没找到那些内容.简言之,相关是否显著与标准差,N有关系,所以,皮尔逊相关系数为0.065仍为显著相关不奇怪.



fanxinheng

2006-03-28 01:26

谢谢指教!那可以说两个变量之间有线形相关吗?


评论 / 个人网页 / 扔小纸条
* 昵称

已经注册过? 请登录

新用户请先注册 以便能显示头像及追踪评论回复

Email
网址
* 评论
表情
 


 

分类小组论坛
杂谈 , 娱乐、八卦 , 文学、艺术 , 体育 , 旅游、同城 , 象牙塔 , 情感 , 时尚、生活 , 星座 , 科技

请注意遵守中华人民共和国法律法规, 如威胁到本站生存, 将依法向有关部门报告, 同时本站的相关记录可能成为对您不利的证据.

相关法律法规
全国人大常委会关于维护互联网安全的决定
中华人民共和国计算机信息系统安全保护条例
中华人民共和国计算机信息网络国际联网管理暂行规定
计算机信息网络国际联网安全保护管理办法
计算机信息系统国际联网保密管理规定