首先要将多元回归(multiple regression)决定系数 (R2)分解成三部分:纯属自变量的部分 (net contribution by independent variables)、纯属控制变量的部分 (net contribution by control variables)、自变量和控制变量混合的部分 (overlapped contribution between independent and control variables)。三者中,第二部分的大小对我们传播学研究没有什么意义(注意,这是“祝氏一面之词”之一,其他学者不一定同意),所以应该忽略不计。如,我们检验下述回归模型:
消费观念i = b0 + b1看电视时间i+ b2年龄i
好,我们继续讨论R2 = 5%是否有价值的问题。这时要关心的是这部分“解释变差”(explained variance)在95%的置信水平上是否显著,如果不显著,那就没有必要继续讨论了,结论很简单,这个多元回归模型没什么价值(即该模型中的自变量没什么影响)。
我的看法是要与文献中该因变量和该自变量的纪录作比较。如果该因变量很难被(该自变量或其它自变量)解释(如有关R2从来没有超过2%),你得到了5%,那就很好了;同理,如果该自变量在其它控制变量和自变量的基础上还能独自解释5%(甚至2%), 那我觉得也是能够接受的(上签)。相反,如果文献中该因变量或自变量经常有较大的解释或被解释力(10%、20%、。。。)而你的模型还只有5%,那就没什么大不了(中下签或以下)。
最后,更严格地说,我们要关心的是纯属自变量部分的解释变差。如果自变量和控制变量混合影响太大,说明还有重要的第三者没有被引入模型。


