路鹏程 @ 2007-03-21
我们想测量一下青少年中的“第三者效果”。我们设计了两个问题:一、您对所看到的广告:1、非常信任,2、比较信任,3、一般,4、不太信任,5、从不信任。二、您认为广告对一般消费者的购物的影响:1、非常大,2、比较大,3、一般,4、不太大,5、无影响。请问祝老师我们该选用什么方法测定有关这两组调查数据之间的相关性?
庄主 @ 2007-03-21
这两个变量都是定序变量,可以参考一下我前帖子“如何检验两个定序变量的相关关系”(http://zjz06.yculblog.com/post.2667612.html)。
路鹏程 @ 2007-03-23
谢谢祝老师的指教。就上一个问题,我还想请教的是,观察条件百分交互表,我们似乎可以明显地看出青少年对广告对一般消费者的影响程度的判断总是高于他们自己对广告的信任程度,即似乎存在者“第三者效果”。为何gamma=.072somers'd=.o51之值如此低呢?
庄主 @ 2007-03-24
你的问题涉及到一个表面上很简单、其实有点tricky(蹊跷?)的基本原理,即difference(差别)与correlation (相关)之间的关系。一般教科书中很少讨论此问题,所以专门写个帖子来谈谈。
两个变量(即两组数值)之间有差别,是否等于两者相关?反之,两个变量之间无差别,是否等于无关?这个问题看上去很简单,实际很复杂。我们来看看以下的例子:
表一、原始数据
| A | B | C | D | E |
| 1 | 1 | 0 | 2 | 1 |
| 2 | 2 | 1 | 3 | 2 |
| 3 | 3 | 2 | 4 | 3 |
| 4 | 4 | 3 | 5 | 4 |
| 5 | 5 | 4 | 1 | 0 |
上述A-E五组数据可以是五个人、一个人的五个变量、等等,方便起见,称之为五个变量。每个变量有五个cases(记录)。 我们以A为基准,分别考察其与B-E四个变量的差别与相关。如按差别的平均数来计,A-B=0、A-C=1,等等(见表二)。
表二、A与其它变量的平均差
| B | C | D | E | |
| 与A的平均差 | 0 | 1 | 0 | 1 |
再来看A与其它四个变量的相关系数,可用Pearson r 或其它各种相关分析来计算,结果都一样。A与B一模一样,所以其相关系数一定等于1。A与C的每对数值虽然相差1,但是这些差别的方向与大小都是+1,即completely consistent(完全一致的)、所以其相关系数也是1(为什么?去查查相关系数的计算公式就应该明白了)。然而A与D或A与E之间每对数值也都有差别、但这些差别方向或大小并不一致,所以相关系数不等于1。这里,我故意将D和E的数值配到使其与A的相关系数等于0(见表三),以便于说明个中道理。
表三、A与其它变量的相关系数
| B | C | D | E | |
| 与A的相关系数 | 1 | 1 | 0 | 0 |
好了,我们再来做一个表(表四),来总结一下表二和表三所显示的规律:
表四、差别与相关的四种组合
| 两变量有无差别? | ||
| 两变量是否相关? | 无 | 有 |
| 否 | A-D | A-E |
| 是 | A-B | A-C |
我们从表四中发现什么规律了?什么也没有发现,因为一片混沌,两个变量之间如有差别、它们可以相关(或者强相关)也可以不相关(或者弱相关);同时,如果两个变量之间无差别,它们也可以相关(或强相关)、也可以不相关(或弱相关)。其实,这种无规律就是一种规律:差别与相关是两个不同的问题。上面已提到,相关是反映两个变量的各对数值之间差别的一致性,而差别则是两个变量的各对数值之间差别之总和(或平均值)。我们到底用哪个,取决于研究假设(更精确地说,零假设)究竟是什么。
回到“第三者效果”问题上来,其零假设是什么?我们应该用差别还是相关?请大家讨论一下吧。


