我在Indiana念书时,与一美国同学一起修统计课。有次,他有一题做错了,怎么也找不到原因。我帮他一步一步演算,发现错在其中一个负值的符号掉了,比如原来那部分是 100 x -1,应该 = -100,但他用一个老式的计算器,输入“-1”时计算器其实只接受“1”,所以出来的总是正的100。我告诉他这不用算,眼睛看一下就知道是负值了。可爱的他还是不理解,不断地问“Why did you get -100 when my calculator says it's 100?”(为什么我的计算器与你的计算不一样?)。
现在很少有人做计算器的奴隶了。但是小心,别成了SPSS的奴隶。
SPSS的操作界面友善容易,所以我和大家一样喜欢用它。我最早是1983年在上海计算机技术研究所那里学用SPSS的主机版(SPSS-X),当时的操作界面并不友善,输入指令是用打孔机在纸带上打洞,打完以后很难从纸带上检查你输入的指令是否有错(纸带上只看得到一连串的孔洞而已),只能将纸带读入主机,过几个小时(或一个晚上)去看结果。一开始得到的通常只是一行字:输入指令有错(Input Errors)。那就得重打再试。算一个频数表 (Frequencies)可能就要一个星期时间,另加所用的机房费和主机费。几次下来就怕了,打孔时战战兢兢,手都发抖,生怕有错;打完后仔细看“天书”(纸带上的蝌蚪文),时间长了居然还能看出对错来(当时自嘲窥视“天机”?)。 (后来学LISREL,用希腊文写矩阵,还是比蝌蚪文的纸带容易。)
这时,虽然条件很差、做的分析也比较简单,但是我与SPSS的主仆关系还是泾渭分明的,因为我通过蝌蚪文让SPSS替我打工 (I knew what I wanted and how to make SPSS to get it for me.)
20多年过去了。SPSS从主机版搬到PC版、从指令式操作发展到互动式操作,越来越友善容易。作为一位(20多年)老用户,我深感SPSS对推广和促进社会科学实证研究所做的重大贡献,时常讲SPSS是20世纪社会科学的革命之一。
万事总有两面。技术革命给人类带来了便利和效率,但也会(无意中)带来依赖或功能退化。SPSS也是如此,制造了一大批奴隶。最简单的特征是将SPSS的运算结果(如频数表、交叉表、回归系数表)等直接贴到论文中去而不作任何修改,十分难看,充满了只有作者自己看得懂的变量名(而不是理论概念名)和带有六位小数的系数(不用这么精确吧?)。
这还只是小问题,更严重一些的是将SPSS等同与统计学的经典教科书,到处套用SPSS的专用术语(有些并非普遍通用的),经常有张冠李戴的笑话。
可能最致命的是GIGO(Garbage-In, Garbage-Out,应该译成“宽进宽出”还是“滥进滥出”?)操作方式:不管数据是否满足某种(往往是高级的)分析工具之要求(如数据的测量层次、分布状况等),扔进去再说,反正SPSS不会抗议(是的,SPSS表面上看上去是很顺从的奴隶),出来一大堆结果后,直奔显著性水平,只要小于0.05就大功告成。(有时,小于0.05是坏事,如Logistic Regression、Loglinear等,说明模型与数据有显著差别,假设检验失败,居然全然不知,照样向全世界报告。)除了看错显著检验之外,还经常看错或解释错系数。同样常见的还有找不到需要的统计量,这是因为有些统计量SPSS不自动给出,需要专门指定;更为难的是有些统计量SPSS不直接给出,需要根据给出的结果手工计算。
我觉得这一切都不是SPSS的错(当然有些批判学者也许会说,SPSS公司从商业利润出发,通过SPSS的操作傻瓜化而奴役学者。。。)。错在有些用户以为有了好用的工具(SPSS)就可以代替对原理的理解、或掩饰对原理的困惑。理解上的困惑是挥之不去的,读SPSS结果时会烦着你、写报告时也会缠着你、答辩时更会像幽灵一样出现在最不应该出现的时间和地点。
“同学们大家起来,我们要做SPSS的主人”。