日历
网志分类
· 所有网志
· 传播理论
· 新媒体技术
· 研究方法
· 统计分析
· SPSS Syntax
· 论文写作
· 讲习班事务
· 杂项·家庭作业·数据
· 留学问答
· 未分类
站内搜索
友情链接
· 我的歪酷
· 竹家庄blogspot版(2009)
· 竹家庄MSN版(2007-08)
· 自学资源链接
· 家庭作业
你从哪里来
Locations of visitors to this page
你从哪里来之二

订阅 RSS

0215461

歪酷博客

竹家庄


« 上一篇: Confirmatory Regression vs. Hierarchical Regression 下一篇: Difference vs. Correlation »
庄主 @ 2007-03-17 13:47

C @2007-03-10:
    您好,我目前想做一个路径分析,但不知道程序应该怎么写,也找不到相关资料。想跟您请教一下,

  1. 用Lisrel或是Sas怎么做呢?
  2. 我的外生变量很多(超过25个),包括一些个人背景的、家庭和同伴特征的,请问是否能通过主成分来缩减指标呢?
  3. 如果两个内生变量之间是相关的关系,那么在写方程时是否也要把相关关系写上呢?

庄主@2007-03-13:

为了便于其他读者的理解,我先交待一下路径分析 (path analysis) 的简单背景。

路径分析可以用作多种目的:一是将因变量之间有关系的的若干个回归模型整合在一个模型里,以助分析和表达的完整和简洁;二是在该整合模型中的各自变量对各因变量的“总影响”(total effects) 分解为“直接影响“(direct effects) 和“间接影响”(indirect effects),如果发现间接影响较大,那就有理论价值了(当然,如下所示,很难发现大的间接影响);三是通过直接影响和间接影响的比较来验证一个自变量是否为“中介变量”(mediating variable),即其直接影响不显著而间接影响显著(上面已说过,不容易发现间接影响、如果同时又要其直接影响不显著,那就更难了)。

如此看来,路径分析是个好东西(不好意思,赶了一回时髦)。其从1960年代兴起,1970-80年代已十分流行。我在Indiana念博士时,学院里的老师常用路径分析做研究。后来学了SEM(结构方程模型),才知道路径分析有“含测量误差”和“不含测量误差”两种。前者只研究自变量和因变量之间因果关系,即SEM中的structural model(结构模型)那部分(见图一),而后者则加上了各变量的CFA(验证性因子分析),也即SEM中的measurement model(测量模型)那部分(图二)。

好了,现在直接回答你的问题。问题1从字面上看,只涉及结构模型那部分,所以比较简单、容易。这种路径分析,不仅可以用LISREL、SAS或其它SEM软件,其实也可以用SPSS等通用统计软件,其结果是一样的。先说在SPSS中如何做。图一是我日前在“Confirmatory regression vs. hierarchical regression" 一文中举的例子相仿(当时只用了三个公式,没有此图)。如前文中所说,因为该模型中有两个因变量(或内生变量,endogenous variables),所以需要建立两个回归模型,分别为公式一和二,其中变量名和系数名有些改动,系数分别记为b和g,是为了与LISREL用法一致,b表示一个内生变量(如W)对另一个内生变量(如Y)的影响、g表示一个外生变量(如X)对一个内生变量(如W或Y)的影响:

Y = b0 + g1X + b2W                                  (公式一)
W = g0 +g2X                                            (公式二)

在SPSS中,就按上述两个公式分别做一个回归分析。如果你习惯用SPSS指令的话,其syntax分别为:

Regression Dependent=Y/Enter X, W.
Regression Dependent=W/Enter X.

然后将两个回归分析所得到的回归系数填入图一,此时要用standardized Beta(即 B1、B2、G1分别为公式一和三中b1、b2、g1的标准化值),就得到了路径分析。当然,这里的B1、B2、G1都是直接影响,我们还不知道年龄对Y的间接影响和总影响(注:上网时间对Y只有直接影响没有间接影响,所以其总影响=直接影响),但这可以用手算:

X对Y的间接影响 = G1 X B2                                                                                           (公式三)

X对Y的直接影响 = X对Y的直接影响 + X对Y的间接影响 = B1 + G1 X B2                      (公式四)

由于G1 和B2 都是取值0和±1之间,其乘积一般不大。比如,G1 = 0.5、B2 = 0.5,其乘积只有0.25。而在含有测量误差的回归中,达到0.5的系数很少见,更常见的是在0.1-0.3之间,那么其乘积只在0.01-0.10之间。这就是为什么间接影响一般不大的原因。通过SPSS做的路径分析,因为没有将每个变量的测量误差考虑进去,所以是我上面说的“含测量误差”路径分析。同时,因为它是将数个回归分析加以组装(assembled)而非整合(integrated),所以又可以称为“组装型”路径分析。

如果用LISREL呢?大家也许知道,LISREL可以用公式(SIMPLIS)或矩阵 (matrices) 来写。前者容易,其syntax如下 (其中“...”部分为数据定义和其它指令,这里省略了):

...
RELATIONSHIPS:
Y = X W
W = X
LISREL OUTPUT EF ...
...

前三句于SPSS Regression的syntax相仿,最后一句中的 "EF" 是要求LISREL输出间接影响和总影响的结果,不仅不需要手算了、而且会给出间接影响(即公式四)和直接影响(公式五)的显著检验,而SPSS是无法提供这些显著检验的。

用LISREL矩阵指令的人越来越少,属于“斩蛟龙”之术,这里不介绍。如果你问的就是矩阵指令,请告知。

显然,LISREL的结果是“整合”(而非“组装”)型的路径分析,更是一个好东西(又赶了回时髦)。但是,其结果(即直接、间接和总影响的系数)与SPSS加手算的结果完全一样!(大家可以对同一数据分别用这两种软件验证一下。)道理很简单,因为用的都是同样(含有测量误差)的数据。当然,LISREL可以进一步将各变量的测量指标整合进来(即图二),那么其路径分析的结果与组装结果就可能不一样了,而且一般情况下各种影响的系数都会大一点(因为将测量误差扣除了)。当然,现在很少有人将这种分析叫做路径分析了,而是直接叫SEM(就是一回事嘛)。

最后回答你的问题2和3。问题2:对,可以而且应该根据理论或常识的建议、将很多个直接测量的自变量构建成少数个因子,当然还要看数据是否支持这些合并。问题3:对,如果你的理论模型中并没有对两个内生变量之间的因果关系做任何说明(即在图一或图二中没有B2 ),那么应该将它们当作相关关系来处理。事实上,LISREL会自动计算这种相关关系(在PSY矩阵中)。



最新评论 (点击这里查看更早的所有评论...)


妮子

2007-08-01 10:06 匿名 218.249.*.*

我也想问一个问题,当观测变量全部是0-1计分的数据,因变量也是分类变量时,可不可以做结构方程呢?如果可以的话,它与观测观测变量是连续变量时有什么区别?



小彭

2007-08-01 10:14 匿名 144.214.*.*

SEM的一个assumption是multivariate normality(多元正态分布),当所有的变量都是0/1变量或者分类变量的时候,数据会很严重的违反这个假设。SEM的软件不会阻止你用它们来分析你的这些数据,但是你最后得到的estimates,会有很大的biase。就算所有的观测变量是连续变量,而且每个变量都是正态分布,也不一定能确保能达成多元正态分布。当然,现在不同的estimation method(比如ML,GLS,WLS)能够忍受(tolerate)对多元正态分布的某种程度的违背,但是也是要具体情况具体分析。SEM是个好玩的东西,但不是个万能的东西。建议你可以考虑庄主多次提到的Latent Class Modeling或者其他loglinear类似的方法。



妮子

2007-08-01 11:53 匿名 218.249.*.*

谢谢小彭,羡慕你们的统计知识如此丰富啊,我先试试你推荐的方法,有不懂的地方继续向你们请教~~~



小彭

2007-08-01 14:53 匿名 144.214.*.*

我离你羡慕的境界还远的很,呵呵!



shenshen0455

2007-11-29 16:31 匿名 220.194.*.*

祝老师你好,我现在在学习结构方程模型,遇到了这样一个问题,模型的某个变量的TD值非常大,而且严重影响了模型的拟和指标。请问应该如何处理这个问题呢?谢谢



庄主

2007-11-29 21:02 匿名 221.126.*.*

SEM模型拟合结果不好的原因很多,先看看这个贴子:http://zjz06.yculblog.com/post.1211684.html.



shenshen0455

2007-11-29 22:11 匿名 220.194.*.*

学习中,不懂之处还望多赐教



shenshen0455

2007-11-29 22:18 匿名 220.194.*.*

LISREL的结果(即直接、间接和总影响的系数)与SPSS加手算的结果完全一样!这里有些疑问,以前有些人手算过,两者结果不一致。有人解释是,两种估计方法不同



蚂蚁搬家

2007-12-01 13:30 匿名 202.110.*.*

多谢庄主,我还有一个问题,就是只写那几个指令就可以做路径分析了吗? 是否还需要其他的? 能够给一个完整的数据程序? 多谢!



庄主

2007-12-03 00:51 匿名 219.235.*.*

蚂蚁:
上述指令就是路径分析所需的了。这一事实说明路径分析并不复杂。如果你还是觉得无法下手,说明问题不在路径分析、而在如何设置SEM的数据、定义变量和因子等。如是,建议改用AMOS,它是图像操作,比写指令容易。


评论 / 个人网页 / 扔小纸条
* 昵称

已经注册过? 请登录

新用户请先注册 以便能显示头像及追踪评论回复

Email
网址
* 评论
表情
 


 

分类小组论坛
杂谈 , 娱乐、八卦 , 文学、艺术 , 体育 , 旅游、同城 , 象牙塔 , 情感 , 时尚、生活 , 星座 , 科技

请注意遵守中华人民共和国法律法规, 如威胁到本站生存, 将依法向有关部门报告, 同时本站的相关记录可能成为对您不利的证据.

相关法律法规
全国人大常委会关于维护互联网安全的决定
中华人民共和国计算机信息系统安全保护条例
中华人民共和国计算机信息网络国际联网管理暂行规定
计算机信息网络国际联网安全保护管理办法
计算机信息系统国际联网保密管理规定