验证性因子分析步骤(详细)
上一篇文章中,初步介绍了验证性因子分析的功能及应用场景。下面通过一个实例来具体了解一下,验证性因子分析的操作步骤以及过程中需要注意的内容。
当前有一份215份的研究量表数据,共由四个因子表示,第一个因子共5项,分别是A1~A5;第二项因子共5项,分别是B1~B5;第三个因子共4项,分别是C1~C4;第4个因子共6项,分别是D1~D6。现希望验证此量表的 聚合效度 和 区分效度 ,并且希望进行 共同方法偏差分析 。
验证性因子分析的步骤大致可分为四步,分别是:模型构建、删除不合理测量项、模型MI指标修正和模型分析。
(1)模型构建
即将因子与测量项对应关系放置规范;在进行CFA分析前一般需要进行EFA,清理掉对应关系出现严重偏差的测量项
(2)删除不合理测量项
如果因子与测量项间的对应关系出现严重偏差,此时可考虑删除某测量项;也或者某测量项与因子间的载荷系数值过低(比如小于0.5),说明该测量项与因子间关系较弱,需要删除掉该测量项
(3)模型MI指标修正
如果说模型拟合指标不佳,可考虑进行模型MI指标修正【SPSSAU默认提供MI大于20,MI大于10,MI大于5,和MI大于3共四种模型修正方式】
(4)最终模型分析
本例子中的量表共分为四个因子,暂不进行模型MI修正,放置如下:
SPSSAU共输出6个表格,各表格对应解释说明如下:
从上表可知,本次针对共4个因子,以及20个分析项进行验证性因子分析(CFA)分析。本次分析有效样本量为215,超出分析项数量的10倍,样本量适中。
CFA分析建议样本量至少为测量项(量表题)的5倍以上,最好10倍以上,且一般情况下至少需要200个样本。一个因子对应的测量项最好在5~8个之间,便于后续删除掉不合理测量项。
因子载荷系数表格展示 因子和测量项之间的关联关系 ,通常使用标准载荷系数值表示因子与分析项间的相关关系。分析时主要看标准载荷系数值和P值。
如果呈现出显著性,且标准载荷系数值大于0.70,则说明有着较强的相关关系。反之,如果没有呈现出显著性,也或者标准载荷系数值较低(比如低于0.4),则说明该分析项与因子间相关关系较弱。
上表格显示,B1与Factor2之间的因子载荷系数值为0.562 < 0.7,说明对应关系较弱,可考虑将此项从Factor2中移除出去。从整体上看,各个测量项全部均呈现出0.001水平的显著性(P< 0.001),而且标准化载荷系数值均大于0.7(除B1外),因而说明整体上看,因子与测量项之间有着良好的对应关系,聚合效度较好。
此表格主要查看指标的 聚合效度 和区分效度 情况,输出指标包括AVE和CR值。通常AVE值>0.5,CR值>0.7,说明数据聚合效度较好。
从上格可知:本研究涉及的4个因子(SPSSAU默认给定名字为Factor 1, Factor 2, Factor 3, Factor 4),它们的AVE值全部均大于0.5,而且CR值全部均大于0.7,因而说明本次测量量表数据具有优秀的聚合效度。
此表格展示 模型拟合指标 ,共分为常用指标和其它指标。表中提供各指标相应的建议判断标准,可直接对比判断标准值。一些其它指标通常使用较少,研究人员可结合实际情况进行选择。如果模型拟合不好需要,需要根据相关专业知识和模型修正指标对模型进行修正。
上表来看:卡方自由度值为3.389,大于3,而且GFI小于0.9,RMSEA为0.105接近于0.1这一标准,RMR值为0.091不在标准范围内。综合来看,模型构建欠佳,需要进行模型修正。比如这里将MI>10作为修正标准然后重新进行模型拟合,得到结果如下
上表格展示 因子与测量项的对应关系MI值 ,因子与其下属测量项的关系可通过因子载荷系数表格进行查看。MI值并不固定标准大小,一般情况下,该值如果大于20则说明关联性很强。
从上表格可以看到,C2与Factor2,Factor4这两个因子间的MI指标均大于15,说明C2与Factor2,Factor4之间可能有着较强的关联性;同时,D5与Factor3之间的MI值为18.121,说明二者有较强的关联性。
综合可知:可考虑将C2,D6这两个指标进行删除,同时上述因子载荷表格分析还发现B1也可以进行删除。因而将此三项进行删除后可再次进行模型(限于篇幅限制,SPSSAU并不继续进行分析)。
上表格展示因子与因子之间的关联性,可通过标准系数进行分析。从上表可知,在进行因子协方差表格分析时,本研究共4个因子,他们两两之间的标准系数值均介于0.6~0.85之间,说明因子之间具有较强的关联性。
聚合效度通常是针对 AVE,CR,因子载荷系数 这三个指标进行分析,并且均是在模型最终确认后的指标进行分析。
分析结果表明:本研究量表数据具有优秀的聚合效度
区分效度的测量是使用 AVE的平方根值 ,然后与4个因子的相关系数进行对比。
如果AVE平方根值大于“该因子与其它因子间的相关系数”,此时说明具有良好的区分效度。
区分效度首先需要进行相关分析(以及每个因子对应多项,需要使用‘生成变量’功能将其概括成一个整体后再进行两两相关分析)。如下:
常见的区分效度分析时,会将上表格中斜对角线的1,换成AVE值的平方根,然后再进行对比分析。最终如下表格式:
上图可知,因子1的AVE根号值为0.843,大于因子1与另外3个因子之间的相关系数值(最大为0.777);因子2的AVE根号值为0.84,大于因子2与另外3个因子之间的相关系数值(最大为0.753);类似地,因子3的AVE根号值,因子4的AVE根号值均大于它们与其它因子的相关系数值。因而说明研究量表数据的区分效度良好。
特别提示:
常见的区分效度分析是将AVE根号值与‘相关系数值’进行对比;有时候区分效度的验证方法为:“比较多个CFA模型进行分析说明”,建议研究人员以参考文献为准;
区分效度进行时,需要先进行相关分析,以及取AVE均方根,然后将手工表格合并处理好后进行分析说明。
共同方法偏差(CMV)常见有两种验证方式,一种是使用探索性因子分析EFA方法进行检验 (也称作Harman单因子检验方法),即查看把所有量表项进行探索性因子分析EFA时,如果只得出一个因子或者第一个因子的解释力(方差解释率)特别大,通常以50%为界,此时可判定存在同源方差(共同方法偏差),反之说明没有共同方法偏差问题。
如果是使用CFA进行验证;则将所有的测量项(即所有因子对应的测量量表题项)放在一个因子里面,然后进行分析,如果测量出来显示模型的拟合指标,比如卡方自由度比,RMSEA,RMR,CFI等无法达标,则说明模型拟合不佳,即说明所有的测量项并不应该同属于一个因子(放在一起时模型不好),因而说明数据通过共同方法偏差CMV检验,数据无共同方法偏差问题。
本次共有4个因子对应20个测量项,将此20个测量项全部放在一个因子里面进行CFA分析并且得到模型拟合指标,如下图:
上图显示卡方自由度值为11.137,明显高于标准(>3),并且GFI,CFI,NFI,NNFI这四个指标值全部均低于0.7,明显偏差标准值(大于0.9),RMSEA和RMR值均大于0.15,也严重偏差标准值。其它指标比如AGFI,IFI,PGFI,PNFI等也均低于0.7,严重偏差大于0.9这一标准,因而说明模型拟合质量非常糟糕,也即说明不能本次研究量表数据无法聚焦成一个因子,即说明无共同方法偏差问题。
特别提示:
上述为两种常见的共同方法偏差验证方法,还有其它验证方法,建议研究人员以参考文献为准;
研究人员需要在事前注意共同方法偏差问题,而不能等到事后发现共同方法偏差才能处理。
登录 SPSSAU官网 体验在线数据分析
验证性因子分析
验证性因子分析(confirmatory factor analysis, CFA)是用于测量因子与测量项(量表题项)之间的对应关系是否与研究者预测保持一致的一种研究方法。
验证性因子分析CFA 的主要目的在于进行 效度验证 ,同时还可以进行 共同方法偏差CMV 的分析。
结合实际应用情况,验证性因子分析通常有三个用途:
聚合效度,又称收敛效度,强调那些应属于同一因子(指标)下的测量项,测量时确实落在同一因子下面。
如果目的在于进行聚合(收敛)效度分析,则可使用 AVE 和 CR 这两个指标进行分析,如果每个因子的AVE值大于0.5,并且CR值大于0.7,则说明具有良好的聚合效度,同时一般还要求每个测量项对应的因子载荷系数(factor loading)值大于0.7。有时候还可能会结合模型拟合指标,以及进行模型MI值修正,以达到更好的结论。
由上表可知,AVE值全部均大于0.5,而且CR值全部均大于0.7,因而说明本次测量量表数据具有优秀的聚合效度。
区分效度,强调本不应该在同一因子(指标)下的测量项,测量时确实不在同一因子下面。
如果目的在于进行区分效度分析,则可使用AVE根号值和相关分析结果进行对比,如果每个因子的AVE根号值均大于“该因子与其它因子的相关系数最大值”,此时则具有良好的区分效度,为更好表述,使用下图展示:
上图的斜对角线为AVE的根号值,,比如因子对应的AVE根号值为0.843,该值大于因子1与另外3个因子的相关系数(分别是0.700,0.646和0.777),类似因子2,因子3,因子4也这样进行分析。最终发现因子的AVE根号值,全部均大于该因子与其它因子的相关系数值,因而说明具有很好的区分效度。
操作步骤:
分析时首先完成验证性因子分析的模型构建, 通过' 生成变量 '功能将题项合并为一个整体(因子)进行 相关分析 。
共同方法偏差,是指由于测量外部的某些因素导致数据出现集中的偏差。换句话说,测量的差异是由于研究本身(或其他),如测量工具、问题构成或测量环境等导致的。
如果目的在于进行共同方法偏差(CMV)分析,常见的做法为: 将所有的测量项(即所有因子对应的测量量表题项)放在一个因子里面,然后进行分析。
如果测量出来显示模型的拟合指标,比如卡方自由度比,RMSEA,RMR,CFI等无法达标,则说明模型拟合不佳,即说明所有的测量项并不应该同属于一个因子(放在一起时模型不好),因而说明数据通过共同方法偏差CMV检验,数据无共同方法偏差问题。
上图显示卡方自由度值为11.137,明显高于标准(>3),并且GFI,CFI,NFI,NNFI这四个指标值全部均低于0.7,明显偏差标准值(大于0.9),RMSEA和RMR值均大于0.15,也严重偏差标准值。因而说明模型拟合质量非常糟糕,也即说明不能本次研究量表数据无法聚焦成一个因子,说明无共同方法偏差问题。
针对CMV检验,上种思路同样也适用于使用探索性因子分析EFA方法进行检验CMV问题(也称作Harman单因子检验方法),即查看把所有量表项进行探索性因子分析EFA时,如果只得出一个因子或者第一个因子的解释力(方差解释率)特别大,通常以50%为界,此时可判定存在同源方差(共同方法偏差),反之则说明没有共同方法偏差问题。
针对共同方法偏差(CMV)分析,还有其它的一些做法,建议用户以文献为准。
(1)进行聚合(收敛)效度,或区分效度分析,建议首先进行探索性因子分析(EFA),然后再进行CFA分析。
原因在于CFA对于数据质量要求高,如果探索性因子分析就发现因子与测量项对应关系出现偏差,需要首先进行处理,确认好因子与测量项对应关系后,再进行CFA分析。
(2)如果使用CFA进行分析,建议样本量至少为测量项(量表题)的5倍以上,最好10倍以上,且一般情况下至少需要200个样本。
(3)一个因子对应的测量项最好在5~8个之间,便于后续删除掉不合理测量项。
登录 SPSSAU官网 体验在线数据分析
spss信度如何分析?
问卷星spss信度效度分析步骤如下:1、首先登录问卷星首页,会出现你创建的问卷,点击“分析&下载”,选择“查看下载答卷”选项。2、点击“下载答卷数据”按钮,因为我们需要通过SPSS进行分析所以选择“按选项分数下载”。这样可以看到问卷数据被导出来成了Excel格式文件了。另外可根据自身需求筛选问题条件进行下载。3、打开SPSS 26.0数据分析软件,点击“文件”-“导入数据”,选择“Excel”。4、将之前从问卷星下载的问卷数据excel导入到SPSS中。5、点击“分析”-“刻度”-“可靠性分析”。6、信度分析仅是针对量表问题,本次问卷为标准的5度量表,1表示非常不同意,5表示非常同意意,共含有22个题项,首先检验这一份量表整体的信度。将所有的量表题选中至右侧项。模型默认选择“Alpha”。7、点击右上角的“统计”选项,可勾选“删除项后的标度”,点击继续。8、点击确定后就得到本次问卷整体信度分析结果如下。本次22个量表题得出问卷总体的Cronbach α系数值为0.82,大于0.8,说明样本数据总体信度质量高。如果α系数比较低,可以查看删除项后的克隆巴赫Alpha值,该值为删除该分析项题目后,剩下分析项的α系数,若此值明显高于Cronbach α系数值,则可考虑将该分析项删除。这样就可以提高Cronbach α系数值。9、问卷调查一般会有多个维度变量,因此接下来针对每个维度变量进行分析,比如本次问卷有感知风险这个变量,那么选中它对应的3个题项进行信度分析,得出该维度的Cronbach α系数值。另外的维度变量信度分析同理。