双向有序属性相同行列表数据的分析
双向有序属性相同的行列表一般存在以下几种分析需求:
1一致性检验有两种方法可用于诊断某种癌症,A方法简单易行,成本低,患者更容易接受,B方法结果可靠,但操作繁琐,患者配合困难。某研究选择了53例待诊断的门诊患者,每个患者分别用A和B两种方法进行诊断,判断两种方法诊断癌症是否一致,A方法是否可以代替B方法。结果整理成下表:
B方法
合计
阴性
阳性
A方法
阴性
25(a)
2(b)
27
阳性
11(c)
15(d)
26
合计
36
17
53
对于此类资料,常用的方法为Kappa一致性检验,旨在评价两种方法间是否存在一致性,通过Kappa值评价一致性大小:Kappa≥0.75,说明两种方法诊断结果一致性较好;0.4≤Kappa0.75,说明两种方法诊断结果一致性一般;Kappa0.4,说明两种方法诊断结果一致性较差。
2配对行列表适用于行列变量为配对资料,同样以上述四格表资料为例,为比较两种方法的诊断是否存在差异,由于是在相同个体上使用两种方法进行诊断,故对于此类资料,可选用的统计方法为McNemar检验。值得注意的是,McNemar检验仅适用于不一致对子数b+c40时,不满足该条件时需要进行校正。此外,McNemar检验仅适用于2x2列联表,对于分类数目大于2的配对列联表则需要使用Bowker检验,具体操作方法不在此赘述。
对于相同的配对四格表,使用Kappa检验和McNemar检验两种不同方法的原因在于各有侧重,两者间的比较如下:
1、Kappa检验旨在评价两种方法是否存在一致性;配对χ2检验主要确定两种方法诊断结果是否有差别;
2、Kappa检验会利用列联表的全部数据,而配对χ2检验只利用“不一致“数据;
3、Kappa检验可计算Kappa值用于评价一致性大小,而配对χ2检验只能给出两种方法差别是否具有统计学意义的判断。
关于Kappa检验和McNemar检验的具体操作如下:SPSS:01数据录入:
变量视图
数据视图
02加权个案
选择Data→weightcases→勾选Weightcasesby,将频数放入FrequencyVariable→OK。
03分析
选择Analyze→DescriptiveStatistics→Crosstabs
04选项设置
主对话框设置:将“A方法”和“B方法”两个变量分别放入Row(s)框和Column(s)框中(无位置要求)。
Statistics设置:勾选McNemar和Kappa→Continue
Cells设置:Counts中勾选Observed,输出实际观测频数;Percentages勾选Row和Column,输出行和列占比→Continue→OK
05结果解读
描述性统计结果:
McNemar检验结果:
Kappa检验一致性结果:
McNemer检验的结果得到P=0..05,提示两种方法诊断情况并不一致;Kappa一致性检验结果得出Kappa=0.,P0.,提示两种方法诊断结果存在一致性,但是Kappa在0.4~0.75范围内,一致性一般。
A方法和B方法诊断结果一致性一般(Kappa=0.,P0.);B诊断阳性率为67.9%,明显高于A诊断(50.9%),且差别具有统计学意义(P=0.)。
值得注意的是,此时b+c40,故输出的是校正后的McNemar检验统计量。
SAS:Code:
dataequalranges;
inputrater1rater2weight;
datalines;
;
run;
procfreqdata=equalranges;
tablesrater1*rater2/agreenopercentnocolnorow;
weightweight;
run;
结果解读:
从上述结果可以看出,Kappa=0.(0.-0.),A方法和B方法诊断结果一致性一般。
值得注意的是,在SAS的McNemar检验中不考虑校正问题,仅适用于较大样本,本例得出的McNemar检验统计量对应为6.23,P=0.6,和上述SPSS结果并不一致。因此,针对此例需要考虑校正问题时,需要自行编辑公式进行计算,代码如下:
dataadjusted;
inputf11f12f21f22;
iff12+fthenchisq=(abs(f12-f21)-1)**2/(f12+f21);
elsechisq=abs(f12-f21)**2/(f12+f21);
P=1-probchi(chisq,1);
cards;
252
;
procprint;
run;
结果如下:
因此,本例中McNemar检验统计量为4.92,P=0.。
Stata:McNemar检验语句如下:
mcci252
Kappa检验:
数据整理成如下所示:
结果如上所示,具体解读与SPSS一致。
3趋势性检验趋势性检验在于充分利用等级信息,对数据做出综合分析,以对反应生物学阶梯或等级关系等资料进行有效的假设检验。对于此部分内容仅做简单介绍,并提供SAS代码进行实现。
比如为探究胸部平片密度级别是否随矽肺期次进展有逐步提高趋势,医院对名不同期次的矽肺患者的胸部平片肺门密度进行收集,整理成如下列联表:
矽肺期次
肺门密度级别
合计
Ⅰ
Ⅱ
Ⅲ
1
43
14
2
1
96
72
3
6
17
55
78
合计
50
对于此类资料,可选用的统计方法有:
Cochran-Armitage趋势检验:仅适用于针对2*2列联表;
Spearman、Kendall秩相关和典型相关分析:如两变量间的相关系数有统计学意义,即可认为变量间存在趋势关系,通过相关系数的符号来判断趋势走向。
Spearman等级相关只适用于分析两变量间的相关;
Kendall则既可以对两变量作等级相关,也可以对多变量作等级相关分析;
但是上述两种相关分析给有序变量的等级赋值过于简单,因此不能最大限度地获得两有序变量间的相关信息。
典型相关分析则是在使两有序变量的相关达到极大的前提下,给有序变量的各等级进行赋值,通过对表边缘设法产生一双正态分布变量,从而进行相关分析,主要思想类似于主成分分析。主要功能在于分析两组变量间的关系,这两组变量的数目可以不止一个。
以上述资料为例,SAS程序如下:
SAS:datatrend1;
inputrcweight;
datalines;
12
;
run;
/*spearmankendall相关*/
proccorrspearmankendall;
varrc;/*r为矽肺期次,c为肺门密度级别*/
freqweight;
run;
结果显示,
结果显示,Spearman相关系数r=0.,P<0.;Kendall相关系数r=0.,P<0.。
/*典型相关分析*/
proccorresp;
tablesr,c;
weightweight;
run;
结果显示,典型相关分析第1对、第2对典型相关系数分别为R1=0.,R2=0.;卡方统计量为.7.4和13.,查界值表得出P均小于0.01,提示存在直线相关关系。
故肺门密度级别随着矽肺期次的增加而增加。
CMHχ2检验:根据R*C列联表中行变量与列变量的属性不同,做非零相关、行平均分差和一般联系3种检验。行列变量均为等级变量时,作非零相关检验,实际上就是趋势性检验,但这种趋势检验仅限于线性趋势检验。
以上述资料为例,SAS程序如下:
SAS:procfreqdata=trend1;
tablesr*c/cmhexpectednopercentnorownocol;
weightweight;
run;
非零相关检验结果提示χ2=.,P0.0,故肺门密度级别随着矽肺期次的增加而增加。
CPD趋势检验:较少使用,不在此赘述。
——作者:李思冬
编辑:赵锐
校对:大话统计工作组
李思冬赞赏