戻る     次へ     目次へ

4.3.2. m×2分割表のとき.
2つの特性の一方がm個に分類されている多標本での独立性の検定です.通常の検定では「A.一般的なとき」を用いれば良いでしょう.
しかし,標本特性の出現率に一定の傾向(増加または減少)がみられるときは、
「B.傾向を有するとき」を,
あるいは対応する2つの出現率の関係が問題になるときは、
「C.対応のあるとき」を選択して試行すべきでしょう.

A.一般的なとき.
通常のm×2分割表形式における検定で広く用いられる手法です.後記の「B,C」の手法にかかわらず,ここでの検定を用いることができます.

[一般形式]

要因(A)/特性(B)特性あり(B1)特性なし(B2)特性の出現率
A1f11f12f1.P1=f11/f1.
A2f21f22f2.P2=f21/f2.
・・
Aifi1fi2fi.Pi=fi1/fi.
Amffm1fm2fm.Pm=fm1/fm.
f.1f.2TP=f.1/T

fij はそれぞれの要因での出現度数,f.j 及び fi. は各小計,T は総計です.

[検定の手順]
1.検定の問題を明かにする。
「A群における特性の出現率に差があるか?」

2.仮説の設定を行う。
帰無仮設(H0):P1=・・・=Pm
対立仮設(H1):P1≠・・・≠Pm (両側検定のとき).
対立仮設(H1):P1>・・・>Pm または,P1>・・・>Pm (片側検定のとき).

3.危険率(100α%)を設定する.
両側検定のときの有意水準:α 
片側検定のときの有意水準:2α

4.検定統計量(KAI02)を計算する.
KAI02=杷i.×(pi−P)2/P(1−P)

なお,Pi=各標本の出現率,P=全体の出現率 である.  

5.統計的判定を行う. 注釈表示

[両側検定のとき]
KAI02<KAI2(m-1,α)ならば,「危険率100α%で有為な差がない」
KAI02≧KAI2(m-1,α)ならば,「危険率100α%で有為な差がある」

[片側検定のとき]  
KAI02≧KAI2(m-1,2α)ならば,「危険率100α%で大きい(小さい)」

なお,KAI2(m-1,α)はKAI2分布表(表計算ソフト「エクセル」)から求めます.求め方は「例題」を参考にして下さい.

[ 例題11 ]
表17 に示した企業間の有病率に,有意な差があるかどうかを検定してみましょう.

表17 企業間の有病率
要因(B)
病欠者数就業者数病欠率
要因(A) 企業A155115260.0285
企業B142372510.0557
企業C204764960.0403
企業D42993030.0132
5315231576P=0.0336

表17 はm×2分割表に整理されたものです.
これから検定統計量(KAI02)は次のように計算されます.

出現率の変動(Sp):
2章(2.3.2.)の偏差平方和を参照して下さい.

526×(0.0285−0.0336)2=0.014
251×(0.0557−0.0336)2=0.123
496×(0.0403−0.0336)2=0.022
303×(0.0132−0.0336)2=0.126

計(Sp)=狽i.×(pi−P)2=0.285

よって,検定統計量(KAI02)は次の通りです.

KAI02=0.285/(0.0336(1−0.0336))=8.78

これは, 

KAI02=8.78>KAI2(3,0.05)=7.815 (両側検定,危険率 5%)

KAI2(3,0.05)は表計算ソフト「エクセル」から,[=CHIINV(0.05,3)]より求めます.以下,同様にして求めて下さい.

です.したがって,企業間の有病率に有意な差があると云えます.

次に,この有意差を反映する企業間の組合せを考えてみましょう.
例題11 では,AとDおよびBとCの組合せが考えられるので,この組合せについて検討してみましょう.

A・D間では,
526×(0.0285−0.0229)2=0.0165
303×(0.0132−0.0229)2=0.0285
計(Sp)=0.0450

ですので,その検定統計量(KAI02)は,

KAI02=0.045/(0.0229(1−0.0229))=2.011

となり,

KAI02=2.011<KAI2(1,0.05)=3.841(両側検定,危険率5%)

から,A・D間の有病率は有意な差がないと云えます. 同様に,

B・C間では,
251×(0.0558−0.0455)2=0.0266
496×(0.0403−0.0455)2=0.0134
計(Sp)=0.04

ですので,その検定統計量(KAI02)は,

KAI02=0.04/(0.0455(1−0.0455))=0.921

となり,

KAI02=0.921<KAI2(1,0.05)=3.841 (両側検定,危険率5%)

から,B・C間の有病率は有意な差がないと云えます.

そこで,ADの群と,BCの群に分け検定すると次のようになります.

747×(0.0455−0.0336)2=0.106
829×(0.0229−0.0336)2=0.095
計(Sp)=0.201

ですので,その検定統計量(KAI02)は,

KAI02=0.201/(0.0336(1−0.0336))=6.19

となり,

KAI02=6.19>KAI2(1,0.05)=3.841 (両側検定,危険率 5%)

から,AD群とBC群の間には有意な差があると云えます.
したがって,「例題 11」での有意差はAD群とBC群の有病率の差を反映していると云えます.

「注釈」
  1. KAI2分布の有意水準(α)は上側にのみ設定されているが, 考え方としては両側での検定と考えて良い.
    もし,対立仮設(H1)において、「小さいと云えるか」または「大きと云えるか」の片側検定を問題にするときは, Z(α/2)2=KAI2(1,α)の関係を利用してKAI02≧KAI2(1,2α), あるいはKAI02<KAI2(1,2α)について判定すれば良い.
  2. 有意な差があると判断されたら,2×2分割表(4.3.1.参照)に分けて有意差の組合せを調べる.

B.傾向を有するとき.
m×2分割表の「一般形式」において要因(Ai)が連続量の等間隔, 例えば度数分布の級間 「1章 (1.3.1)参照」のように整理されているとき,そして,その出現率(Pi)に一定の直線関係が見られるときに適用します.
これは、Pi=aXi+b の1次線形式から求められる理論出現率との差を検定するものです.

[一般形式]
要因(A)要因(B)
階級値代表値特性あり特性なし小計特性の出現率
a1〜a2X1f11f12f1.P1=f11/f1.
a2〜a3X2f21f22f2.P2=f21/f2.
..〜aiXifi1fi2fi.Pi=fi1/fi.
..〜amXmfm1fm2fm.Pm=fm1/fm.
小計Xf.1f.2TPbar=f.1/T

fij はそれぞれの要因での出現率,fi. 及び f.j は各小計,T は総計です.

[検定の手順]
1.検定の問題を明かにする.
「A群と出現率間に直線関係があるか?」

2.仮設の設定を行う.
帰無仮設(H0):linearity=0
対立仮設(H1):linearity≠0

3.危険率(100α%)を設定する.
両側検定における有意水準:α

4.検定統計量(KAIι2 , KAIa2)を計算する.

要因(A)の代表値をXi,その出現率をPiとするときの線形関係は,

平均値(Xbar)=狽i・Xi/T
勾 配(a^)={杷i.(Pi-Pbar)(Xi-Xbar)}/{杷i.(Xi-Xbar)2
切 片(b^)=Pbar−a^・xbar

から,P^=a^・Xi+b^ の1次式で示されます.
そして,その検定は1次式への当てはめの良さを表わす次式のKAIι2(linearity)と勾配KAIa2(slope )によって行います.

KAIι2={杷i.(Pi-P^i)2}/{P(1-Pbar)}
KAIa2={a2・杷i.(Xi-Xbar)2}/{P(1-Pbar)}

5.統計的判定を行う. 注釈表示

KAIι2<KAI2(m-2,α)ならば,「危険率100α%で直線関係がある」
KAIι2≧KAI2(m-2,α)ならば,「危険率100α%で直線関係がない」

KAIa2<KAI2(1,α)ならば,「危険率100α%で勾配(a=0)である」
KAIa2≧KAI2(1,α)ならば,「危険率100α%で勾配(a≠0)である」

なお,KAI2(m-2,α),KAI2(1,α)は表計算ソフト(エクセル)から求めると良いでしょう.
求め方は,例題を参照して下さい.

[ 例題12 ]
安静時の心電図に以上を認めない成人に対して,毎時9.6 Km/h のトレードミル運動を実施し,運動中心電図の臨床的に有意な ST・T 降下または上昇の出現率を調べました.
その結果を表18 のm×2分割表に整理しました.運動時間とST・T異常出現率の関係を検定してみましょう.

表18 のm×2分割表から,検定統計量(KAIι2)は,次により計算します.

表18 運動時間とST・T異常出現率の関係
要因(A)要因(B)
階級値代表値特性あり特性なし小計異常出現率
0.5〜1.51.02981000.02
...〜2.52.03971000.03
...〜3.53.04961000.04
...〜4.54.0545500.10
...〜5.55.0842500.16
..22375T=400Pbar=0.055

平均運動時間(Xbar)は,
bar=杷i.・Xi/T であるので,

1.0×100=100
2.0×100=200
3.0×100=300
4.0× 50=200
5.0× 50=250
計 杷i.・Xi=1050 から,

bar=杷i.・Xi/T=1050/400=2.625 となります.

次に,運動時間と出現率の共変動(Stp:共変動については6章で述べます)は,
Stp=杷i.・(Pi-Pbar)(Xi-Xbar) であるので,

100×(0.02-0.055)(1.0-2.635)= 5.6875
100×(0.03-0.055)(2.0-2.625)= 1.5625
100×(0.04-0.055)(3.0-2.625)=-0.5625
50×(0.10-0.055)(4.0-2.625)= 3.09375
50×(0.16-0.055)(5.0-2.625)=12.46875
計 Stp=杷i.・(Pi-Pbar)(Xi-Xbar)=22.25

となります.そして,運動時間の変動(St) 「 2章の偏差平方和を参照して下さい 」は,

St=杷i・(Xi-Xbar)2 であるので,

100×(1.0-2.625)=264.0625
100×(2.0-2.625)= 39.0625
100×(3.0-2.625)= 14.0625
50×(4.0-2.625)= 94.53125
50×(5.0-2.625)=282.03125
計 St=杷i.・(Xi-Xbar)2=693.75

となります.
これから,勾配係数(a^)と切片係数(b^)は次のように計算できます..
a^=Stp/St =22.25/693.75= 0.0321
b^=P^-a^・Xbar=0.055−0.0321×2.625=−0.0293

よって,運動時間(Xi)と ST・T 異常の出現率(P^i)の関係は,
P^i=0.0321Xi−0.0293

の1次式で示すことができます.

ここで,この1次式への当てはめの良さは,次により求めることができます.
予測出現率(P^i)は, 
P^1=0.0321×1.0−0.0293=0.0028
P^2=0.0321×2.0−0.0293=0.0349
P^3=0.0321×3.0−0.0293=0.067
P^4=0.0321×4.0−0.0293=0.0991
P^5=0.0321×5.0−0.0293=0.1312

実測出現率と予測出現率の差の変動(Sp)は,
Sp=Σfi・(Pi-P^i)2であるので,

100×(0.02-0.0028)^2=0.02958
100×(0.03-0.0349)^2=0.0024
100×(0.04-0.067)^2=0.0729
50×(0.10-0.0991)^2=0.00004
50×(0.16-0.1312)^2=0.04147
計(SP)=杷i・(Pi-P^i)2=0.14639

となります.
これから検定統計量(KAIι2)は,次のように計算されます

KAIι2=Sp/P(1−Pbar)=0.1464/(0.055(1−0.055))=2.817

これは,
KAIι2=2.817<KAI2(3,0.05)=7.8147(両側検定,危険率5%)
{KAI2(3,0.05)は表計算ソフト「エクセル」から,[=CHIINV(0.05,3)]より求めます.以下,同様にして求めて下さい.}

であり,危険率5%で有意と云えません.すなわち,

運動時間と臨床的に有意なST・T 降下または上昇の出現率との間には,1次式(P^i=0.0321xi−0.0293)で示される直線関係があると推測されます.

勾配(a=0)の検定は,KAIa2を求め検定すれば良いでしょう.ここでは1次式から勾配が「ゼロ」でないことが分かりますので省略します.

以上の計算は、次の表計算ソフト「エクセル」で確認することが出来ます。

関数式による方法

「注釈」
  1. ここでは両側検定とする.なお,全体の検定統計量(KAIT2)はKAIT2=KAIι2+KAIa2となる.
    統計的判定は「A.一般的なとき」と同じである.

戻る     次へ     目次へ     TOPへ