戻る     次へ     目次へ

5.3.4. 対応のあるとき(2元配置分散分析).

複数の条件のもとで複数の関連する標本を対比させたとき,標本がその条件に対して独立,すなわち無関係であるかどうかを検定する手法です.例えば,
5.3.1. 対応のないとき(1元配置分散分析)」での
「例題25」では,気管支喘息の病態を「アトピー型」「混合型」「感染型」の3つに分け,それぞれの血清IgE 値について検定しました.このとき,
要因として「病態」と「年齢」の2因子の関係を考えたとき,年齢と云う因子に対して病態が全く無関係(独立)であれば,病態ごとのIgE値の変動は年齢に影響されないでしょう.
だから IgE 値の変動は病態の差のみを表すことになります. 要因としての「年齢」は我々の色々な知識や経験にもとづき,しばしば,いくつかの年代によって層別(ブロック化)されることの多い因子の1つです.
この様な因子を我々はブロック因子と呼んでいます. IgE値に影響を及ぼしそうな要因は「年齢」以外にも色々と思い付くはずです.

2つの要因と要因間の検定は,等分散性と正規性の仮定のもとに2元配置の分散分析の手法を用いて行うことができます.

[一般形式]

[検定の手順]

1. 検定の問題を明かにする.
「2つの要因と要因間に差があるか?」

2. 仮説の設定を行う .注釈表示

........帰無仮設(H0):μi1=μi2=・・・=μij・・・=μim
......................: μ1j=μ2j=・・・=μij・・・=μnj
........対立仮設(H1):μi1≠μi2≠・・・≠μij・・・=μim
......................: μ1j≠μ2j≠・・・≠μij・・・=μnj

3. 危険率(100α%)を設定する.
........片側検定の有意水準:α (両側仮設と同等)

4. 検定統計量(FA,FB)を計算する.
........2つの要因からなる2因子のデータを,
..............n=因子(A: n 行)の水準数 
..............m=因子(B:m 列)の水準数 
..............N=全データの個数(n × m) 
..............Xij=データ(測定値)
..............TA=因子(A:行水準)のデータの合計
..............TB=因子(B:列水準)のデータの合計
.........................(i=1,2,・・・,n:j=1,2,・・・,m)

とするとき,2元配置のデータ形式は 表34 の記号で表わされます.

2元配置のデータ形式 注釈表示

表34 2元配置のデータ形式.
因子(A・B)B1B2・・Bj・・Bm
A1X11X12・・X1j・・X1mT1
A2X21X22・・X2j・・X2mT2
・・・・
AiXi1Xi2・・Xij・・XimTi
・・・・
AnXn1Xn2・・Xnj・・XnmTn
T1T2・・Tj・・TmT(総計)

表34 から次の平方和を計算します.
全平方和(全変動)
T=這狽wij2−T2/N

級間平方和(級間変動)
A因子:SA=狽sAi2/m−T2/N
B因子:SB=狽sBj2―T2/N

誤差平方和(級内変動)
E=ST−SA−SB

以上の計算は表35 の2元配置分散分析表にまとめ,検定統計量(FA,FB)を求めます.

表35 2元配置の分散分析表
要因平方和(S)自由度(DF)分散(V)F比
因子(A)ADFA=n−1A=SA/DFAA=VA/VE
因子(B)BDFB=n−1B=SB/DFBB=VB/VE
誤差(E)EDFE=(n-1)(m-1)E=SE/DFE..
全体(T)TDFT=N−1....

5. 統計的判定を行う.
.........A<F(DFA,DFE,α)ならば,
..............「危険率100%で因子(A)は有意でない」
.........B<F(DFB,DFE,α)ならば,
..............「危険率100%で因子(B)は有意でない」

.........A≧F(DFA,DFE,α)ならば,
..............「危険率100%で因子(A)は有意である」
.........B≧F(DFB,DFE,α)ならば,
..............「危険率100%で因子(B)は有意である」

なお,F(DFA,DFE,α)およびは,F(DFB,DFE,α)は(表計算ソフト「エクセル」)から求めれば良いでしょう.
求め方は「例題」を参考にして下さい.

[ 例題 28 ]
脱コレステロール製剤の投与によって,血清コレステロール値(mg/dl)が有意に低下したかどうかを表43 の6名の成績について検定します.

ここでの検定は1元配置法と間違えやすいので注意してください.
確かに,各標本(A1〜A6)が単なるくり返しであれば1元配置法を適用できます.しかし,ここでの標本は6名の個体別に投与前〜投与4ケ月後までの対応する時間経過で観測されたデータですので2元配置法を適用します。

「注意」:
同じ個体についていくつかの観測を測定すると、それらはもはや独立しておらず、ANOVAは使用できなくなります.
そこで、この様なときは「反復測定ANOVA」を使用することになりますが、ここでは単純な二元配置分散分析の方法の紹介に留めます.

表36 投与期間とコレステロール値
A/B1ケ月2ケ月3ケ月4ケ月
A1224230186 179172
A2235190190209142
A3220219235217205
A4204195181193195
A5265245225252208
A6180184155136138

表計算ソフト「エクセル」による2配置法の分散分析結果を示します.

「関数式」と「分析ツール」による方法

次に,「くり返しのあるとき」の2元配置分散分析について説明します。
「繰り返しのある」2元配置とは,一般に表37 のような記号で示されます. 注釈表示

 
表37 「くり返あり」の一般記号
因子(A/B)1jm
1111・・X11k1j1・・X1jk1m1・・X1mk
ii11・・Xi1kij1・・Xijkim1・・Ximk
nn11・・Xn1knj1・・Xnjknm1・・Xnmk

k=くり返し数

表37 の「くり返しあり」を,表38 のように「くり返しなし」にします.

表38 くり返しをなくした一般記号
因子(A/B)1jm
111.1j.1m.
ii1.ij.im.
n/td>n1.nj.nm.

ij.=狽wijk

各要因の各水準における2個以上のデータを合計したものです.
「くり返しをなくしたとき」の一般記号は「くり返しのないとき」と同じになります.そして,平方和の計算と分散分析表を次のように変えます.

T =這這狽wijk2 ― T2/N
.....「くり返しあり」のときの全平方和.

AB=這狽wij.2/k−T2/N
.....「くり返しをなくした」ときの全平方和.

ここで,
N=n×m×k,Tm=m×k,Tn=n×k,T=データの総合計です.

「くり返しあり」のときの2元配置分散分析表は,表39 のようになります.

表39「くり返しあり」の2元配置分散分析表
要因平方和(S)自由度(DF)分散(V)F比
因子(A)ADFA=n−1A=SA/DFAA=VA/VE
因子(B)BDFB=m−1B=SB/DFBB=VB/VE
交互作用(AB)ABDFA*B=(n―1)(m―1)AB=SAB/DFABAB=VAB/VE
誤差(E)EDFE=nm(k-1)E=SE/DFE..
全体(T)TDFT=N−1 ....

「くり返しあり」では,交互作用が新たに付け加えられている点に注意して下さい.
交互作用(A×B) とは因子(A・B)が重なったときに,特別な意味をもつかどうかの検定です.すなわち,因子(A)の水準の違いで因子(B)の値が水準によって異なるかどうかです.
例えば,気管支喘息患者について考えるならば,年齢によってIgE値が一様に変化するのではなく,病態によっては「アトピー型」で最も高く,次いで「混合型」,「感染型」の順序であったとしますと,それが年齢が変わるとこれと全く逆になるような関係を意味しています.

[例題28] 気管支喘息患者の血清IgE 値を年齢と病態によって分類したところ 表40 のようになった.

表40 年齢と病態によるIgE値の分類
病態(A)/年齢(B)20才以下(B1)20ー50才(B2)50才以上(B3)
アトピー型(A1)800, 900500, 400710, 630
混合型(A2) 650, 500600, 500360, 130
感染型(A3)260, 210200, 250100, 160

病態と年齢によって,あるいは病態と年齢の交互作用に有意な差があるか,どうかを検定します.

表計算ソフト「エクセル」による「くり返しのある」2配置法の分散分析結果を示します.

「関数式」と「分析ツール」による方法

以上のの結果から,IgE値は確かにアトピー型(A1),混合型(A2),感染型(A3)で異なっており,A1>A2>A3 の関係がみられます.
また,年代別でも全体的に B1>B2>B3 の傾向がみられます.しかし,
個々の病態別にみるとアトピー型では異なっており,交互作用の有意差はアトピー型を反映しているようです.

「2元配置分散分析の多重比較について」
2元配置分散分析において有意差が認められれば,要因(A)のa個の水準間、あるいは,要因(B)のb個の水準間の平均値の差の検定を行い,どの水準のどの二つの平均値の間に差があるかを検定する必要があります.
この様な多重比較については、すでに述べた通りです.ここでは、一対比較以外に有効と言われている「Scheffeの方法」について説明しておきます.

●「繰り返しのないとき」
A水準間:
棄却限界値=SQRT{DFa×F(DFa,DFe,0.05)×(2×Ve/b)}

B水準間:
棄却限界値=SQRT{DFb×F(DFb,DFe,0.05)×(2×Ve/a)}

そして、 ABS(]bari.−]bari'.)>=棄却限界値 ならば、危険率5%で有意差がある.

●「繰り返しのあるとき」
A水準間:
棄却限界値=SQRT{DFa*×F(DFa,DFe,0.05)×(2×Ve/各A水準間のデータの個数)}

B水準間:
棄却限界値=SQRT{DFb×F(DFb,DFe,0.05)×(2×Ve/各B水準間のデータの個数)}

A×B水準間:
棄却限界値=SQRT{(ab-1)×F(ab-1,DFe,0.05)×(2×Ve/各AB水準のデータの個数)}

そして、 ABS(]bar(Ai,Bj)−]barAi',Bj')>=棄却限界値 ならば、危険率5%で有意差がある.

「注釈」
  1. μijは表34 の「2元配置の記号」に示すようなn行m列からなる2つの要因(A・B)での母平均を表す。
  2. 2元配置法におけるデータの構造は Xijμbar+(μi.μbar)+(μ.jμbar)+ε であり, μは全体の母平均,μi.は水準Aの母平均,μ.jは水準Bの母平均,ε は誤差を表す.
  3. ここでの2元配置分散分析は,因子(A・B)でのデータが1つの場合に付いて説明した.これを「くり返しのないとき」と云う.データが2つ以上あるときには,「くり返しのあるとき」と云い計算の一部が異なる.
  4. 2元配置の場合には,2つの要因の因子が病態など特定の因子を意識に取り上げているとき,これを母数模型と云う.これに対して,因子を無作意に取り上げている場合を変量模型と云う. この様に因子構造の違いによって厳密には検定の方法が異なる.しかし,医学における要因のほとんどは,先の気管支喘息の例題のように母数模型である. また,要因が2つから3つになれば3元配置が,4つになれば多元配が適用される.医学における多元配置は必ずしも適当と云えないので,ここでは取り上げない.
  5. 任意の対比較では棄却限界値の右辺の計算式が異なるので注意されたい.ここでの対比較は一対比較及び任意に決めた組合せ以外の対比較にのみ採用されたい.
戻る     次へ      目次へ     TOPへ