５章（平均値を比較する）

複数の条件のもとで複数の関連する標本を対比させたとき，標本がその条件に対して独立，すなわち無関係であるかどうかを検定する手法です．例えば,
5.3.1. 対応のないとき（１元配置分散分析）」での「例題25」では，気管支喘息の病態を「アトピー型」「混合型」「感染型」の３つに分け，それぞれの血清IgE 値について検定しました．このとき,
要因として「病態」と「年齢」の２因子の関係を考えたとき，年齢と云う因子に対して病態が全く無関係（独立）であれば，病態ごとのＩgＥ値の変動は年齢に影響されないでしょう．
だから IgE 値の変動は病態の差のみを表すことになります．要因としての「年齢」は我々の色々な知識や経験にもとづき，しばしば,いくつかの年代によって層別（ブロック化）されることの多い因子の１つです．
この様な因子を我々はブロック因子と呼んでいます．ＩgＥ値に影響を及ぼしそうな要因は「年齢」以外にも色々と思い付くはずです．

２つの要因と要因間の検定は，等分散性と正規性の仮定のもとに２元配置の分散分析の手法を用いて行うことができます．

［一般形式］

[検定の手順]

1. 検定の問題を明かにする．
「２つの要因と要因間に差があるか？」

2. 仮説の設定を行う．注釈表示

1．μ_ijは表34 の「２元配置の記号」に示すようなｎ行ｍ列からなる２つの要因（Ａ・Ｂ）での母平均を表す。

........帰無仮設（H0）：μ_i1＝μ_i2＝・・・＝μ_ij・・・＝μ_im
......................: μ_1j＝μ_2j＝・・・＝μ_ij・・・＝μ_nj
........対立仮設（H1）：μ_i1≠μ_i2≠・・・≠μ_ij・・・＝μ_im
......................: μ_1j≠μ_2j≠・・・≠μ_ij・・・＝μ_nj

3. 危険率（100α%）を設定する．
........片側検定の有意水準：α　（両側仮設と同等）

4. 検定統計量（FA，FB）を計算する．
........２つの要因からなる２因子のデータを，
..............n＝因子（A: n 行）の水準数　
..............m＝因子（B：m 列）の水準数　
..............N＝全データの個数（n × m）　
..............Xij＝データ（測定値）
..............TA＝因子（A：行水準）のデータの合計
..............TB＝因子（B：列水準）のデータの合計
.........................(i＝1,2,･･･,n：j＝1,2,･･･,m)

とするとき，２元配置のデータ形式は表34 の記号で表わされます．

２元配置のデータ形式注釈表示

２元配置法におけるデータの構造は　Ｘ_ij＝μ^bar＋（μ_i.－μ^bar）＋（μ_.j－μ^bar）＋εであり， μは全体の母平均，μ_i.は水準Ａの母平均，μ_.jは水準Ｂの母平均，ε は誤差を表す．

表34　２元配置のデータ形式．

因子(A・B）Ｂ1 Ｂ2 ・・Ｂj ・・Ｂm 計

Ａ1 Ｘ11 Ｘ12 ・・Ｘ1j ・・Ｘ1m Ｔ1

Ａ2 Ｘ21 Ｘ22 ・・Ｘ2j ・・Ｘ2m Ｔ2

：：：・・：・・：：

Ａi Ｘi1 Ｘi2 ・・Ｘij ・・Ｘim Ｔi

：：：・・：・・：：

Ａn Ｘn1 Ｘn2 ・・Ｘnj ・・Ｘnm Ｔn

計Ｔ1 Ｔ2 ・・Ｔj ・・Ｔm Ｔ（総計）

表34　２元配置のデータ形式．
因子(A・B）	Ｂ1	Ｂ2	・・	Ｂj	・・	Ｂm	計
Ａ1	Ｘ11	Ｘ12	・・	Ｘ1j	・・	Ｘ1m	Ｔ1
Ａ2	Ｘ21	Ｘ22	・・	Ｘ2j	・・	Ｘ2m	Ｔ2
：	：	：	・・	：	・・	：	：
Ａi	Ｘi1	Ｘi2	・・	Ｘij	・・	Ｘim	Ｔi
：	：	：	・・	：	・・	：	：
Ａn	Ｘn1	Ｘn2	・・	Ｘnj	・・	Ｘnm	Ｔn
計	Ｔ1	Ｔ2	・・	Ｔj	・・	Ｔm	Ｔ（総計）

表34 から次の平方和を計算します．
全平方和（全変動）
Ｓ_T＝∑∑Ｘ_ij²－Ｔ²／Ｎ

級間平方和（級間変動）
Ａ因子：Ｓ_A＝∑Ｔ_Ai²／ｍ－Ｔ²／Ｎ
Ｂ因子：Ｓ_B＝∑Ｔ_Bj²―Ｔ²／Ｎ

誤差平方和（級内変動）
Ｓ_E＝Ｓ_T－Ｓ_A－Ｓ_B

以上の計算は表35 の２元配置分散分析表にまとめ，検定統計量（ＦA，ＦB）を求めます．

表35 ２元配置の分散分析表

要因平方和(Ｓ) 自由度(DF) 分散(Ｖ) Ｆ比

因子(Ａ) Ｓ_A DF_A=ｎ－1 Ｖ_A=Ｓ_A/DF_A Ｆ_A=Ｖ_A／Ｖ_E

因子(Ｂ) Ｓ_B DF_B=ｎ－1 Ｖ_B=Ｓ_B/DF_B Ｆ_B=Ｖ_B／Ｖ_E

誤差(Ｅ) Ｓ_E DF_E=(n-1)(m-1) Ｖ_E=Ｓ_E/DF_E ..

全体(Ｔ) Ｓ_T DF_T=N－1 .. ..

表35 ２元配置の分散分析表
要因	平方和(Ｓ)	自由度(DF)	分散(Ｖ)	Ｆ比
因子(Ａ)	Ｓ_A	DF_A=ｎ－1	Ｖ_A=Ｓ_A/DF_A	Ｆ_A=Ｖ_A／Ｖ_E
因子(Ｂ)	Ｓ_B	DF_B=ｎ－1	Ｖ_B=Ｓ_B/DF_B	Ｆ_B=Ｖ_B／Ｖ_E
誤差(Ｅ)	Ｓ_E	DF_E=(n-1)(m-1)	Ｖ_E=Ｓ_E/DF_E	..
全体(Ｔ)	Ｓ_T	DF_T=N－1	..	..

5. 統計的判定を行う．
.........Ｆ_A＜Ｆ(DF_A,DF_E,α)ならば，
..............「危険率100％で因子(Ａ)は有意でない」
.........Ｆ_B＜F(DF_B,DF_E,α)ならば，
..............「危険率100％で因子(Ｂ)は有意でない」

.........Ｆ_A≧Ｆ(DF_A,DF_E,α)ならば，
..............「危険率100％で因子(Ａ)は有意である」
.........Ｆ_B≧Ｆ(DF_B,DF_E,α)ならば，
..............「危険率100％で因子(Ｂ)は有意である」

なお，Ｆ(DF_A,DF_E,α）およびは，Ｆ(DF_B,DF_E,α）は（表計算ソフト「エクセル」）から求めれば良いでしょう.
求め方は「例題」を参考にして下さい.

［例題 28 ］
脱コレステロール製剤の投与によって，血清コレステロール値(mg/dl)が有意に低下したかどうかを表43 の６名の成績について検定します.

ここでの検定は１元配置法と間違えやすいので注意してください．
確かに，各標本(Ａ1～Ａ6)が単なるくり返しであれば１元配置法を適用できます．しかし，ここでの標本は６名の個体別に投与前～投与４ケ月後までの対応する時間経過で観測されたデータですので２元配置法を適用します。

「注意」：
同じ個体についていくつかの観測を測定すると、それらはもはや独立しておらず、ANOVAは使用できなくなります.
そこで、この様なときは「反復測定ANOVA」を使用することになりますが、ここでは単純な二元配置分散分析の方法の紹介に留めます．

表36　投与期間とコレステロール値

Ａ/Ｂ前１ケ月２ケ月３ケ月４ケ月

Ａ1 224 230 186 179 172

Ａ2 235 190 190 209 142

Ａ3 220 219 235 217 205

Ａ4 204 195 181 193 195

Ａ5 265 245 225 252 208

Ａ6 180 184 155 136 138

表36　投与期間とコレステロール値
Ａ/Ｂ	前	１ケ月	２ケ月	３ケ月	４ケ月
Ａ1	224	230	186	179	172
Ａ2	235	190	190	209	142
Ａ3	220	219	235	217	205
Ａ4	204	195	181	193	195
Ａ5	265	245	225	252	208
Ａ6	180	184	155	136	138

表計算ソフト「エクセル」による２配置法の分散分析結果を示します．

「関数式」と「分析ツール」による方法

次に，「くり返しのあるとき」の２元配置分散分析について説明します。
「繰り返しのある」２元配置とは，一般に表37 のような記号で示されます. 注釈表示

ここでの２元配置分散分析は，因子(Ａ・Ｂ)でのデータが１つの場合に付いて説明した．これを「くり返しのないとき」と云う．
データが２つ以上あるときには，「くり返しのあるとき」と云い，計算の１部がなる．以下に「くり返しのあるとき」に追加する計算を示す.

２元配置の場合には，２つの要因の因子が病態など特定の因子を意識に取り上げているとき，これを母数模型と云う．
これに対して，因子を無作意に取り上げている場合を変量模型と云う．この様に因子構造の違いによって厳密には検定の方法が異なる．
しかし，医学における要因のほとんどは，先の気管支喘息の例題のように母数模型である．また，要因が２つから３つになれば３元配置が，４つになれば多元配が適用される．
医学における多元配置は，必ずしも適当と云えないので，ここでは取り上げない．

　

表37　「くり返あり」の一般記号

因子(Ａ/Ｂ) Ｂ₁ Ｂ_j Ｂ_m

Ａ₁ Ｘ₁₁₁・・Ｘ_11k Ｘ_1j1・・Ｘ_1jk Ｘ_1m1・・Ｘ_1mk

Ａ_i Ｘ_i11・・Ｘ_i1k Ｘ_ij1・・Ｘ_ijk Ｘ_im1・・Ｘ_imk

Ａ_n Ｘ_n11・・Ｘ_n1k Ｘ_nj1・・Ｘ_njk Ｘ_nm1・・Ｘ_nmk

k＝くり返し数

表37　「くり返あり」の一般記号
因子(Ａ/Ｂ)	Ｂ₁	Ｂ_j	Ｂ_m
Ａ₁	Ｘ₁₁₁・・Ｘ_11k	Ｘ_1j1・・Ｘ_1jk	Ｘ_1m1・・Ｘ_1mk
Ａ_i	Ｘ_i11・・Ｘ_i1k	Ｘ_ij1・・Ｘ_ijk	Ｘ_im1・・Ｘ_imk
Ａ_n	Ｘ_n11・・Ｘ_n1k	Ｘ_nj1・・Ｘ_njk	Ｘ_nm1・・Ｘ_nmk

表37 の「くり返しあり」を，表38 のように「くり返しなし」にします．

表38 くり返しをなくした一般記号

因子(A/B) Ｂ₁ Ｂ_j Ｂ_m

Ａ₁ Ｘ_11. Ｘ_1j. Ｘ_1m.

Ａ_i Ｘ_i1. Ｘ_ij．Ｘ_im．

Ａ_n/td> Ｘ_n1．Ｘ_nj. Ｘ_nm.

Ｘ_ij．＝∑Ｘ_ijk
各要因の各水準における２個以上のデータを合計したものです．
「くり返しをなくしたとき」の一般記号は「くり返しのないとき」と同じになります．そして，平方和の計算と分散分析表を次のように変えます．
Ｓ_T ＝∑∑∑Ｘ_ijk² ― Ｔ²／Ｎ
.....「くり返しあり」のときの全平方和．

Ｓ_AB＝∑∑Ｘ_ij.²／ｋ－Ｔ²／Ｎ
.....「くり返しをなくした」ときの全平方和．
ここで，
Ｎ＝ｎ×ｍ×ｋ，Ｔm＝ｍ×ｋ，Ｔn＝ｎ×ｋ，Ｔ＝データの総合計です．
「くり返しあり」のときの２元配置分散分析表は，表39 のようになります．

表39「くり返しあり」の２元配置分散分析表

要因平方和(S) 自由度(DF) 分散(V) Ｆ比

因子(A) Ｓ_A DF_A＝ｎ－1 Ｖ_A＝Ｓ_A／DF_A Ｆ_A＝Ｖ_A／Ｖ_E

因子(B) Ｓ_B DF_B＝ｍ－1 Ｖ_B＝Ｓ_B／DF_B Ｆ_B＝Ｖ_B／Ｖ_E

交互作用(AB) Ｓ_AB DF_A＊B＝(ｎ―1)(ｍ―1) Ｖ_AB＝Ｓ_AB／DF_AB Ｆ_AB＝Ｖ_AB／Ｖ_E

誤差(E) Ｓ_E DF_E＝ｎｍ(k-1) Ｖ_E＝Ｓ_E／DF_E ..

全体(T) Ｓ_T DF_T＝Ｎ－1 .. ..

表38 くり返しをなくした一般記号
因子(A/B)	Ｂ₁	Ｂ_j	Ｂ_m
Ａ₁	Ｘ_11.	Ｘ_1j.	Ｘ_1m.
Ａ_i	Ｘ_i1.	Ｘ_ij．	Ｘ_im．
Ａ_n/td>	Ｘ_n1．	Ｘ_nj.	Ｘ_nm.

表39「くり返しあり」の２元配置分散分析表
要因	平方和(S)	自由度(DF)	分散(V)	Ｆ比
因子(A)	Ｓ_A	DF_A＝ｎ－1	Ｖ_A＝Ｓ_A／DF_A	Ｆ_A＝Ｖ_A／Ｖ_E
因子(B)	Ｓ_B	DF_B＝ｍ－1	Ｖ_B＝Ｓ_B／DF_B	Ｆ_B＝Ｖ_B／Ｖ_E
交互作用(AB)	Ｓ_AB	DF_A＊B＝(ｎ―1)(ｍ―1)	Ｖ_AB＝Ｓ_AB／DF_AB	Ｆ_AB＝Ｖ_AB／Ｖ_E
誤差(E)	Ｓ_E	DF_E＝ｎｍ(k-1)	Ｖ_E＝Ｓ_E／DF_E	..
全体(T)	Ｓ_T	DF_T＝Ｎ－1	..	..

「くり返しあり」では，交互作用が新たに付け加えられている点に注意して下さい．
交互作用(Ａ×Ｂ) とは因子(Ａ・Ｂ)が重なったときに，特別な意味をもつかどうかの検定です．すなわち，因子(Ａ)の水準の違いで因子(Ｂ)の値が水準によって異なるかどうかです．
例えば，気管支喘息患者について考えるならば，年齢によってＩgＥ値が一様に変化するのではなく，病態によっては「アトピー型」で最も高く，次いで「混合型」，「感染型」の順序であったとしますと，それが年齢が変わるとこれと全く逆になるような関係を意味しています．

［例題28］気管支喘息患者の血清IgE 値を年齢と病態によって分類したところ表40 のようになった．

表40　年齢と病態によるＩgＥ値の分類

病態(A)/年齢(B) 20才以下(B1) 20ー50才(B2) 50才以上(B3)

アトピー型(A1) 800, 900 500, 400 710, 630

混合型(A2) 650, 500 600, 500 360, 130

感染型(A3) 260, 210 200, 250 100, 160

表40　年齢と病態によるＩgＥ値の分類
病態(A)/年齢(B)	20才以下(B1)	20ー50才(B2)	50才以上(B3)
アトピー型(A1)	800, 900	500, 400	710, 630
混合型(A2)	650, 500	600, 500	360, 130
感染型(A3)	260, 210	200, 250	100, 160

病態と年齢によって，あるいは病態と年齢の交互作用に有意な差があるか，どうかを検定します．

表計算ソフト「エクセル」による「くり返しのある」２配置法の分散分析結果を示します．

「関数式」と「分析ツール」による方法

以上のの結果から，ＩgＥ値は確かにアトピー型(Ａ1），混合型（Ａ2），感染型（Ａ3）で異なっており，Ａ1＞Ａ2＞Ａ3 の関係がみられます.
また，年代別でも全体的にＢ1＞Ｂ2＞Ｂ3 の傾向がみられます．しかし，
個々の病態別にみるとアトピー型では異なっており，交互作用の有意差はアトピー型を反映しているようです．

「２元配置分散分析の多重比較について」
２元配置分散分析において有意差が認められれば,要因（A)のａ個の水準間、あるいは,要因（Ｂ）のｂ個の水準間の平均値の差の検定を行い,どの水準のどの二つの平均値の間に差があるかを検定する必要があります.
この様な多重比較については、すでに述べた通りです.ここでは、一対比較以外に有効と言われている「Scheffeの方法」について説明しておきます.

●「繰り返しのないとき」
Ａ水準間：
棄却限界値＝SQRT{DFa×F(DFa,DFe,0.05)×(2×Ve／b)}

Ｂ水準間：
棄却限界値＝SQRT{DFb×F(DFb,DFe,0.05)×(2×Ve／a)}

そして、 ABS(Ⅹ^bar_i.－Ⅹ^bar_i'.)＞＝棄却限界値　ならば、危険率５％で有意差がある.

●「繰り返しのあるとき」
Ａ水準間：
棄却限界値＝SQRT{DFa*×F(DFa,DFe,0.05)×(2×Ve／各Ａ水準間のデータの個数)}

Ｂ水準間：
棄却限界値＝SQRT{DFb×F(DFb,DFe,0.05)×(2×Ve／各Ｂ水準間のデータの個数)}

Ａ×Ｂ水準間：
棄却限界値＝SQRT{(ab-1)×F(ab-1,DFe,0.05)×(2×Ve/各AB水準のデータの個数)}

そして、 ABS(Ⅹ^bar(A_i,B_j)－Ⅹ^barA_i',B_j')＞＝棄却限界値　ならば、危険率５％で有意差がある.

「注釈」

μ_ijは表34 の「２元配置の記号」に示すようなｎ行ｍ列からなる２つの要因（Ａ・Ｂ）での母平均を表す。
２元配置法におけるデータの構造は　Ｘ_ij＝μ^bar＋（μ_i.－μ^bar）＋（μ_.j－μ^bar）＋ε であり， μは全体の母平均，μ_i.は水準Ａの母平均，μ_.jは水準Ｂの母平均，ε は誤差を表す．
ここでの２元配置分散分析は，因子(Ａ・Ｂ)でのデータが１つの場合に付いて説明した．これを「くり返しのないとき」と云う．データが２つ以上あるときには，「くり返しのあるとき」と云い計算の一部が異なる．
２元配置の場合には，２つの要因の因子が病態など特定の因子を意識に取り上げているとき，これを母数模型と云う．これに対して，因子を無作意に取り上げている場合を変量模型と云う．この様に因子構造の違いによって厳密には検定の方法が異なる．しかし，医学における要因のほとんどは，先の気管支喘息の例題のように母数模型である．また，要因が２つから３つになれば３元配置が，４つになれば多元配が適用される．医学における多元配置は必ずしも適当と云えないので，ここでは取り上げない．
任意の対比較では棄却限界値の右辺の計算式が異なるので注意されたい.ここでの対比較は一対比較及び任意に決めた組合せ以外の対比較にのみ採用されたい.

戻る     次へ      目次へ     TOPへ