5.3.2 多群間の平均値を比較するとき.
1元配置分散分析の手法によるF検定で,標本間に有意な差があると判断されたとき,それは,
すべての標本間の平均値に有意な差があると云う意味ではありません.
有意な差を示す標本間を調べる手法を多重比較と云い,その代表的な手法に次のものがあります.
(1)最小有意差のよるLSD法
(2)FisherのLSD法
(3)ダンカンの方法
(4)ボンフェローニの方法
(5)シェフェの方法
(6)ダネットの方法
(7)ウィリアムズの方法
(8)チューキーのHSD法
など数多くの方法があり、どの方法を採用すべきか迷いますが(1)(2)(3)の方法は使わないほう良いようです。
もし、各群のデータ数が同じであれば「(8)チューキーのHSD法」を選択するのが無難です。
そこで「(8)チューキーのHSD法」について説明しましょう.
「チューキーのHSD法」では母集団の分布は正規分布とし全ての群の母分散は等しいと仮定します。そして、
全ての群間の比較では誤差分散によるt0値を求め「スチューデント化された範囲の分布」と比較します。
[一般形式]
[検定の手順]
(1)検定の問題を明かにする.
「対比する標本間の平均値に差があるか?」
(2)仮説の設定を行う.
帰無仮設(H0):μ0=対比する他群のμi
対立仮設(H1):μ0≠対比する他群のμi
(3)危険率(100α%)を設定する.
有意水準:α (両側仮説)
(4)検定統計量(t0)を計算する.
一元配置分散分析表から次の検定対象データを用います。
一元配置分散分析は表計算ソフト「エクセル」から求めます。
求め方は「ツール」→「分析ツール」→「分散分析:一元配置」を用います。
ここでの検定に必要なデータは次の通りです,
n=標本の数
r=水準の数
Xibar=各標本の平均値
df=分散分析表の誤差(グループ内)の自由度
Ve=分散分析表の誤差(グループ内)の分散
q(α,r,df)=スチューデント化された範囲の値(統計数値表から求める)
to=q*sqrt(Ve/n)
(5)統計的判定を行う.
|]ibar-]jbar|<to ならば,「危険率100α%で有意な差がない」
|]ibar-]jbar|≧to ならば,「危険率100α%で有意な差がある」
[例題 26]
気管支喘息患者の病態によってIgE血清値の平均値の異なることが「例題25」の分散分析で明らかになりました.
では,平均値に差のある標本間はどれかを調べてみましょう.検定に必要な統計量は次の通りです.
アトピー型(A標本):nA=5,]Abar=702
混合型 (B標本):nB=5,]Bbar=612
感染型 (C標本):nC=5 ,]Cbar=214
データの総数 : N=15
標本の水準数 : k=3
級内分散 : Ve=21140
自由度 : DF=(15-3)=12
有意水準 : α=0.05
このデータをもとに各群の対比較を考えるために平均値の差を以下の様な表にまとめてみましょう.
d | X1 | X2 | X3 |
X1 | - | 90 | 488 |
X2 | - | - | 398 |
X3 | - | - | - |
計算は次のように行います。
Student化された範囲(q)は、
q(α,k,DF)=q(0.05,3,12)=3.7729(統計分布表から求める)
HSDのto=q(α,k,DF)×sqrt(Ve/k)=3.7729×sqrt(21140/5)=245.33
この[HSDのto]の値より上記の表の値が大きければ、有意水準(α)=0.05で有意な差があると言えます。
したがって、
]1:]2 は 90<245.33 ですので「有意差なし」
]1:]3 は 488>245.33 ですので「有意差あり」
]2:]3 は 398>245.33 ですので「有意差あり」
となります。すなわち,
アトピー型と混合型のIgEの平均には有意差がなく、
アトピー型と感染型及び混合型と感染症型のIgEの平均に有意差があると判断されます.
誤用を避けるために!
血清IgE 値は非正規分布であることが知られています.チューキーのHSD法 では正規性、等分散の仮定のもとに検定が行われます。
したがって、血清IgE 値は自然対数変換をおこない正規分布近似とする必要があります。
このことから、「例題25」の分散分析でのF検定の結果は感染型での差を示したものと云えます.
戻る 次へ 目次へ TOPへ