５章（平均値を比較する）

２つの母集団からとられた２つの標本であっても，その平均値を異にする場合とか，平均値は同じでもその分布の状態（バラツキ）が異なる場合もあります.
実際の医学統計では，２つの母集団での母分散（σ²）が未知のことが多く，標本のバラツキからその標本がとられた母集団のバラツキを検定したり推定することの方が多いと云えます．

5.2.1. 分散比のとき．
２つの標本から２つの母集団における母分散（σ²）が等しいか，あるいは異なっているかを検定します．
これは平均値に関する検定をおこなうときに，最初におこなう大切な手法です．
通常，医学において２つの標本の検定を行うとき，

「平均値の差」だけを問題にしているのか？
「バラツキの差」を問題にしているのか　？
「平均値の差」と「バラツキの差」の両方を問題にしているのか？

を考えなければなりません．

［検定の手順］
(1)検定の問題を明らかにする．
.....「２つの標本のバラツキは等しいか？」

(2)仮設の設定を行う．
.....帰無仮説（Ｈ₀）：σ_A²＝σ_B²
.....対立仮説（Ｈ₁）：σ_A²≠σ_B² （両側検定のとき）
.....対立仮説（Ｈ₁）：σ_A²＞σ_B² またはσ_A²＜σ_B² （片側検定のとき）

(3)危険率（100α％）を設定する．
両側検定の有意水準：α／2
片側検定の有意水準：α

検定統計量（Ｆ1，Ｆ2）を計算する. 注釈表示

片側検定で対立仮説（Ｈ₁）がσA＞σBのときは検定統計量（Ｆ1）をσ_B＞σ_Aのときは検定統計量（Ｆ2）を用いる。

.....Ｖ_A≧Ｖ_B　ならば，Ｆ1＝Ｖ_A／Ｖ_B　
.....Ｖ_B＞Ｖ_A　ならば，Ｆ2＝Ｖ_B／Ｖ_A　

ここで、Ｖ_A＝Ａ群の標本分散：Ｖ_B＝Ｂ群の標本分散　である。

統計的判定を行う. 注釈表示

分散比の検定において有意、すなわち「バラツキが異なる」と判断されたとき、それは「同一の母集団からとられたデータとは云えない」と結論ずける前に、
a)飛び離れた異常データがないか？
b)標本間のデータ数が違い過ぎていないか？
c)データの分布が正規分布から、かけ離れ過ぎていないか？
などを検討すべきである。

［両側検定のとき］
.....Ｆ1＜F(φA,φB,α／2)または、Ｆ2＜F(φB,φA,α／2）ならば、
..... 「危険率100α％でバラツキに差がない」

.....Ｆ1≧F(φA,φB,α／2）または、Ｆ2≧F(φB,φA,α／2）ならば、　　　　　　　　　　　
.....「危険率100α％でバラツキに差がある」

［片側検定のとき］
.....Ｆ1≧F(φA,φB,α／2）または、Ｆ2≧(φB,φA,α／2）ならば、　　　　　　　　　　　
.....「危険率100α％でバラツキ大きい（小さい）」

但し、φA＝ｎ_A－1、φB＝n_B－1（ｎ_A＝Ａ群のデータの個数、ｎ_B＝Ｂ群のデータ個数）である。

なお，Ｆ（φＡ,φＢ,α／2）、Ｆ（φB,φA,α／2 ）はＦ分布表「表計算ソフト（エクセル）」から求めます。
求め方は「例題」を参考にして下さい。

100（1－α）％の信頼限界を求める。
上限値：
.....Ｆ（φB,φA,α／2）× (ＶA／ＶB)

下限値：
.....(ＶA／ＶB)／Ｆ(φA,φB,α／2)

［例題19］
ある企業検診での年代別の収縮期血圧が次のようであった。それぞれの年代で血圧のバラツキに差があると云えるか検定してみます。
（Ａ）は年齢 30～39才、30名の血圧の平均値Ｘ^bar_A＝122.5 mmHg、標準偏差ｓ_A＝ 10.85 mmHg である。
（Ｂ）は年齢 40～49才、20名の血圧の平均値Ｘ^bar_B＝133.4 mmHg、標準偏差ｓ_B＝ 12.24 mmHg である。
（Ｃ）は年齢 50～59才、10名の血圧の平均値Ｘ^bar_C＝131.0 mmHg、標準偏差ｓ_C＝ 21.4 mmHg である。

最初に各標本間の分散比の検定を行います。
（Ａ）と（Ｂ）のバラツキは S_A＜S_Bですので検定統計量（Ｆ2）を用います。

Ｆ2＝S_B²／S_A²＝12.24^2／10.85^2＝149.82／117.72＝1.273

したがって、
Ｆ2＝1.273＜Ｆ(19 , 29 , 0.05／2）＝ 2.231（両側検定、危険率５％）

から、有意な差がないと云えます。すなわち、（Ａ）と（Ｂ）の分散は等しいと判断されます。

F(19,29,0.025）の値は表計算ソフト（エクセル）から次により求めます。
「挿入(T)」→「関数（Ｆ）」→「統計」→「ＦＩＮＶ」→{(確率＝0.025,自由度1＝19,自由度2＝29)}

次に、

（Ｂ）と（Ｃ）の検定統計量（Ｆ2）は，　
Ｆ2＝S_C²／S_B²＝21.4^2／12.24^2＝457.96／149.82＝3.057

したがって、
Ｆ2＝3.057>Ｆ(9 , 19 , 0.05／2）＝ 2.880 （両側検定、危険率５％）

から、有意な差があると云えます。すなわち、（Ｂ）と（Ｃ）の分散は異なると判断されます。

F(9,19,0.025）の値は表計算ソフト（エクセル）から次により求めます。
「挿入(T)」→「関数（Ｆ）」→「統計」→「ＦＩＮＶ」→{(確率＝0.025,自由度1＝9,自由度2＝19)}

分散比の推定は（Ａ・Ｂ）と（Ｃ）は等分散でないので推定できません。ここでは、（Ａ）と（Ｂ）の母分散比を推定してみましょう。

95％信頼限界3）は次の通りです。
上限値：
（S_B²／S_A²）×Ｆ（φA , φB , 0.05／2）＝（149.82／ 117.72）×Ｆ(29 , 19 , 0.025）
＝1.273×2.402＝3.058

下限値：
（S_B²／S^A²）×1／Ｆ（φB , φA , 0.025）＝ (149.82／117.72）×1／Ｆ(29 , 19 , 0.025）
＝1.273×1／2.231＝0.571

したがって、母分散比は、

0.571≦σ_B²／σ_A²≦3.058（分散　　）
0.76 ≦σ_B ／σ_A ≦1.75（標準偏差）

の範囲と推定されるので、母集団での（Ｂ）の標準偏差は大体（Ａ）の1.25 倍程度でしょう。

F(9,19,0.025）の値は表計算ソフト（エクセル）から次により求めます。
「挿入(T)」→「関数（Ｆ）」→「統計」→「ＦＩＮＶ」→{(確率＝0.025,自由度＝29,自由度2＝19)}
{(確率＝0.025,自由度＝19,自由度2＝29)}

「注釈」

片側検定で対立仮説（Ｈ₁）がσ_A＞σ_Bのときは検定統計量（Ｆ1）をσ_B＞σ_Aのときは検定統計量（Ｆ2）を用いる。
分散比の検定において有意、すなわち「バラツキが異なる」と判断されたとき、それは「同一の母集団からとられたデータとは云えない」と結論ずける前に、
ａ）飛び離れた異常データがないか？
ｂ）標本間のデータ数が違い過ぎていないか？
ｃ）データの分布が正規分布から、かけ離れ過ぎていないか？
などを検討すべきである。
分散比の 95％信頼限界は、Ｆ分布の下側（α＝0.975）がＦ分布表にないので、Ｆ（φ_A,φ_B,α）＝１／Ｆ（φ_B,φ_A,α）の関係を利用する。

戻る　　　　　次へ　　　　　目次へ　　　　　 TOPへ