戻る     次へ     目次へ

5章 平均値を比較する。

平均値の比較は医学関連でしばしば用いられる検定です。ここでは、次の検定に必要な手法について述べることにしましょう。

これらは、母集団での母平均(μ)に有意な差があるかどうかの「検定と推定」の問題に対処するものです。

5.1. 1標本の検定と推定の仕方。
標本から得られた平均値(Xbar)は、母集団での母平均(μ)の1点を推定したことになります。
これを点推定値といい、同一母集団から繰り返しとった標本から、いくつかの平均値(Xbar)を求めれば、母平均(μ)を中心にバラツキがみられるはずです。
このバラツキの範囲を95%信頼区間で考えるなら、100標本での平均値のうち、95標本の平均値はこの区間内にいると言えます。
したがって、母平均(μ)、母標準偏差(σ)が分っている正規母集団からの平均値をXbarとするならば、それは3章(3.1.)ですでに述べたように、検定統計量を、

Zo=(Xbar−μ)/(σ/sqrt(n))

とする「検定の問題」となります。
しかし、医学においては母標準偏差(σ)が分らない場合が多く、σの代わりに標本での標準偏差(s)を用いることが多いはずです。
このときの検定統計量はt分布することが知られていますので、ここではt分布での「検定と推定」の手法について説明しましょう。 注釈表示

5.1.1 平均値のとき。
ここでの検定は母分散(σ2)が分らない時に、標本の平均値(Xbar)が母平均値(μ)に等しいかどうかを検定するものです。

[一般形式]

[検定の手順]
(1)検定の問題を明かにする.
.....「標本平均は母集団の平均と等しいか?」

仮説の設定を行う.
.....帰無仮説(H0):Xbar=μ
.....対立仮説(H1):Xbar≠μ(両側検定のとき)
.....対立仮説(H1):Xbar>μ または Xbar<μ(片側検定のとき)

危険率(100α%)を設定する.
.....両側検定のときの有意水準:α
.....片側検定のときの有意水準:2α

検定統計量(t0)を計算する.
.....0={abs(Xbar−μ)}/sqrt(V/n)
ここで、「n=データの個数 ,V=不偏分散」 である。

統計的判定を行う.
.....[両側検定のとき]
.....0<t(n-1,α)ならば,「危険率100α%で有意な差がない」
.....0≧t(n-1,α)ならば,「危険率100α%で有意な差がある」    


.....[片側検定のとき]
.....0≧t(n-1,2α )ならば,「危険率100α%で大きい(小さい)」

なお,t(n-1,α)はt分布表「表計算ソフト(エクセル)」から求めます.求め方は「例題」を参考にして下さい。

100(1−α)%の信頼限界を求める.
.....上限値:Xbar+t(n−1,α)
.....下限値:Xbar−t(n−1,α)

[例題15]
ある企業の従業員20名(年齢40〜49才)の収縮期血圧の平均値を Xbar=133.8 mmHg,標準偏差をs=11.9 mmHg 「3章(3.1.1.)参照」は, 母集団を想定した1000名の母平均 μ=131 mmHg と差がないと云えるかどうか検定してみましょう.

3章(3.1.1.)では,母分散(σ)が分かっているときに適用するものでした.ここでは,標本の標準偏差(s)を用いて検定します.

血圧の母平均は μ=131 mmHg ですので,その検定統計量(t0)は,

0=(abs(]bar−μ))/(s/sqrt(n))
=(abs(133.8−131))/(11.9/20)=1.052

となります.よって,

0=1.052<t(19,0.05)=2.093 (両側検定,危険率 5%)
から,標本の平均値(]bar)と母平均(μ)の間に有意な差がないと云えます.


t(19 , 0.05)の値は表計算ソフト(エクセル)から次により求めます。
「挿入(T)」→「関数(F)」→「統計」→「TINV」→{(確率=0.05 , 自由度=19)}

なお,標本から推定される母平均(μ)の 95%信頼限界は次の通りです.

]bar±t(n-1,α)×s/sqrt(n)=133.8±2.093×11.9/sqrt(20) =133.8±5.5693

よって,その信頼区間は 128.231〜139.369 mmHg と推定されます.

「例題16」
平均年齢 32才(20名)の収縮期血圧の平均値を ]bar=122.5 mmHg,標準偏差をs=10.2 mmHgとするとき、その平均値(]bar)は母平均値 μ=131 mmHg より低いと云えるかどうか検定してみましょう.

検定統計量(t0)は先の公式から、

0 =abs(122.5−131)/(10.2/sqrt(20))=3.727

よって,
0=3.727>t(19,0.1)=1.729 (片側検定,危険率 5%)

から,平均年齢 32才の平均値は,母平均値より低い(片側検定)と云えます.

「注釈」
  1. t分布は「スチューデントのt分布」と呼ばれる.「スチューデント」は,t分布を発表したゴゼット(1876年〜1936年)のペンネームである。

5.1.2. 母分散のとき.
標本から得られた標本分散(v)は,母分散(σ2)の点推定値であり,その信頼限界の推定や検定は KAI2分布を用いて行うことができます.

[一般形式]

[検定の手順]
検定の問題を明かにする.
.....「標本の分散は母集団の分散と等しいか?」

仮説の設定を行う(1,2)
.....帰無仮設(H0):s2=σ2
.....対立仮設(H1):s2≠σ2(両側検定のとき)
.....対立仮設(H1):s2>σ2 または s2<σ2(片側検定のとき)

危険率(100α%)を設定する.
.....両側検定の有意水準:上側 α/2,下側 1−α/2
.....片側検定の有意水準:s2>σ2 のとき, α
.....片側検定の有意水準:s2<σ2 のとき,1−α

検定統計量(KAI02)を計算する.
KAI02=S/σ2

ここで、S=標本の偏差平方和 , σ=母分散 を表す。 (2章「2.3.」参照)

統計的判定を行う. 注釈表示
.....[両側検定のとき]
..... KAI02<KAI2(n−1,α/2)または,KAI02>KAI2(n−1,1−α/2)ならば,
.....「危険率100α%で有意な差がない」

.....KAI02≧KAI0(n−1,α/2)または,KAI02≦KAI2(n−1,1−α/2)ならば,
.....「危険率100α%で有意な差がある」

.....[片側検定のとき]
..... KAII02≧χ0(n−1,α)または,KAI02≦KAI2(n−1,1−α)ならば,
.....「危険率100α%で大きい(小さい)」

但し,n=データの個数です.

100(1−α)% の信頼限界を求める.
.....上限値:S/KAI2(n−1,1−α/2)
.....下限値:S/KAI2(n−1, α/2)

なお,KAI2(n−1,α)は KAI分布表「表計算ソフト(エクセル)」から求めます.求め方は「例題」を参考にして下さい。

[例題17]
ある企業の従業員 20名(年齢40〜49才)の収縮期血圧の標準偏差を s=11.9 mmHg とするとき,母集団を想定した1000名の母標準偏差σ=19.2 mmHg のバラツキとの間に有意な差があるかどうか検定してみよう.

20名の標準偏差s=11.9 から,偏差平方和は S=(n−1)×s=19×11.9=2690.59 ですので,
検定統計量(KAI02)は,

KAI0=((n−1)×s2)/σ2=19×11.9^2/19.2^2=2690.59/368.64=7.299

となります.
また,標本の標準偏差 s=11.9 は母標準偏差 σ=19.2 より明らかに小さいので,ここでは片側検定での仮設「小さいか?」を問題にしてみましょう.
検定は,

KAI02=7.299<KAI2(19 , 1−0.05)=10.117 (片側検定 , 下側危険率 5%)

から,標本の標準偏差(s)は母標準偏差(σ)より小さいと云えます.


KAI2(19,1−0.05) の値は表計算ソフト(エクセル)から次により求めます。
「挿入(T)」→「関数(F)」→「統計」→「CHIINV」→{(確率=0.95 , 自由度=19)}

また,95%信頼限界は次の通りです.

上限値:
((n−1)×s2)/KAI2(n−1,1−α/2)=19×11.9^2/KAI2(19,1−0.025)
= 2690.59/8.906 = 302.11

下限値:
((n−1)×s2)/KAI2(n−1, α/2)=(19×11.9^2)/KAI2(19, 0.025)
= 2690.59/32.852 = 81.90

よって,
母分散(σ)の信頼区間は 81.90〜302.11 mmHg ですので,母集団での血圧は標準偏差で 9.05〜17.38 mmHg のバラツキがあると推定されます.

なお、ここでは偏差平方和を S=(n−1)×s2 から求めています。

[例題18]
平均年齢40〜49才(20名)の収縮期血圧の標準偏差を s=11.9 mmHgとするとき,同年代1000名の母集団を仮定した母標準偏差 μ=10.85 mmHg と有意な差があるか検定してみます.

ここでは,積極的に片側検定を用いられないので,両側検定を行うことにします.検定統計量(KAI>02)は,

KAI02 =(n−1)s2/σ2=19×11.9/10.85^2= 2690.59/117.72=22.86

となり,

KAI02=22.86>KAI0(19, 1- 0.05/2)= 8.906 (両側検定,危険率5%)
KAI02=22.86<KAI0(19, 0.05/2)=32.852 (両側検定,危険率5%)

から,両者の間には有意な差がないと云えます.

「注釈」
  1. 医学において χ2分布を用いる検定の主なものは,分割表による検定「4章(4.3.)」や適合度の検定,そして,ここでの「母分散の検定」であろう.
    分割表による検定では KAI2(φ,α)によって両側仮説の検定を行った.しかし,
    母分散の検定では KAI2(φ,α/2)または KAI2(φ,1-α/2)によって両側仮説の検定を行った.
    そして,このときの有意水準が共に α であることなどに注意しなければならない.
  2. KAI2分布における上側・下側のパーセント点は, KAI2分布のどちら側の「すそ」を考えるかである. しかし通常の検定では,s2<σ2 ならば KAI2も小さい値をとり,s2<σ2 はより確かなものとなるから片側検定を積極的に用いても差し支えない.

戻る     次へ     目次へ     TOPへ