- t分布は「スチューデントのt分布」と呼ばれる.「スチューデント」は,t分布を発表したゴゼット(1876年〜1936年)のペンネームである。
5章 平均値を比較する。
平均値の比較は医学関連でしばしば用いられる検定です。ここでは、次の検定に必要な手法について述べることにしましょう。
これらは、母集団での母平均(μ)に有意な差があるかどうかの「検定と推定」の問題に対処するものです。
5.1. 1標本の検定と推定の仕方。
標本から得られた平均値(Xbar)は、母集団での母平均(μ)の1点を推定したことになります。
これを点推定値といい、同一母集団から繰り返しとった標本から、いくつかの平均値(Xbar)を求めれば、母平均(μ)を中心にバラツキがみられるはずです。
このバラツキの範囲を95%信頼区間で考えるなら、100標本での平均値のうち、95標本の平均値はこの区間内にいると言えます。
したがって、母平均(μ)、母標準偏差(σ)が分っている正規母集団からの平均値をXbarとするならば、それは3章(3.1.)ですでに述べたように、検定統計量を、
Zo=(Xbar−μ)/(σ/sqrt(n))
とする「検定の問題」となります。
しかし、医学においては母標準偏差(σ)が分らない場合が多く、σの代わりに標本での標準偏差(s)を用いることが多いはずです。
このときの検定統計量はt分布することが知られていますので、ここではt分布での「検定と推定」の手法について説明しましょう。
注釈表示
5.1.1 平均値のとき。
ここでの検定は母分散(σ2)が分らない時に、標本の平均値(Xbar)が母平均値(μ)に等しいかどうかを検定するものです。
[一般形式]
[検定の手順]
(1)検定の問題を明かにする.
.....「標本平均は母集団の平均と等しいか?」
仮説の設定を行う.
.....帰無仮説(H0):Xbar=μ
.....対立仮説(H1):Xbar≠μ(両側検定のとき)
.....対立仮説(H1):Xbar>μ または Xbar<μ(片側検定のとき)
危険率(100α%)を設定する.
.....両側検定のときの有意水準:α
.....片側検定のときの有意水準:2α
検定統計量(t0)を計算する.
.....t0={abs(Xbar−μ)}/sqrt(V/n)
ここで、「n=データの個数 ,V=不偏分散」 である。
統計的判定を行う.
.....[両側検定のとき]
.....t0<t(n-1,α)ならば,「危険率100α%で有意な差がない」
.....t0≧t(n-1,α)ならば,「危険率100α%で有意な差がある」
.....[片側検定のとき]
.....t0≧t(n-1,2α )ならば,「危険率100α%で大きい(小さい)」
なお,t(n-1,α)はt分布表「表計算ソフト(エクセル)」から求めます.求め方は「例題」を参考にして下さい。
100(1−α)%の信頼限界を求める.
.....上限値:Xbar+t(n−1,α)
.....下限値:Xbar−t(n−1,α)
[例題15]
ある企業の従業員20名(年齢40〜49才)の収縮期血圧の平均値を Xbar=133.8 mmHg,標準偏差をs=11.9 mmHg 「3章(3.1.1.)参照」は,
母集団を想定した1000名の母平均 μ=131 mmHg と差がないと云えるかどうか検定してみましょう.
3章(3.1.1.)では,母分散(σ)が分かっているときに適用するものでした.ここでは,標本の標準偏差(s)を用いて検定します.
血圧の母平均は μ=131 mmHg ですので,その検定統計量(t0)は,
t0=(abs(]bar−μ))/(s/sqrt(n))
=(abs(133.8−131))/(11.9/20)=1.052
となります.よって,
t0=1.052<t(19,0.05)=2.093 (両側検定,危険率 5%)
から,標本の平均値(]bar)と母平均(μ)の間に有意な差がないと云えます.
なお,標本から推定される母平均(μ)の 95%信頼限界は次の通りです.
]bar±t(n-1,α)×s/sqrt(n)=133.8±2.093×11.9/sqrt(20) =133.8±5.5693
よって,その信頼区間は 128.231〜139.369 mmHg と推定されます.
「例題16」
平均年齢 32才(20名)の収縮期血圧の平均値を ]bar=122.5 mmHg,標準偏差をs=10.2 mmHgとするとき、その平均値(]bar)は母平均値 μ=131 mmHg より低いと云えるかどうか検定してみましょう.
検定統計量(t0)は先の公式から、
t0 =abs(122.5−131)/(10.2/sqrt(20))=3.727
よって,
t0=3.727>t(19,0.1)=1.729 (片側検定,危険率 5%)
から,平均年齢 32才の平均値は,母平均値より低い(片側検定)と云えます.
5.1.2. 母分散のとき.
標本から得られた標本分散(v)は,母分散(σ2)の点推定値であり,その信頼限界の推定や検定は KAI2分布を用いて行うことができます.
[一般形式]
[検定の手順]
検定の問題を明かにする.
.....「標本の分散は母集団の分散と等しいか?」
仮説の設定を行う(1,2).
.....帰無仮設(H0):s2=σ2
.....対立仮設(H1):s2≠σ2(両側検定のとき)
.....対立仮設(H1):s2>σ2 または s2<σ2(片側検定のとき)
危険率(100α%)を設定する.
.....両側検定の有意水準:上側 α/2,下側 1−α/2
.....片側検定の有意水準:s2>σ2 のとき, α
.....片側検定の有意水準:s2<σ2 のとき,1−α
検定統計量(KAI02)を計算する.
KAI02=S/σ2
ここで、S=標本の偏差平方和 , σ=母分散 を表す。 (2章「2.3.」参照)
統計的判定を行う. 注釈表示
.....KAI02≧KAI0(n−1,α/2)または,KAI02≦KAI2(n−1,1−α/2)ならば,
.....「危険率100α%で有意な差がある」
.....[片側検定のとき]
..... KAII02≧χ0(n−1,α)または,KAI02≦KAI2(n−1,1−α)ならば,
.....「危険率100α%で大きい(小さい)」
但し,n=データの個数です.
100(1−α)% の信頼限界を求める.
.....上限値:S/KAI2(n−1,1−α/2)
.....下限値:S/KAI2(n−1, α/2)
なお,KAI2(n−1,α)は KAI分布表「表計算ソフト(エクセル)」から求めます.求め方は「例題」を参考にして下さい。
[例題17]
ある企業の従業員 20名(年齢40〜49才)の収縮期血圧の標準偏差を s=11.9 mmHg とするとき,母集団を想定した1000名の母標準偏差σ=19.2 mmHg のバラツキとの間に有意な差があるかどうか検定してみよう.
20名の標準偏差s=11.9 から,偏差平方和は S=(n−1)×s=19×11.9=2690.59 ですので,
検定統計量(KAI02)は,
KAI0=((n−1)×s2)/σ2=19×11.9^2/19.2^2=2690.59/368.64=7.299
となります.
また,標本の標準偏差 s=11.9 は母標準偏差 σ=19.2 より明らかに小さいので,ここでは片側検定での仮設「小さいか?」を問題にしてみましょう.
検定は,
KAI02=7.299<KAI2(19 , 1−0.05)=10.117 (片側検定 , 下側危険率 5%)
から,標本の標準偏差(s)は母標準偏差(σ)より小さいと云えます.
また,95%信頼限界は次の通りです.
上限値:
((n−1)×s2)/KAI2(n−1,1−α/2)=19×11.9^2/KAI2(19,1−0.025)
= 2690.59/8.906 = 302.11
下限値:
((n−1)×s2)/KAI2(n−1, α/2)=(19×11.9^2)/KAI2(19, 0.025)
= 2690.59/32.852 = 81.90
よって,
母分散(σ)の信頼区間は 81.90〜302.11 mmHg ですので,母集団での血圧は標準偏差で 9.05〜17.38 mmHg のバラツキがあると推定されます.
なお、ここでは偏差平方和を S=(n−1)×s2 から求めています。
[例題18]
平均年齢40〜49才(20名)の収縮期血圧の標準偏差を s=11.9 mmHgとするとき,同年代1000名の母集団を仮定した母標準偏差 μ=10.85 mmHg と有意な差があるか検定してみます.
ここでは,積極的に片側検定を用いられないので,両側検定を行うことにします.検定統計量(KAI>02)は,
KAI02 =(n−1)s2/σ2=19×11.9/10.85^2= 2690.59/117.72=22.86
となり,
KAI02=22.86>KAI0(19, 1- 0.05/2)= 8.906 (両側検定,危険率5%)
KAI02=22.86<KAI0(19, 0.05/2)=32.852 (両側検定,危険率5%)
から,両者の間には有意な差がないと云えます.