戻る 次へ 目次へ
5.2.2. 平均値のとき.
2つの標本の母集団における差は,「分布のバラツキの差」であっても,母集団での差を推測させます.
要するにバラツキの異いだけを問題にするなら,ここでの検定は必要ないでしょう.
しかし,医学や医学に関連した分野では,ここでの「平均値の差の検定」が,研究の目的にかなっている場合が多いのです.
そのような場合,検定は2つの標本の「等分散性」と「正規性」によって,その手法を異にすることを知らなければなりません.
等分散性の仮定が求められる理由は,一方の標本の分散が大きく,あるいは小さくなればその平均値も大きくなったり,小さくなったりするからです.
また,正規性を前提とするここでの検定で,一方の分布が歪んでいれば,平均値に差が出ると同時に,その分散にも有意な差を生じることが少なくありません.
そのようなときには,適当なデータ変換によって「等分散性」と「正規性」が成り立つようにすべきです.
もし,平均値の差だけを問題にするのであれば,かなり正規分布から離れていない限り,ここでの検定を用いても良いでしょう.
注釈表示
「パラメトリック検定」はデータが正規的であるときに適用する.
|
しかし,正規性の仮定が極めて困難である場合には,積極的に「ノンパラメトリック検定」を用いるべきです.
注釈表示
「ノンパラメトリック検定」はデータが非正規的であるときとか,定性的・半定性的・離散量,あるいは順位尺度のデータなどに広く一般性を持たせて使用できる.
|
特に,順位尺度のデータや十分な数のデータが得られない様な医学研究では有用な統計手法となります.
また,ここでの検定は「等分散性」と「2つの標本の関連性」によって,その検定方法が異なりますので十分に注意して下さい.
すなわち,「2つの標本の関連性」とは,
「A.対応のあるとき」と「B.対応のないとき」
であり,検定にあたってその選択を誤らないように注意して下さい.
A.対応のないとき(パラメトリック検定).
「対応のないとき」とは,2組の一方のデータが高いものは他方でも高く,低いものは他方でも低いと云った特定の傾向が見られないものを云います.
すなわち,2組のデータが相互に無関係な独立な対象からとられているものです.
[一般形式]
[検定の手順]
1. 検定の問題を明かにする.
「2つの標本の平均値に差があるか?」
2. 仮説の設定を行う.
帰無仮設(H0):μA=μB
対立仮設(H1):μA≠μB (両側検定のとき)
対立仮設(H1):μA>μB または μA<μB (片側検定のとき)
3. 危険率(100α%)を設定する.
両側検定の有意水準:α
片側検定の有意水準:2α
4. 検定統計量(t1,t2)を求める.
等分散性の検定(5.2.1.参照)を行って,「バラツキ」が等しいと判断されたら次の「検定統計量(t1)」を用います.
t1=ABS(]barA−]barB|/ SQRT(k(1/nA+1/nB)
K=(nA-1)VA+(nB−1)VB /(nA+nB−2)
等分散性の検定をを行って,「バラツキ」が異なると判断されたら,次の「検定統計量(t2)」を用います.
注釈表示
等分散の検定は「5.2.1.」で説明した.
|
検定統計量(t2)は「ウエルチ検定」と云い,その自由度(φ2)は四五入した整数値を与える.
|
t2=ABS(]A−]B)/SQRT(VA/nA+VB/nB )
nA=A群のデータの個数 , nB=B群のデータの個数
]barA=A群の平均値 , ]barB=B群の平均値
VA=A群の分散 , VB=B群の分散
5. 統計的判定を行う.
[両側検定のとき]
t1<t(φ,α) または t2<t(φ,α) ならば,「危険率100α%で有意な差がない」
t1≧t(φ,α) または t2≧t(φ,α) ならば,「危険率100α%で有意な差がある」
[片側検定のとき]
t1≧t(φ,2α ) または t2≧t(φ,2α ) ならば, 「危険率100α%で大きい(小さい)」
ここで、t(φ,α)はt分布表「表計算ソフト(エクセル)」から求めます.求め方は「例題20」を参考にして下さい.
なお,検定統計量(t1)のときの自由度は,
φ1=nA+nB−2
検定統計量(t2)のときの自由度は,
注釈表示
検定統計量(t2)は「ウエルチ検定」と云い,その自由度(φ2)は四五入した整数値を与える.
|
φ2= 1/{C^2/(n
A-1)+(1−C)^2/(n
B−1)}
ここで,
C=(VA/nA)/(VA/nA+VB/nB)
から求めます.
6. 100(1−α)%信頼限界を求める.
2群のデータの分散が等しいときの,100(1−α)%信頼限界は次により求めます.
注釈表示
データの個数が十分に大きい場合は分散の異いをあまり厳密に考える必要はない.しかし明らかな異いが認められるときその限界値は不正確な推定値となる.
|
上限値:
ABS(]A−]B)+t(φ1 ,α)×SQRT(K(1/nA+1/nB))
下限値:
ABS(]A−]B)−t(φ1 ,α)×SQRT(K(1/nA+1/nB))
「例題20」
ここでは平均値に差があるかを問題にしてみましょう.データは次の通りです。
(A)年齢 30〜39才, 30名の平均値XbarA=122.5 mmHg, 標準偏差sA= 10.85 mmHg
(B)年齢 40〜49才, 20名の平均値XbarB=133.4 mmHg, 標準偏差sB= 12.24 mmHg
(C)年齢 50才〜〜 , 10名の平均値XbarC=139.0 mmHg, 標準偏差sC= 20.4 mmHg
最初に,分散比の検定を行います.(5.2.1.参照)
1. 標本(A:30才代)と標本(B:40才代)の検定.
標本の分散とデータの個数は,
VA=117.72,VB=149.82 ,nA=30,nB=20
であるので ,
F2=VB/VA は次の通りです.
F2=149.82/117.72=1.273
1.273<F(nB-1,nA-1, 0.1/2)= 2.168
F(nB-1,nA-1, 0.1/2) は「表計算ソフト(エクセル)から求めます」.
したがって,
危険率10%で有意な差がないので,等分散と云えるでしょう.
注釈表示
危険率を 10%程まで高くして等分散の検定を行っても良い.何故なられは等分散の結果を見てから本検定を行うからである.
|
2. 標本(B:40才代)と標本(C:50才台代)の検定.
標本の分散とデータの個数は,
VB=149.82 ,VC=416.16
nB=20 ,nC=10
であるので,
F2=VC/VB は次の通りです.
F2=416.16/149.82=2.778
2.778>F(nC-1,nB-1, 0.1/2)=2.423
したがって,
危険率10%で有意な差があると云えるので,等分散と云えないでしょう.
以上から,
標本(A )と標本(B)は「t検定 」
標本(AまたはB)と標本(C)は「ウエルチ検定」
を適用します.
次に本検定である「平均値の差の検定」を行います.
1. 標本(A)と標本(B)の検定.
標本の平均値と分散は,
]A=122.5 ,]B=133.4,VA=117.72,VB=149.82 であるので,検定統計量(t1)は次のようになります.
k={ (nA−1)VA+(nB−1)VB }/(nA+nB−2)= (29×117.72 + 19×149.82)/(30+20−2)
K=130.43
t1=ABS(]A―]B)/SQRT(k×(1/nA+1/nB))=ABS(122.5-133.4)/(130.43×(1/30+1/20))
あるので,
t1=3.306>t(φ1 , 0.05)=2.011 (両側検定,危険率 5%)
φ1=30+20−2
から,有意な差があると云えます.
ここでの平均値の差の 95%信頼限界は,
]A−]B±t(φ1,α)× SQRT(k×(1/nA+1/nB)
=122.5−133.4±t(48 , 0.05)×SQRT(10.869)
=-10.9±2.011×3.297=-10.9±6.63
したがって,標本(A)と標本(B)の血圧のカタヨリは -17.53 〜 -4.27mmHg の範囲内の値と推定されます.
2. 標本(A)と標本(C)の検定.
等分散と云えないので「ウエルチの検定」を行います.
標本の平均値と分散は,
]A=122.5 ,]C=139.0
VA=117.72 ,VC=416.16
であるので,
検定統計量(t2)は次のようになります.
t2=ABS(]A-]C)/SQRT(VA/nA+VC/nC)=ABS(122.5-139.0)/SQRT(117.72/30+416.16/10)
= 2.445
したがって,
t2=2.445>t(φ2,0.05)=2.201 (両側検定,危険率 5%)
φ2=11
から,有意な差があると云えます.
なお,ここでのt分布のパーセント点を与える自由度(φ2)は次により求めます.
C=(VA/nA)/( VA/nA+VC/nC)= 117.72/30/(117.72/30 + 416.16/10)=0.086
φ2=1/(C/nA+(1-C)/nC)=1/(0.086/29+0.914/9)=10.77≠11
3. 標本(B)と標本(C)の検定.
等分散と云えないので「ウエルチの検定」を行います.
標本の平均値と分散は,
]B=133.4 ,]C=139.0
VB=149.82 ,VC=416.16
であるので,
検定統計量(t2)は次のようになります.
検定は「2.」と同様にして,
t2=0.799<t(φ2 , 0.05)= 2.179 (両側検定,危険率 5%)
から,有意な差がないと云えます.なお自由度(φ2)は「2.」と同じように計算します。
次のようになります.
φ2=1/(0.153^2/19+0.847^2/9) =12.3512 ≠ 12
以上「1.」「2.」「3.」の検定結果は図25の様に表すことも出来ます.
図25は3標本間の平均値の検定結果を表わす一方法である.
「N.S.」(Non-Signification)は有意差なしを表わす.
「注釈」
- 「パラメトリック検定」はデータが正規的であるときに適用する.
- 「ノンパラメトリック検定」はデータが非正規的であるときとか定性的・半定性的・離散量,あるいは順位尺度のデータなどに広く一般性を持たせて使用できる.
- 「等分散の検定」は「5.2.1.」で説明した.
- 検定統計量(t2)は「ウエルチ検定」と云い,その自由度(φ2)は四五入した整数値を与える.
- データの個数が十分に大きい場合は分散の異いをあまり厳密に考える必要はない.しかし明らかな異いが認められるとき,その限界値は不正確な推定値となる.
- 危険率を 10%程まで高くして等分散の検定を行っても良い.何故なられは等分散の結果を見てから本検定を行うからである.
- 医学では慣習的にp<0.05のとき「有意」,p<0.01のとき「非常に有意」と云っており,(*)または(**)を付けて表現することもある.
- 図25でのp値はt分布表において,その有意水準(α)で示されるt分布のパーセント点以下で有意と云う意味ではない.[検定の手順]で事前に決めた有意水準(α)よりp値が小さいことを意味している.
- 図25は1因子多群間での多重比較を行ったものではない.これについては「1元配置分散分析(5.3.1)」で説明する.
戻る 次へ 目次へ TOPへ