４章（百分率を比較する）

４章百分率を比較する．

ここでは離散量データが比率（％）で与えられていたり，あるいは分割表に整理されているような場合，例えば，検診スクリーニングでの疾病者発見の比率や，いくつかの組に分けられたデータの特性間の比率の「検定と推定の問題」に適用します．

手法は「３章　比較の考え方を知る」を基礎に，「一般形式」と「例題」を参考にして選択すると良いでしょう．

4.1. １標本での検定と推定の仕方．
１組のデータが百分率（％）で与えられているとき，その標本の比率（ｐ₀）から，母集団での比率（Ｐ）を推定したり，母集団での比率（Ｐ）が，ある特定の比率（ｐ₀）に等しいかどうかを検定します．

［一般形式］

標本	データの個数	出現度数	出現率（％）
Ａ	ｎ	ｆ	ｐ₀＝ｆ／ｎ

ここでの検定は，２項分布に従う比率を対象としています．

［検定の手順］
1. 検定の問題を明かにする．
「ある比率（母比率）との間に差があるか？」

2. 仮設の設定を行なう．
帰無仮設（Ｈ₀）：Ｐ＝ｐ₀
対立仮設（両側検定のとき，Ｈ₁）：Ｐ≠ｐ₀　

対立仮設（片側検定のとき，Ｈ₁）：Ｐ＞ｐ₀またはＰ＜ｐ₀

3. 危険率（100α％）を設定する．　
両側検定のときの有意水準：α／2
片側検定のときの有意水準：α

4. 検定統計量（Ｚ₀）を計算する．注釈表示

検定統計量（Z₀）での1／2ｎをイエーツの修正項と云い，小数データの修正に用いる．

Ｚ₀＝

ABS(p₀-Ｐ)-(1/2n)

SQRT(Ｐ(1-Ｐ)/n)

なお，ｎ＝データの個数，ｐ₀＝標本の出現率（％），Ｐ＝母出現率（％）です．

5. 統計的判定を行なう．
[両側検定のとき]
Ｚ₀＜Ｚ（α／2）ならば，「危険率100α％で有意な差がない」．
Ｚ₀≧Ｚ（α／2）ならば，「危険率100α％で有意な差がある」．

［片側検定のとき］
Ｚ₀≧Ｚ（α）ならば，「危険率100α％で大きい（小さい）」．

なお，Ｚ（α／2）またはＺ（α）は正規分布表（表計算ソフト「エクセル」）から求めます．
求め方は「例題」を参考にして下さい．

［推定の手順］
100（１－α）％信頼区間は次式により求めます．

上限値と下限値

p₀±

Ｚ(α/2) × SQRT(p₀(1-p₀))

n

［例題９］
某年度の子宮癌検診における要精検者中の癌患者発見の割合を表14 に示します．

表14 要精検者からの発見率
標本	要精検者数	癌患者数	発見率
精検者	190 名	60 名	31.58%

これは，19某年～19某年間の平均癌患者発見率 27.2 ％に比べて，有意な差があると云えるでしょうか．

癌患者発見率（ｐ₀）は，0.3158 ですので，検定統計量（Ｚ₀）は，次の通りです．

Ｚ₀＝

ABS(0.3158－0.272)－0.0026

SQRT(0.272 × (1－0.272)/190)
＝1.275

これは，
Ｚ₀＝1.275＜Ｚ（0.05／2）＝1.96　（両側検定，危険率 5％）．
Ｚ₀＝1.275＜Ｚ（0.05 ）＝1.645 （片側検定，危険率 5％）．

Ｚ（0.05／2）及びＺ（0.05）は，表計算ソフト「エクセル」から，
[=NORMSINV(0.025)]及び[=NORMSINV(0.05)]より求めます

ですので，

某年の要精検者中の子宮癌患者の発見率 31.58 ％と，19某年～19某年間の平均 27.2 ％とは，
「危険率５％で有意な差があるとは云えない」と判断されます．

もし，検定の問題が「発見率の大小」を問う片側検定であれば，
某年の癌発見率は「危険率 5 ％で大きくないと云える」となります．

Ｚ₀の値を知ってｐ値で表現するときは，
表計算ソフト「エクセル」から，
[=NORMSDIST(-1.275)]より「ｐ＝0.1012」を求め表現すれば良いでしょう．

以下、同様に表現すれば良いと思います.

なお，子宮癌発見率の 95％信頼限界は，

0.3158±

1.96 × SQRT(0.3158(1-0.3158))

60
＝0.3158±0.118＝0.1978～0.4338

から，19.8％～43.4％であり，この範囲から外れる確率は 5％になります．

4.2. ２標本での検定と推定の仕方．
２組の標本が百分率（％）で与えられているとき，一方の群の比率（ｐ_A）と他方の群の比率（ｐ_B）に差があるかどうかを検定します．

［一般形式］

標本	データの個数	出現度数	出現率（％）
Ａ群	ｎ_A	ｆ_A	ｐ_A＝ｆ_A／ｎ_A
Ｂ群	ｎ_B	ｆ_B	ｐ_B＝ｆ_B／ｎ_B

ここでの検定は，２項分布に従う比率を対象にしています．

［検定の手順］
1.検定の問題を明かにする．
「Ａ群とＢ群の比率に差があるか？」

2.仮設の設定を行なう．
帰無仮設（H₀）：p_A＝p_B
対立仮設（H₁）：p_A≠p_B（両側検定のとき）

対立仮設（H₁）：p_A＞p_Bまたはp_A＜p_B（片側検定のとき）

3.危険率（100 α％）を設定する．　
両側検定：α／2
片側検定：α

4.検定統計量（Ｚ₀）を計算する．注釈表示

χ²検定では両側検定での仮説を考えたものである．
正規分布のパーセント点Ｚ（α／2）と，χ²分布のパーセント点χ²（1,α）とは，Ｚ（α／2）＝χ²（1,α）の関係となる．

Ｚ₀＝

ABS(p_A－p_B)－(1/n_A＋1/n_B)/2

SQRT(Ｐ(1－Ｐ) × (1/n_A＋1/n_B))

なお，
n_A・n_B＝データの個数 , Ｐ＝全体の比率 , p_A・p_B＝標本の比率

5.統計的判定を行なう．

［両側検定のとき］
Ｚ₀＜Ｚ（α／2）ならば，「危険率100α％で有意な差がない　」．
Ｚ₀≧Ｚ（α／2）ならば，「危険率100α％で有意な差がある　」．

［片側検定のとき］
Ｚ₀≧Ｚ（α）ならば，「危険率100α％で大きい（小さい）」．

なお，Ｚ（α／2）またはＺ（α）は正規分布表（表計算ソフト「エクセル」）から求めます．
求め方は「例題」を参考にして下さい．

［推定の手順］
100（１－α）％の信頼区間を次式により求めます．

上限値と下限値

(p_A－p_B)±Ｚ(α/2)×

p_A(1－p_A) × n_B＋p_B(1－p_B) × n_A

n_A × n_B

［例題 10 ］
２つの医療機関での子宮癌検診における細胞診検査でクラスⅢ型以上に分類された割合を表15 に示します．

表15 施設間の分類率
標本検査総数 Ⅲ型分類数分類率

Ａ施設 1058 642 60.68％

Ｂ施設 218 112 51.38％

合計 1276 754 59.09％

表15 施設間の分類率
標本	検査総数	Ⅲ型分類数	分類率
Ａ施設	1058	642	60.68％
Ｂ施設	218	112	51.38％
合計	1276	754	59.09％

施設間のクラスⅢ型以上の分類に差があると云えるかどうかを検定します．

表計算ソフト「エクセル」による方法を示します。

●関数式による方法

２つの施設と全体の割合は，
Ａ施設の割合：ｐ_A= 642/1058 = 0.6068　　
Ｂ施設の割合：ｐ_B= 112/ 218 = 0.5138
全体　の割合：Ｐ = 754/1276 = 0.5909

ですので，検定統計量（Ｚ₀）は次の通りです．

Z₀＝ 2.4665

これは，
Ｚ₀＝2.4665＞Ｚ（0.05／2）＝ 1.9600 （両側検定，危険率 5％）
Ｚ₀＝2.4665＞Ｚ（0.05 ）＝ 1.6449 （片側検定，危険率 5％）

ですので，

施設間のクラスⅢ型以上の分類には，
「危険率 5 ％で有為な差がある」と判断されます．

もし，検定の問題が分類率の大小を問う片側検定であれば，
Ａ施設の方が危険率 5 ％で大きいと云えるでしょう．

なお，施設間の差の 95 ％信頼限界は，

から，2.05 ％～16.56 ％であり，この範囲外に出る確率は 5 ％です．

しかし，ここでＡ施設とＢ施設での検査数に相当の差がある点に注意しなければなりません．この差が同等程度になったとき有意な差がなくなるかもしれません．

4.3.　分割表による検定の仕方．
２組のデータが出現度数として，２つの特性ごとに分割表にまとめられているとき，あるいは，まとめられる様なデータはここでの検定を適用します．

分割表では，それぞれの特性間の比率に差があるかどうかを検定するものです．
これを一般に独立性の検定と云い，２つの特性間に何らかの関係があるか，あるいは無関係であるかを問うものです．

検定はデータの特性によって，色々な分割表に整理されます．

以下の「一般形式」と「例題」を参考に，適切な手法を選択すると良いでしょう．

4.3.1. ２×２分割表のとき．
２つの特性を持つ２組のデータの出現度数は２×２分割表に整理し，２つの特性値が互いに独立で関連性がないかどうかを調べます．
ここでは，比較する２組の一方の群（Ａ）と他方の群（Ｂ）の特性間の比率の差を「χ²検定」あるいは，「フイッシャーの直接確率計算法」によって検定を行います．

なお，χ² 検定の仕方については，３章（3.1.2.）で詳しく述べましたので，ここでは「フイッシャーの直接確率計算法」の仕方について説明しましょう．これは出現度数に５以下の小さい度数があるときに適用されます．

［一般形式］

要因／特性	特性あり（Ｂ1）	特性なし（Ｂ2）	小計
要因（Ａ1）	ｆ11	ｆ12	ｆl.
要因（Ａ2）	ｆ21	ｆ22	ｆ2.
小計	ｆ.1	ｆ.2	Ｔ

　
ｆ_ij（ij=1,2）はそれぞれの要因での出現度数，ｆ_.j およびｆ_i. は各小計，Ｔは総計です．

［検定の手順］
検定の問題を明らかにする．
「Ａ群とＢ群の特性に差があるか？」

2.仮設の設定を行う．
帰無仮説（Ｈ₀）：P_A＝P_B
対立仮説（Ｈ₁）：P_A≠P_B（両側検定のとき）
対立仮説（Ｈ₁）：P_A＞P_BまたはP_A＜P_B（片側検定のとき）

3.危険率（100α％）を設定する. 注釈表示

フィッシャーの直接確率計算法では，片側検定での仮説を考えたものである．したがって，両側検定では 2×Pr に対して行う．

両側検定のときの有意水準：α（2×Ｐrに対して）
片側検定のときの有意水準：α（Ｐrに対して）

4.検定統計量（Pr）を計算する．
フィシャーの直接確率値は次式により求める

Pr＝

f_.1! × f_.2! × f_1.! × f_2.!

Ｔ × f₁₁! × f₁₂! × f₂₁! × f₂₂!

なお，Ｔ＝総度数，ｆ_ij＝出現度数，ｆ_.jおよびｆ_i.＝小計　です．

5.統計的判定を行う．
Pr≧α　ならば「危険率100α％（片側検定）で関連がない」．
Pr＜α　ならば「危険率100α％（片側検定）で関連がある」．

ここで，「関連がない」は「独立である」・「有意差がない」であり，また「関連がある」は「独立でない」・「有意差がある」と云う意味です．

［少数例題の場合］
２種類の薬剤投与による臨床症状の改善非改善の割合を表16 に示します．改善性に有意な差があるかどうか検定してみましょう．

表16　薬剤投与による効果の割合

改　　善改善せず

薬剤（Ａ） 4例 3例

薬剤（Ｂ） 5例 1例

出現度数に５以下の小さな度数があるので，フィシャーの直接確率計算法を用います．

表計算ソフト「エクセル」による方法を示します。

●関数式による方法

上記の「関数式による方法（Sheet名：計算）」を用いると漸化式で計算できます。

階乗（！）の筆算は計算し易いように，分子と分母を次の様にまとめると良いでしょう．

9!
13!
×

4!
4!
×

6!
3!
×

7!

5!

Pr1＝ 1／ 17160×1×120×42＝0.2937

階乗の筆算において桁数が非常に大きくなるときは，Log変換してから計算しても良いでしょう．

次に，周辺和（小計：ｆ1.，ｆ2.，ｆ.1，ｆ.2）を変えないで，１の度数が０になる組合せを作りその確率を求めます．注釈表示

実際の計算では出現度数の最小のものが「0」になるまで出現度数を減らしてゆき，それぞれのPrを求める．

Pr2＝7！6！9！4！／13！3！4！6！0！
Pr2＝1/17160×120×1×7＝0.0490

から，２×２分割表における確率Prは，
Pr＝Pr1＋Pr2＝0.2937＋0.04895＝0.34265

となります．

これは，偶然にもこの様な組合せが起こる確率が 34.26％であることを示しています．

したがって，

Pr ＝ 0.3427 ＞ α ＝ 0.05 （片側検定，危険率 5％）

ですので，２種類の薬剤間の改善性は独立，すなわち関連性がないと判断されますので，有意な差がないと云えるでしょう．

「注釈」

検定統計量（Z₀）での1／2ｎをイエーツの修正項と云い，小数データの修正に用いる．
χ²検定では両側検定での仮説を考えたものである．正規分布のパーセント点Ｚ(α／2)と，χ²分布のパーセント点χ²（1,α）とは，Ｚ（α／2）＝χ²（1,α）の関係となる．
したがって，χ²検定での片側検定は2αに対して行う．
フィッシャーの直接確率計算法では，片側検定での仮説を考えたものである．したがって，両側検定では 2×Pr に対して行う．
実際の計算では出現度数の最小のものが「0」になるまで出現度数を減らしてゆき，それぞれのPrを求める．

戻る　　　　　次へ　　　　　目次へ　　　　　 TOPへ

	改　　善	改善せず
薬剤（Ａ）	4例	3例
薬剤（Ｂ）	5例	1例