- 正または負の従属性を検定するときは,片側検定を用いる.
- t分布表による有意性の検定はデータ数n≧10 に適用する.
6.3.2. 非直線関係のとき.
相関図において直線関係がみられないときで一方の標本でのデータの分布が正規型で他方が非正規型であれば片対数グラフ用紙などを用いて相関散布図を作成してみます.
もし片対数グラフ用紙上において直線関係が見られればデータの一方を対数変換したのちに相関関係を検討すると良いでしょう.
両方のデータが共に非正規型であれば両対数グラフ用紙などを用いて検討します.
通常,データの分布の関数型と変換式の間には図46のような直線化の関係が知られています.すなわち,それぞれのxとyの曲線関係は次の変換によって直線化を試みることができます.
図46 データの分布型と変換式の関係
y=a^x → Log(y), x 又は Log(x)
y=a/x → y , 1/x
y=x/(a+bx) → x/y , x
その他に,Logit-Log 変換などがあります.これは,
Logit y=Log(y/(1-y) , Log x
を Logit y=a・Log x+b などにあてはめるものでラジオ・イムノアッセイなどでよく用いられています.
この様なデータ変換によっても直線性が得られないときはデータについて質的・量的な問題を検討すべきです.そして,問題がなければ高次回帰への当てはめなどを考えます.
ここでは,xに対するyの回帰において,xの2次式を当てはめる手法に次いて説明します.
1) 回帰係数の算出.
2組のn個のデータ(Xi ,Yi:i=1,2,・・・,n)から,
Y=a1x^2+a2x+a0
で示される2次回帰式の回帰係数(a1 ,a2)と定数(a0)は,次の連立方程式の解で求められます.
a0c0+a1c1+a2c2=z0
a0c1+a1c2+a2c3=z1
a0c2+a1c3+a2c4=z2
ここで,
ck=狽i^k (k=0,1,2,3,4)
zk=狽i・xi^k (k=0,1,2 )
この連立方程式の解によって回帰係数を求めることが出来ます.
筆算で連立方程式式の演算を行う必要はありません。表計算ソフト(エクセルなど)を使えば簡単ですので例題を参考にして下さい。
2) 相関比の計算.
非直線回帰の場合には相関係数(r)を用いることができません.相関係数にかわって相関比,あるいは決定係数(R)と呼ばれる指標を用います.
決定係数(R)は次式で示されます.
R=SQRT(1−(yi−Y^)^2/(yi−meanY)^2)
なお,Y^は回帰式より求めた予測値です.また,回帰への当てはめの良さを表す指標として,次の標準誤差(SE)を用いることもあります.
SE=SQRT((yi−Y^)^2/(n−3)
ただし,n−3 は2次式のときで,3次式のときにはn−4 とします.
[例題33]
酵素免疫測定法にてIgE 値を測定し,次の様な標準濃度(IU/L)と吸光度のデータを得ました.
IgE(]) | 2 | 4 | 8 | 16 | 32 | 64 | 128 |
吸光度(Y) | 2.7 | 6.2 | 12.5 | 28.8 | 51.9 | 92.1 | 123.8 |
これから,検量線として使用できる様な回帰式を求めてみましょう.
回帰式は表計算ソフト「エクセルなど」を用いると良いでしょう.
「エクセル」での方法,
「エクセル起動」→「グラフウィザード」→「散布図」→「散布図-値の組を比較します」→「次へ(N)」→「データ範囲(系列で列を選択)」→「完了」
上記の操作で散布図が出来ます。次に,
「散布点を右クリック」→「近似曲線の追加(R)」→「多項式近似(P)」→「オプション」→「グラフに数式を表示する」→OK
図47 は2次式への当てはめを示したものです.2次回帰式は,
y=−0.007x2+1.935x−1.472
で示されます.そして,決定係数は R=1 です.
図47 「例題33」における2次曲線の当てはめ
6.3.3. 順位データのとき.
連続量における「相関と回帰」の手法は2つの標本が等分散でその相関関係が直線または直線で近似できるものに適用されました.
この条件が満たされないときで2つの標本が順位尺度のデータであれば,その相関性を「スピルマンの順位相関」によって記述することができます.
1. 相関係数の計算.
2組の対応するn個のデータ(Xi,Yi :i=1,2,・・・,n)に対して,それぞれの群ごとに順位数を与えます.
例えば図49 の様なデータのとき,
図49 スピルマンの順位相関係数を求める順位系列
x群のデータ(xi) | x1 | x2 | ・・・ | xi | ・・ | xn |
xの昇順順位(Rxi) | Rx1 | Rx2 | ・・・ | Rxi | ・・・ | Rxn |
y群のデータ(yi) | y1 | y2 | ・・・ | yi | ・・・ | yn |
yの昇順順位(Ryi) | Ry1 | Ry2 | ・・・ | Ryi | ・・・ | Ryn |
順位の差(di) | d1 | d2 | ・・・ | di | ・・・ | dn |
差の2乗(di^2) | d1^2 | d2^2 | ・・・ | di^2 | ・・・ | dn^2 |
diの合計 S=狽i=d1+d2+・・・+dn
から,スピアマンの順位相関係数(rs)は次式で与えられます.
rs=1-{(6×S)/(n(n-1)(n+1))}
なお,同じ群に同一順位のデータがあるときには,順位の平均をそれぞれのデータに与えます.
要領は「5.2. 2標本の検定と推定の仕方」でのノンパラメトリック検定と同じです.
[検定の手順]
(1) 検定の問題を明らかにする.
「2組の標本に相関関係があるか?」
(2) 仮説の設定を行う.
帰無仮設(H0):r=0
対立仮設(H1):r≠0 (両側検定のとき)
(3) 危険率(100α%)を設定する. 注釈表示
(4) 検定統計量(t0)を計算する.
2組のデータの個数をnとする順位相関係数(rs)の検定統計量(t0)は次式より求めます.
t0=rs* SQRT((n−2)/(1−rs^2))
(5) 統計的判定を行う. 注釈表示
なお,t(n-2,α)は表計算ソフト「エクセル」から求めると良いでしょう(例題参照).
[例題 34]
喘息患者7名について自覚症状の「咳発作回数」と「夜間睡眠障害」の点数づけを行い次の結果を得ました.
咳発作(X:回/週) | 1 | 2 | 7 | 3 | 5 | 6 | 4 | |
睡眠障害(Y:点数)) | 0 | 2 | 14 | 6 | 4 | 10 | 2 |
咳発作回数(x)と睡眠障害点数(y)の間に相関があるか,どうかを調べます.なお,点数は次の基準で与えました.
咳発作1回 :1点/1日 :1晩中眠れなかった:3点/1日
時々目がさめた :2点/1日 :安眠できた :0点/1日
スピアマンの順位相関係数(rs)とその有意検定は図50 の順位系列から求めます.
図50 「例題34」の順位系列
x群の順位 | 1 | 2 | 7 | 3 | 5 | 6 | 4 |
y群の順位 | 1 | 2.5○ | 7 | 5 | 4 | 6 | 2.5○ |
di | 0 | -0.5 | 0 | -2 | 1 | 0 | 1.5 |
di^2 | 0 | 0.25 | 0 | 4 | 1 | 0 | 2.25 |
S=Σdi^2=7.5
y群の順位数 2.5(○印)は順位の平均です.
順位の平均はy群のデータに同一順位の点数2が2ツあり,その順位が2位と3位になるので,(2+3)/2=2.5となります.
順位差の2乗(di^2)の合計はS=7.5 であるので,順位相関係数(rs)は,
rs=1− (6×7.5)/(7×6×8) =0.866
となりまする.そして,検定統計量(t0)は,
t0=0.866×SQRT{(7−2)/(1−0.866)} =3.873
ですので,
t0=3.873>t(5,0.05)=2.571(両側検定,危険率 5%)
から,相関があると云えます.すなわち,
咳発作回数と夜間睡眠障害は関連性があると判断されます.
なお,同一順位があるとき,正確には同一順位に対する補正を次の様に行います.まず,x群とy群に同一順位のものが何個あるかを数えます.
そして,その個数をt個とすると,Tt=(t^3−t)/12 を同一順位のものすべてについて計算し,その合計( 狽sxt ,狽syt )を求めます.
「例題34」では,
x群のデータには同一順位のものがないので,
狽sxt =0
y群のデータには同一順位のものが 2.5 で2つあるので,
Tyt =(2^3−2)/12=0.5 ,狽syt=0.5
となります.ここで,同一順位にたいする相関係数の補正は,
rs=(X+Y−S)/2×SQRT(X×Y)−狽syt
なお、
X=(n^3−n)/12−狽sxt
Y=(n^3−n)/12−狽syt
となります.
「例題34」では,
X=(7^3−7)/12−0=28 ,Y=(7^3−7)/12−0.5=27.5 となります.よって,
rs=(28+27.5−7.5)/(2×SQRT(25×27.5))=0.865 となります.
有意性の検定は,このrs について行えば良いでしょう.
戻る 次へ 目次へ TOPへ