統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(13)

2016-09-01 11:04:43 | 日記・エッセイ・コラム
このブログは「すぐに役立つ統計のコツ」(オーム社)でご紹介できなかった統計に関する色々な事を書いています。
今回は、本書で取り上げていない分割表形式における「相関」の求め方についてご紹介します。
 
それでは、「すぐに役立つ統計のコツ」第6章(66ページ)を開いて下さい。
 
本書の例題(データ)は下記の情報統計研究所(HP)からダウンロード出来ますのでご利用下さい。
 
 
前々号の「分割表」では「カイ二乗検定」について紹介しました。
医学実験や看護研究などでのアンケート調査でクロス集計され分割表形式にまとめられたものは、通常の連続量における相関係数は求められません。
そこで、
次の様な相関係数を用いることになります。なお、分割表での相関は「連関(度)」(association)と言います。
 
● φ係数(Phi-Coeeficient)
行・列が「2×2分割表」にまとめられているときに用います。 
例えば、
下表の様な「性別とコレステロール値の分割表」(本書の表5.5、43ページ)です。
 
 
この分割表から、
φ=(a・d-b・c)/√n1・n2・m1・m2=(3×32-54×11)/√54×43×14×86=-0.29
 
φ=0.29 から関連は弱いが「カイ二乗値=8.41(p=0.0037)」で有意と言えます。
 
● 四分相関係数(Tetrachoric Cefficient)
行・列の変数が共に連続量であるものを2分割して2値とした場合に用います。
例えば、
先の例題がコレステロール値を200mg% で分割し男性と女性での関連をみたものであったとします。
 
 
 この計算は、最尤推定法を用いるのでデータ解析環境「R」での方法を紹介します。
 
ポリコリック相関係数(Polychoric correlation ceefficient)の場合
***
y<- matrix(c(32,54,11,3),2,2)
y
library(polycor)
polychor(y, ML=T, std.err=T) # ML=最尤推定法
 
# 出力結果
Polychoric Correlation, ML est. = -0.5453 (0.156)
 
 Row Threshold
  Threshold  Std.Err.
    -0.1764    0.126
 
  Column Threshold
  Threshold  Std.Err.
     1.08      0.1559
***
 
この様に、
ポリコリック相関係数はΦ係数を用いるよりも分かりやすい相関係数が得られます。
 
一方、
四分相関(Tetrachoric Correlation)の条件にあっていれば 、近似的(Approximating the tetrachoric correlation, Edwards & Edwards:1984)に、次のオッズ比(OR)から求められます。
 
OR=(32×3)/(11×54)=0.162
r_tet=(OR^(π/4)-1)/(OR^(π/4)+1)=-0.6142
 
次回は、
引き続き「すぐに役立つ統計のコツ」の第6章から、分割表形式の相関をご紹介します。
 
 
 
情報統計研究はここから