統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(11)

2016-08-14 16:14:28 | 日記・エッセイ・コラム
このブログは「すぐに役立つ統計のコツ」(オーム社)でご紹介できなかった統計に関する色々な事を書いています。
今回も「カイ二乗検定(L×M 分割表」の計算方法です。
 
それでは、「すぐに役立つ統計のコツ」第5章(52ページ)を開いて下さい。
 
図5.1(52ページ)の右図を下記の通り訂正いたします。
 
 
 
本書の例題(データ)は下記の情報統計研究所(HP)からダウンロード出来ますのでご利用下さい。
 
 
 
「2×2分割表」でのカイ二乗検定の方法は前号の通りです。今回は、「 L×M 分割表」の簡単な例として
本章(65ページ、まとめ)の親と子の職業について計算してみましょう。この様な分割表は看護研究などでよく見かけます。
計算は「2×2分割表」の場合と同じく期待度数と実測度数の偏差を計算します。
その計算過程は次の通りです。
 
 
 
 
ここまでは、「すぐに役立つ統計のコツ」で紹介した通りです。
 
ここでは、単純な例として、
親と子の職業の関係を「対応分析(コレスポンデンス:Correspondens)」で見てみましょう。
 
対応分析は、
親と子の関係を2次元座標上で表現し、視覚的にその関係を見る様にしたものです。計算は複雑ですので、データ解析環境「R」で作成した2次元散布図を示しましょう。
 
下図の散布図を対応分析では布置図と言います。
 
 
 
この座標上で最も近いものほど関係が強く、遠いものほど関係が弱いと判断します。対応分析では、各相互間の距離を計算できますが、実際には視覚的に判断すれば良いと思います。
そうすると、
視覚的に親と子の関係の強さは実線円で示すことが出来ます。すなわち、親の職業と子の職業には関係がありそうです。
特に、
「医師」が「看護師」、「その他」と離れて布置しており、察するに、医師の子は医師になる傾向が強いのかも知れませんね。
 
 
 
この様に、
「L×M」が大きな分割表になればなるほど、出現度数(比率)だけで、その関係を知ることが難しくなります。
そこで、
視覚的に分かりやすくしたのが「対応分析」だと考えても良いでしょう。
なお、
「対応分析」に関する色々な統計量は省略します。
 
***
分割表から計算できるものに、次の様なものがあります。
 
・ファイ係数(phi-coefficient)
・C 係数(contingency coefficient)
・クラメールの V 係数(cramer's V)
・Tetrachoric coefficient
・Polychoric coefficient
 
これら分割表の相関に付いては次回以降にご紹介します。
***
 
次回は、
「すぐに役立つ統計のコツ」から第6章についてご紹介します。
 
 
 
 情報統計研究はここから