統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(10)

2016-08-08 12:22:03 | 日記・エッセイ・コラム
このブログは「すぐに役立つ統計のコツ」(オーム社)の副教材の様なものです。
今回は、本書で紹介できなかった「カイ二乗検定」の計算方法です。
 
それでは、「すぐに役立つ統計のコツ」第5章(40ページ)を開いて下さい。
 
本書の例題(データ)は下記の情報統計研究所(HP)からダウンロード出来ますのでご利用下さい。
 
 
医学や看護関連の分野では、実験やアンケート集計などの出現度数(出現頻度)を分割表形式(クロス集計)にまとめる事がよくあります。
例えば、本章の「表5.1」(40ページ)の様にです。
 
***
表5.1を次のように訂正します。
非正規(病気なし)→非生起(病気なし)
 

「すぐに役立つ統計のコツ」の正誤表は下記に記しています。
正誤表←ここをクリック
***
 
この様な表を一般に「2×2分割表」と言い、2行L列やM行L列にまとめる事もあります。
 ここで、
「2×2分割表」が与えられたとき、一般には「カイ二乗検定」の対象となります。
その1例を本章の「表5.5」について次の様にまとめてみましょう。
 
表5.5 性別とコレステロール値の分割表
 
 
 
与えられた度数をもとに、
行の度数の比率(%)と列の度数の比率(%)そして全体の度数の比率(%)を求めて観察します。
そして、比率に差があるかどうかであれば、次により統計的な検定を行います。
 
検定の計算は次の手順で行えば良いでしょう。
1)期待度数を求める。
A×D/T=43×14/100=6.02
A×E/T=43×86/100=36.98
B×D/T=57×14/100=7.98
B×E/T=57×86/100=49.02
 
2)出現度数と期待度数の偏差(イエーツの補正)
(11-6.02-0.5)^2/6.02=3.334
(32-36.98+0.5)^2/36.98=0.543
(3-7.98+0.5)^2/7.98=2.515
(54-49.02-0.5)^2/49.02=0.409
 
ここで、
「イエーツの補正」は「±0.5」によって行います。
 
3)検定統計量を求める。
カイ二乗値=出現度数と期待度数の偏差の合計=6.801
 
4)p値を求める。
Excel関数(CHIDIST)を用いると良いでしょう。
 CHIDIST(6.801, 1)=0.0091
 
 
 
以上は、期待度数からの計算でしたが「2×2分割表」の場合は、次の別法を
用いても良いでしょう。
 
カイ二乗検定の別報
1)計算(1)
 100×(abs(11×54-32×3)-100/2)^2=20070400 
2)計算(2)
 (43×57×14×86)=2951004
 3)カイ二乗値
 計算(1)/計算(2)=20070400/2951004=6.801
4)p値
 Excel関数(CHIDIST)を用いると良いでしょう。
 CHIDIST(6.801, 1)=0.0091
 
***
本章のExcelによるオッズ比(Odd ratio)の計算(47ページ)に誤りがありますので、次の様に訂正します。
 OR=(a/c)/(b/d) 
***

「すぐに役立つ統計のコツ」の正誤表は下記に記しています。
正誤表←ここをクリック
 
次回は、
引き続き「すぐに役立つ統計のコツ」から第5章についてご紹介します。
 
 
 
情報統計研究はここから
 
 
 
 
 

最新の画像もっと見る