統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(7)

2016-07-22 18:24:33 | 日記・エッセイ・コラム
このブログは「すぐに役立つ統計のコツ」(オーム社)の内容に沿って書いています。
あまりにも有名な「ステューデント」のt検定(正規分布を仮定したパラメトリック法)に対して、正規分布を仮定しなくてもよい「ノンパラメトリック法」のエピソードなどを紹介します。
 
「すぐに役立つ統計のコツ」の「第3章 2つの代表値の比較」(10ページ)です。
 
 
本書の例題(データ)は下記の情報統計研究所(HP)からダウンロード出来ますのでご利用下さい。
 
正規分布を仮定しなくてもよい「ノンパラメトリック法」の代表格と言えば、Wilcoxon や Mann-Whitney ではないでしょうか。
 
 
本書では、Excel でウイルコクッスンの方法(Wilcoxon sum rank test)を14ページで紹介しています(Mann-Whitney test と結果は同じ)。
現在、ノンパラメトリック法に関して諸説あります。例えば、等分散であれば正規性にはあまり拘る必要はなくt検定で良いが、そうでなければ「ノンパラメトリック法」を用いる・・と言う説です。ノンパラメトリック法でも外れ値の影響を受けるので、
「Wilcoxon Mann-Witney test」でも等分散性であることが条件となります。もし、非等分散であっても正規分布に近いなら「ウエルチ」のt検定を用いても問題ない・・と言う説もあります。実際、色々な説があり実践者も悩むところです。
 
 
 
一方、
「統計学を拓いた異才たち」(日本経済新聞社)によれば、デウイッド.コックス(David R. Cox)とジョージ・ボックス(Goorge E. P. Box)の2人は、有名な「ステューデント」のt検定について悩んでいました。そう~、分散が等しくないとき・・、すなわち、外れ値の影響を小さくする方法として「ボックス・コックス変換」を提唱しました。なお、本書では、正規分布に近づける方法として対数変換を示していますが、ルート(平方根)変換など色々な方法が開発されています。しかし、正規分布でないからと言って、何でも変換するのは良くありません。データの性質を良く吟味することです。
意に沿わない外れ値があって正規分布にならないのなら、その理由を考えましょう。イノベーションでは外れ値に重要な発見を見出す事があるのですから・・・。
 
次回は、
「すぐに役立つ統計のコツ」の第4章についてご紹介します。
 
情報統計研究はここから