統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(78)

2012-02-01 11:36:34 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

ノンパラ検定と等分散について.

母集団の分布に関係なく検定できる ノンパラメトリック法として Wilcoxon Mann-Whitoney test(WMW) が良く用いられています.ところが、
ノンパラメトリック 検定は等分散、すなわち、バラツキが同じでなけでばいけないと言うのです.Wilcoxon test の教科書などを見ると、確かに、同じ母集団から取られたものかどうかを検定するものとあります.

下記の論文を見てみて下さい.
http://www.creative-wisdom.com/teaching/WBI/parametric_test.shtml

Wmwtest

不等分散(unequal)でのWMWは not acceptable となっておりおります(詳しくは論文をお読み下さい).

そもそも医学において、正規分布する実験データはほとんどありませんし、極めて少数データを扱うことが稀ではないので、母集団の正規性や等分散性を満足させるなど、正直に言ってはなはだ困難と言えます.そもそも母集団って何だ・・・ってことですが、
ある病院の呼吸器科を受診した患者(咳や痰などの症状)の血中 IgE をランダムに調べました.表1は血中IgE値(RIST)の測定値です.

表1 呼吸器科受診患者の血中 IgE値
(non=アレルギーなし、AD=アレルギーあり)
Table1_ige_2 

ここでの IgE値は同一母集団からのものと言えますが、もし仮に、健常者と喘息患者(アレルギー疾患など)の血液を意識的に分けて採血し測定したなら、もちろん同一母集団からのデータとは言えません.

表1の IgE値の分布を見てみましょう(図1).

図1 IgEのヒストグラムとBoxPlot
Ige_histgram_2 

RIST 法で使用する検量線から求めた IgE 値は片側に尾を引く歪んだ分布になり、下記(表2) の等分散の検定結果からも等分散とは言えません.

表2 等分散性の検定結果
Table2_equaltest_2

この様な歪んだ分布では自然対数変換を試みます.そうすると、
IgE 値は図2 の様に正規分布近似となり正規性の検定(Shapiro-Wilks test)も満足できる結果を得ました.

図2 自然対数変換後のIgE値の分布
Logchange

また、等分散性の検定も表3 の様に正規性を仮定しても良さそうです.

表3 自然対数変換後の等分散性の検定結果
Table3_logequaltest

この様なデータ変換によって正規分布近似を満足できれば、対数変換値で通常の Student's t-test を行うことが出来ます.
「student's t-test」の結果は次の通りです. 
 t-value=4.1105、df=32、p-value<0.0001

しかし、
ここでは不等分散の WMW 検定をテーマにしていますので、Wilcoxon Mann-Whitoney test を行って見ましょう.

次回に続く!