統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

医学と統計(85)

2012-07-22 10:59:25 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

PSPP の試用経験(3)
今回は、平均値の比較の方法を試みます。

PSPP のための演習データファイル(2sampleTtest.sav)を下記 URL より DownLoard して下さい。
http://sky.geocities.jp/dqcdr872/dbase/pspp.html

このデータについては、下記URLの「やさしい医学統計手法」を参考にして下さい。
http://www3.ocn.ne.jp/~stat/medical/med_018.htm
[例題25]気管支喘息患者の病態別の血清IgE値(IU/L)

「Analyze」→「Compare Means」では、次の検定を選択出来ます。
 ・Means(各グループの平均値)
→「Dependent List」には従属変数を選択。
→「Independent List」には独立変数を選択。

 ・One Sample T Test(1サンプルの T 検定)
→「Test Variable」には検定変数を選択。
→「Test Value」には検定値を入力。

それでは、次の検定を演習データ(2sampleTtest.sav)で行って見ましょう。
  ・「File →Open」→「2sampleTtest.sav」
  ・サンプルデータが「Data View」に表示されます。
 ・「Variable View」を表示し、「Name」と「Label」を”Group”、”IgE”、”Ln_IgE”にし、
  「Group の Measure」 を ”Nominal” にします。
 ・「Analyze」→「Compare Means」→「Independent-Samples T Test」
→「Test Variables」に”Ln_IgE”を、「Group Variables」に”Group”を選択。
 ・「Define Groups」では、次の様にファクターを入力します。
  「0」=アトピー型、「1」=混合型、「2」=感染型
Igegroup

IgEgroup.jpg
  ・「Define Groups」→「Continue」→OK

output 画面に「アトピー型(0)」と「感染型(2)」の結果が出力されます。
Ttest

何故、自然対数変換したIgE値を用いたか? ですが、血清IgE値は非正規分布であり、
自然対数変換で正規近似になることが知られています。
この様に、2標本のT検定では、「正規性」と「等分散」の仮定が大切です。
等分散性は「Leavene's Test」で、F=0.71(p=0.43)から等分散と言えますので、
「Ln_IgE Equal variances assumed」の行の統計量を見ると、t=5.95、df=8.00、Sig=0.00 から、
統計学的に有意と推察されます。すなわち、血清IgE値はアトピー型>感染型 と推測出来る訳です。

今回使用したデータ[例題25]は一元配置分散分析(ANOVA)のためのものでした。
次回にANOVAの試用をご報告します。

次回に続く!


医学と統計(84)

2012-07-11 11:04:56 | 日記・エッセイ・コラム

情報統計研究所へのアクセスはここから.

PSPP の試用経験(2)
今回は、2×2分割表によるカイ二乗検定の方法を試みます。

PSPP のための演習データファイル(CrossData.sav)を下記 URL より DownLoard して下さい。
http://sky.geocities.jp/dqcdr872/dbase/pspp.html

基本的に前回と同じ方法で、次により行います。
  ・「File →Open」→「CrossData.sav」
  ・サンプルデータが「Data View」に表示されます。
 ・「Variable View」を表示し、「Name」と「Label」を”Mittel”と”Effect”に、
  「Measure」を”Nominal”にします。
 ・「Analyze」→「」Descript Statistics」→「Crosstabs」
 ・変数選択画面で、「Mittel」→「Columns」、「Effect」→「Rows」
  ・「statistics」をクリック→「chisq」をチェック→「continue」
 ・「cells」をクリック→「Count」「Row」「Column」「Total」にチェック→「Continue」
 ・「OK」

output 画面に結果が出力されます。
Crosssummary

データがクロス集計表にまとめられているときは次の様に入力します。
Crosstable

そして、
 ・「Data」→「Weight Case」→「Frequeny Variable」→「Count」を選択
Crosscount 

 ・以下、前記の手順で実行します。

注釈:
やさしい医学統計手法(表8:分割表にまとめられたデータ)から引用。

結果は、
Mittel(偽薬=0、実薬=1)、Effect(無効=0、有効=1)の名義尺度となっています。
精密には、
・補正なし:
 X-squared = 12.1979, df = 1, p-value = 0.0004784
・補正あり:
 X-squared = 10.151, df = 1, p-value = 0.001442

となり、
偽薬と実薬の効果の割合には統計学的な有意差があり、その効果は偽薬で低く、実薬で高いと判断されます。

詳しくは、「やさしい医学統計手法」(3.1.2 離散量にかかわるとき)の解説を見て下さい。

なお、
「Analyze」→「Non-Parametric Statistics」→「Chi-Square」はカイ二乗の適合度検定です。

「Analyze」→「Descriptive Statistics」(記述統計)では、次の分析が出来ます。
 ・「Frequency」(度数分布)
 ・「Descriptive」(記述統計)
 ・「Explore」(探索的)
 ・「Crosstabs」(クロス集計表)

次回に続く!