統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(23)

2016-11-01 18:31:03 | 日記・エッセイ・コラム
このブログは「すぐに役立つ統計のコツ」(オーム社)の内容に沿って、チョットしたコツを書いています。
今回は、最終章(第8章)「生存時間」に関するお話です。
それでは、「すぐに役立つ統計のコツ」第8章(130ページ)を開いて下さい。
本書の例題(データ)は、情報統計研究所(HP)からダウンロード出来ますのでご利用下さい。
 

第8章は、「イベントヒストリー分析」となっています。医学医療関連では生存時間の分析(解析)と呼ばれて言いますが、
生産現場での、例えば「故障/非故障」などの信頼性分析(信頼性工学)で用いられています。
工場の生産現場で「生存時間」と言うのはしっくりきませんし、医学医療の現場で「故障」と言うのも違和感があります。
しかし、
あるイベントに対する分析であれば、「生存」であっても「故障」であっても、イベントと言えますのでしっくりくると思われます。
本書ではエクセルによる方法をご紹介していますが、結構、手間で少々うんざりです。
だって、
商用統計ソフトを使えば、難なく生存曲線などを描いてくれますから便利ですよね!
しかし、
その分析過程を知りたいなら、本書のエクセル関数を手入力してみて下さい。
高価な商用統計ソフトはチョット・・・と思われるなら、これからご紹介するデータ解析環境「R」がお勧めです。
それでは、
「R」による方法をご紹介しましょう。
 
(1)カプラン・マイヤー法(Kaplan-Meier法:K-M法)について。
この方法は小標本(例えば50例以下)に適しており、医学医療分野でよく用いられています。本書では、エクセルでの方法を紹介していますが、正直やっかいです。R」だと、survfit()関数だけで K-M 法をやってくれます。
では、
その方法を書きに記しておきましょう。
まずは、
例題を情報統計研究所(HP)からダウンロード「Excel_Sample(3).xlsx」しておいて下さい。
そして、
「Excel_Sample(3).xlsx」の Sheet名「表8.1」を開き「A1:C22」を「選択→コピー」し用いて下さい。
***
dat<- read.delim("clipboard", haeder=T)
head(dat)
 # ここから下は「Rエディタに書くと良いでしょう」
 
library(survival)
fit<- survfit(Surv(観察期間, イベント発生 == 1)~ グループ, data=dat)
summary(fit)
plot(fit)
 
# 日本語に対応していなかったり、英文(アルファベット)で表記したければ次により列名を変えられます。
# names(dat)=c("Time", "Status", "Group")
 
出力結果:
> summary(fit)
Call: survfit(formula = Surv(観察期間, イベント発生 == 1) ~ グループ,
    data = dat)
                グループ=A
 time n.risk n.event survival std.err lower 95% CI upper 95% CI
    2      9       1    0.889   0.105        0.706            1
    7      5       1    0.711   0.180        0.433            1
   13      3       1    0.474   0.228        0.185            1
                グループ=B
 time n.risk n.event survival std.err lower 95% CI upper 95% CI
    1     11       1    0.909  0.0867       0.7541        1.000
    2     10       1    0.818  0.1163       0.6192        1.000
    3      9       1    0.727  0.1343       0.5064        1.000
    5      7       1    0.623  0.1500       0.3890        0.999
    6      6       1    0.519  0.1569       0.2874        0.939
    8      4       1    0.390  0.1628       0.1718        0.884
    9      3       1    0.260  0.1517       0.0827        0.816
   10      2       1    0.130  0.1191       0.0215        0.784
 
図1:K-M法による生存曲線(本書の138ページ参照)
 

次回も、引き続き最終章(第8章)をご紹介します。
 
情報統計研究所はここから!