統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

新・医学と統計(13)

2018-12-06 17:55:22 | 日記・エッセイ・コラム
今回は、JASPによるロジスティック回帰分析です。
例題は、
情報統計研究所の下記URLからダウンロード(ファイル名:LogisticReg.csv)して下さい。
http://kstat.sakura.ne.jp/dbase/dbaseJASP.html
 
適当なフォルダーに保存されましたか・・?
それでは、
いつもの様に、JASPを立ち上げ、保存先ホルダーから「LogisticReg.csv」を読込んで下さい。
 
サンプル・データの読込:
図1 サンプル・データ
 
 
赤色(×)のVar.3は使用しません。
例題の内容は、
「すぐに役立つ統計のコツ」(オーム社刊)の例題 18(106ページ)を見て下さい。
 
JASPの実行:
*****
Regression→Logistic Regression

図2 変数の選択 
 
 
3つの変数は名義尺度(0,1)ですが、ここでは共変量(Covariates)として扱います。
 
Factors として選択すれば交互作用の結果が出力されます。

図3 検定統計量の選択 
 
 

図4 出力結果 
 
Cofficients:回帰係数(Estimate)やオッズ比(Odds Ratio)など。
Confusion matrix:混同行列
Performance metrics:性能測定基準
 
ここで、
Confusion matrix から Performance metrics を次により計算することが出来ます
 
図5 Performance metrics の計算 
 
ここで、
TN=True negative、TP=True positive、FN=False negative、FP=False positive
 
そして、
図4の Performance metrics は、

Sensitivity =TP/(TP+FN)=0.800  :感度、検出率(Recall)、再現率・・とか、
Specificity =TN/(TN+FP)=0.850  :特異度とか、
Precision   =TP/(TP+FP)=0.842 :適合率、精度とか、
 
・・と呼ばれています。
 
なお、
情報検索の分野で良く用いられている指標に「F-mesure」があり、図3で☑するとF-mesure=2/(1/再現率+1/適合率)=0.821(調和平均)を求めるられます。

主に、陽性と陰性の出現率が極端に偏っているような場合に用いられています。
 
次回に続く!
 
情報統計研究所はここから。