今回は、JASPによるロジスティック回帰分析です。
例題は、
情報統計研究所の下記URLからダウンロード(ファイル名:LogisticReg.csv)して下さい。
例題は、
情報統計研究所の下記URLからダウンロード(ファイル名:LogisticReg.csv)して下さい。
http://kstat.sakura.ne.jp/dbase/dbaseJASP.html
適当なフォルダーに保存されましたか・・?
それでは、
いつもの様に、JASPを立ち上げ、保存先ホルダーから「LogisticReg.csv」を読込んで下さい。
いつもの様に、JASPを立ち上げ、保存先ホルダーから「LogisticReg.csv」を読込んで下さい。
サンプル・データの読込:
図1 サンプル・データ
赤色(×)のVar.3は使用しません。
例題の内容は、
「すぐに役立つ統計のコツ」(オーム社刊)の例題 18(106ページ)を見て下さい。
例題の内容は、
「すぐに役立つ統計のコツ」(オーム社刊)の例題 18(106ページ)を見て下さい。
JASPの実行:
*****
Regression→Logistic Regression
↓
図2 変数の選択
*****
Regression→Logistic Regression
↓
図2 変数の選択
3つの変数は名義尺度(0,1)ですが、ここでは共変量(Covariates)として扱います。
Factors として選択すれば交互作用の結果が出力されます。
↓
図3 検定統計量の選択
図3 検定統計量の選択
↓
図4 出力結果
図4 出力結果
Cofficients:回帰係数(Estimate)やオッズ比(Odds Ratio)など。
Confusion matrix:混同行列
Performance metrics:性能測定基準
Performance metrics:性能測定基準
ここで、
Confusion matrix から Performance metrics を次により計算することが出来ます。
Confusion matrix から Performance metrics を次により計算することが出来ます。
図5 Performance metrics の計算
ここで、
TN=True negative、TP=True positive、FN=False negative、FP=False positive
TN=True negative、TP=True positive、FN=False negative、FP=False positive
そして、
図4の Performance metrics は、
図4の Performance metrics は、
Sensitivity =TP/(TP+FN)=0.800 :感度、検出率(Recall)、再現率・・とか、
Specificity =TN/(TN+FP)=0.850 :特異度とか、
Precision =TP/(TP+FP)=0.842 :適合率、精度とか、
・・と呼ばれています。
なお、
情報検索の分野で良く用いられている指標に「F-mesure」があり、図3で☑するとF-mesure=2/(1/再現率+1/適合率)=0.821(調和平均)を求めるられます。
情報検索の分野で良く用いられている指標に「F-mesure」があり、図3で☑するとF-mesure=2/(1/再現率+1/適合率)=0.821(調和平均)を求めるられます。
主に、陽性と陰性の出現率が極端に偏っているような場合に用いられています。