Random Forestを使って線形ではないモデルを作るレポート（論文）の書き方

2022-01-12 09:11:59 | AI・BigData

線形回帰を使ってモデルを作る場合は、その作り方は

１．従属変数間の散布図を載せて

２．どの従属変数をつかったらいいか、

　　　　AICを使ってステップワイズ法により変数を選ぶか、

　　（探索的）因子分析を使って次元圧縮するか

　　　　（因子数は、スクリープロットで決める）

　　して、モデルに必要な変数を選び、

３．その変数で線形回帰モデルを作成して、

　　　各変数の特徴をのべ（切片と、係数の議論）

４．その線形回帰モデルが適正かどうかを議論する

　　　→決定係数を議論：交互作用がモデルにあると、よくない値になる

っていうことで、レポートにできる。

でも、線形回帰だと、上に書いたように、交互作用があると、

あまりよくないし、そもそも、モデルは線形にしていいかどうかわからない。

（非線形かも？）

Random　Forest（ランダムフォレスト）を使うと、その点、

交互作用があっても、線形でなくても、予測を当ててくるので、

もっといいモデルができるけど、

Random Forestの場合、モデルがブラックボックスのため、

　どの変数を減らしたらいいかとか、

　変数ごとの動き、

　交互作用について

述べることができなかった。

ところが、ここ最近のXAIの研究により、

　どの変数を減らしたらいいか→PFI

　変数ごとの動き→PD

　交互作用について→ICE

を使うと、回帰分析のような流れで、Random Forestのモデルで議論できる

ようになった

→つまり、線形回帰ではなく、Random　Forestでモデルつくって、

レポート、あるいは論文が書けるってこと。

その方法について、

機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック

森下光之助

技術評論社

っていう本に書いてあるんだけど、そのことに気付かないで

「この本、何のためにあるの？」と言っていた人がいたので、

みんなでRandomForestの書き方をシェア。

上記に書いた、線形回帰の場合をもとに、その本のどこに書いてある何を使えば、線形回帰のノリで、Random Forestが書けるかについて、書いておきます。

１．従属変数間の散布図を載せて

　　→これは、線形回帰と同じ

２．どの従属変数をつかったらいいか、

　　→PFIを使って、変数を絞り込む。

　　　３章参照

３．その変数で線形回帰モデルを作成して、

　　　各変数の特徴をのべ

　　→PDを使って、各変数の動きを、PDPで表現する

　　　４章参照。PDPは、そこに出てくる図のこと

４．その線形回帰モデルが適正かどうかを議論する

　　→Random Forestの適合性で言えるけど、

　　　交互作用の議論は、ICEで出来る。５章参照

なお、プログラムについて、サンプルはPythonだけど、Rでやりたい場合は

付録Aを参照。

ちなみに、上記の本の各章の作り方は、だいたい決まっていて、

　　なんでその処理を行うのか

　　処理の内容

　　因果関係との関係

　　実データを使って実行

という流れになっているので、実データを使っているところを参考にして、実際のモデルを作ればいい。

１章は、お話

２章は、線形回帰の問題点が書かれている（Random Forestを使う理由を書きたいとき参考になる）

６章のSHAPは、モデルができた後で、予測をするときに使う

（予測は予測でまた、レポートの書き方が違うので、気分が向いたら別エントリで書くかも？）

付録Bは、２章の逆で、今回使ったPFI等を線形回帰に使っても、妥当であることを示している→なのでRandom Forest特有の話ではないということを言いたいときに使う。

こういうように、レポートを書くのに、ばっちり使えるので、この本は人気なんだと思う。

ランキングに参加中。クリックして応援お願いします！

日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

アクセス
閲覧	1,595	PV
訪問者	995	IP
トータル
閲覧	34,358,556	PV
訪問者	8,433,123	IP
ランキング
日別	365	位
週別	455	位

	goo blogは20周年を迎えました！
	訪問者数に応じてdポイント最大1,000pt当たる！
	皆さんにおすすめしたい人気ブログをご紹介
	今週のお題「#ガーデニング」をチェック

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）