歪曲される情報を見る。

日本を馬鹿(馬鹿文系)が叩く、だが、それはどの程度正しいのか?非常に疑問である。

1度はCで書かれているコードを見よう。『決定木とは?利用場面やランダムフォレスト・Xgboostなどの応用手法についても見ていこう!』(スタビジbyウマたん・2020/06/14)

2021年09月01日 16時41分04秒 | 技術超越国家日本の眩しい未来それは現実だ!

アドレスは以下の通り
https://www.youtube.com/watch?v=Gu31SuTwUZw
「スタビジbyウマたん」にケチ付ける訳じゃないが、正直R言語とPython(或いはJupyter)の簡便な機能にゾッとした。
まぁJupyterで機械学習の45分x15巻の動画をこなしたが「実感」もなくR言語はNHKのコロナ感染データが面白くて手を染めたが、インストールが糞で、Rstudio以外は、動いたり動かなかったりしている。
それでカリキュラムを勝手にこなしていると「回帰分析」がlm()と言う関数で一発で回答が出る事に驚愕した。
いや「回帰分析」自身は「屁」みたいな、演算だが、其れ相応に手間がかかるもので、1コマンド1行で、やられた日にゃ、「屁」みたいな演算が益々軽くなって「透かしっ屁」になりそうな勢いだろう。
この機械学習のサイトは、ソコソコの論理的説明をして、サンプルデータを引っ張ってきて計算結果を出して「御終い」である。「回帰分析」では、傾きと切片の数値だけである。まぁ統計情報をサマリーとして出しているが、無味乾燥でしかない。
機械学習の関係者ってのは、こんなモノかい?俺は回帰分析って言やぁランダムっぽい点と座標系に一本の線が引かれている姿を想像する。それが俺の「回帰分析」のイメージだ。
一回流れが出来てからなら「簡単」も結構だが、ライブラリー化、関数化、クラス化されるとアルゴリズムの可視性とデータのハンドリングが全く見えなくなる。
RやJupyterは、コードはスクリプトで、計算速度を稼ぐためにライブラリーはコンパイルされ、いよいよ実態は箱の中である。
いっぺんK最近値法と決定木のCでのコードを見たが、K最近値法は、実に簡単で10秒で終わったが、決定木のコードはC++で書かれて、インクルードファイルに<vector>が入っていて追うのに苦労した。
ここはそれ、捨てる神あれば拾う神ありで、「だうえ」氏のコードが頃合いが良いようで、七面倒臭いC++とは別世界の心地よさだった。
決定木の説明も実に細やかで感心したが、SVCやランダムフォレスト、アンサンブル、ロジスティック関数などの分析は載っていなかった。
ううん…残念…
だが、これは多少の傷を我が「壊れかけの蛾次郎」脳に付けてくれた。大いに為になった。