谷田部卓著『やさしく知りたい先端科学シリーズ2 ディープラーニング』(2018年3月20日創元社発行)を読んだ。
ゼロからはじめる機械学習の基本早わかり
ディープラーニング(機械学習、深層学習)はAI、人工知能の急速な進化に寄与している。知能とは何かを問うということは、人間の考え方や視覚、聴覚、言語といった普段なにげなく使っている感覚と脳の関係を一から考え直すことにほかならない。本書はディープラーニングとはどういう技術なのか、そのしくみと最新の動向をわかりやすい文章とイラストで解説する。話題の先端科学に触れたいという知的好奇心に応えるイラスト図解シリーズ第2弾。
もう30年以上前のことだが、私の傍にニューラルネットワークの研究をしているグループが居たので、私も解っているような気になっていた。最近ディープラーニングという言葉を聞くことが多く、ニューラルネットとの違いは単に層が深く、データ量が多いだけなのか、気になっていた。この本のタイトルを見て、私にもわかりそうな、いやわかったような気分になれそうな本だと思った。
それにしても、かってはバカにしていた「やさしく知りたい……」とか「あなたにもわかる……」とかいう本を読むほど落ちぶれた自分に同情してしまう。
ニューラルネットワーク(NN)の歴史
1958年、ローゼンプラットがハードウェアで結合重みを学習で決めるパーセプトロンを発表
1969年、ミンスキーがパーセプトロンは線形分離可能な問題しか学習できないと数学的に証明。NNはその後10年の冬の時代に入る
1980年、NHK技研の福島邦彦らが脳の視覚野をモデルにネオコグニトロンを発表
1982年、ホップフィールドが連想記憶モデルとなるNNを発表
1986年、ラメルハートが誤差逆伝播法を、ルカンが畳み込みNNを発表したが、計算に膨大な時間がかかることなどから再びNNは冬の時代に入る
2012年、世界的画像認識コンテストでCNNがエラー率を10%も向上させ圧倒的性能を見せつけ、画像認識ではディープラーニングが主役になった
2016年、Googleの子会社になったDeepMind社のAlphGoが囲碁の世界王者イ・セドルに4勝1敗と圧勝
2017年、AlphGoZeroは、囲碁のルールだけを教えられたあと、過去の棋譜、定石を学ばずに3日間自己対戦しただけでAlphGoに100戦全勝した
目次
1.機械学習とは
2.ディープラーニングのしくみ
3.AIアプリケーションの開発方法
4.AI技術とビジネス
私の評価としては、★★★★☆(四つ星:お勧め、 最大は五つ星)
ディープラーニングに関して、広く・浅く、概要がわかりやすく書いてある。しかし、なぜそうなのかについては簡単な説明図があるだけなので、素人には疑問が沸きあがり、その理由をかすかにイメージすることしかできない。
各節の最後には問答(DL Talk)で理解を助け、4つ挿入されたコラム(AI Story)では天才の悲劇などが紹介され、AIの歴史的変遷が語られる。
たとえ文科系の人でも、先端技術に興味がありかたくなな拒否反応がない人なら、知的興味を手軽に満たすことができる。また、時代に置いて行かれた技術者が、わかったふりして議論に口をはさむためには役に立つ。
谷田部卓(やたべ・たかし)
1957年栃木県生れ。神奈川県在住。1980年、国立宇都宮大学工学部電子工学科卒業。
製版機メーカー、精密機器メーカーを経て、大手ソフトウェア会社に入社。Webサービスの企画開発、ITコンサルティング業務に長年にわたり従事。機械学習の調査検討を進め、新規サービスの企画設計開発を担当。機械学習の社内講師を務めた後、退職。
現在、自営業として主に人工知能に関するITコンサルティング及びデータサイエンティスト業務に従事。
著書に電子書籍「ビジネスで使う機械学習 Kindle版」「よくわかるディープラーニングの仕組み Kindle版」。
以下、私のメモ
チューリングの悲劇
「万能チューリング・マシン」の概念を発明した彼は、ドイツのエニグマ式暗号機の解読装置メンバーに加わり、1941年解読装置開発に成功しイギリスを救った。彼は、さらに戦後、コンピュータ開発に携わり、「チューリング・テスト」を発表した天才的コンピュータ学者だった。
1952年彼は同性愛の罪で逮捕され、彼は「事実について争うつもりはありません。しかしその上で無罪を主張します。私の行いが罪であるべきではないからです」と主張した。イギリスを救ったエニグマ解読装置は極秘とされ、彼は裁判でも触れなかったため有罪となった。
矯正のため定期的に打たれた女性ホルモンのため「胸が膨らみ自分が違う人間になっていく」と手紙で訴えていたが、1954年41歳で自殺した。青酸化合物のビンがあり、齧りかけのリンゴがあった。なお、Apple社のリンゴは彼がかじったリンゴだとの噂がある。(あくまで噂)
機械学習
- 協調フィルタリング(ユーザーベースレコメンデーション):対象者と似た利用者を複数探し出し、多くの人が高評価で、対象者が未購入の商品をおすすめする。
- 教師データ:入力値(実績値)とその結果
- 過学習(Overfitting):教師データに合わせ過ぎた状態。教師データの70%で学習させ、残り30%で検証するホールドアウト法で精度を良くする。
- 特徴量:二つの文章が似ているかどうか判定するため数値化した単語や文章。非可逆圧縮なので同一文章の他の単語とは区別できるが、もとの単語は再現できない。
特徴量を求める方法には、隣り合って出現したN単語の出現頻度を求める「N-gram処理」と、複数の文書で横断的に使用している単語は重要でなく、対象文書内では頻度が高い単語が特徴的であるという考え方に基づく「TF-IDF処理」がある。 - 日本語の自然言語処理:形態素解析→構文解析→意味解析→文脈解析と進める。形態素解析は「MeCab」OSS(オープンソフト)とIPA辞書により各単語を切り出し分割する。……。
ディープラーニング(ディープニューラルネットワークDNN)のしくみ
認識とは、分類することである。なぜなら認識するということは、対象となるものをすでに自分が取得した概念(言葉)に割り当てることだからだ。
生成と認識は対である。なぜなら対象物を認識したなら、その認識過程を遡ることで、割り当てた概念(言葉)から対象物を生成できるからだ。
ディープラーニング(=深層学習・DNN):多層のニューラルネットワークを用いた機械学習。特徴量の抽出までやれることが最大の特徴。画像や音声データの解析精度が高い。
大量の教師データから自動で学習(特徴量を自動抽出)するのでチューニングは必要ない。
従来の画像認識手法の代表であるBag-of-Feature は、画像特徴量を利用する教師ありの機械学習アルゴリズムで、この画像特徴量とは、隣り合う画素間の輝度値の差が大きい箇所である画像特異点をベクトルで表したもの。
ディープラーニングの画像認識分野で、CNN(Convolution(畳み込み) Neural Network)が、従来の最小エラー率25%を10%以上向上させ、最初に華々しい成果をあげた。従来の画像特徴点を使用せず、自動で特徴を抽出し、しかも画像の移動、回転、異なるサイズにも対応可能だった。
可変長の時系列データである音声を認識するRNN(Recurrent Neural Network)は、隠れ層の値を再び隠れ層に入力するネットワーク構造を持つ。
AIアプリケーションの開発方法
MS,IBM,GoogleやNTTドコモ、goo、富士通などがクラウドでの使いやすいAPIサービスを行っている。