ここのところ更新できませんでした。仕事とともにAI(人口知能)にかかわる「学習」が忙しかったのです。
AIも定義次第でいろいろあると思いますが、私が学習していたのは、画像や音声の認識にかかわるような分野(これだけに限りませんが)です。
簡単な例としては、人間が手で書いた数字を読み込んで、それが0から9のどの数字なのかを判断させるプログラムがあります。
原理は、数字の画像をタテヨコ16×16=256のドットの情報にして、その入力から、0である確率、1である確率、、、9である確率の10個の出力をおこないます。入力256→出力10とするので、情報を集約する方向ではありますが、ときには情報を膨らませることが有効な場合もあります。
I次元の入力をJ次元の出力に変換するときは、J×I行列を使い、これを何層にも重ねていきますが、判断の精度をあげるためにいろいろなテクニックがあります。詳細は以下のような本に書かれています(全部に目をとおすのは大変ですが)。これから時間に余裕があれば、それぞれの書評というか感想を書いていきたいと思います。
統計と似て非なる領域ですが、IoT等とも深く関連し、新しい分野であるだけにそのポテンシャルも大きく、期待感とともに世の中が騒ぐのもうなずけるところです。