todaeiji-weblog3
建築随想
情報が不足した状況で適切に処理する能力
コットレルさんの顔認識ネットワークは、人間の脳の神経回路の働きを、計算機モデルに変換したニューラル・ネットワーク・モデルで、訓練セットの写真に対して、顔性、性別、誰の顔か、についての正解率が100%になるようにシナプス結合の最適な重みづけ配置*01がなされていました。
こうして調整されたネットワークを「学習(training)」済みネットワークと呼んでいますが、この“学習済み”モデルを使うと、まったく新しい対象や人物、部分的に欠損した「既知の」人の顔なども判断することができたのです。
これは入力画像の情報が、第二層の全細胞に分散されたことによって、各細胞には入力層全体に関する重要な情報が(密度の濃淡はあれ)含まれていること。それによって、細胞やシナプスが散在的に失われても、その失われた部分を他の細胞のもつ情報によって補うことが可能となっていること。さらに、ネットワークの訓練中に次第に出現し安定化した第二層の細胞の活性化空間の分割という「カテゴリー」の出現によって、あらたに入力された情報もそのカテゴリー上のどこかに位置づけられ、それによって、顔性や性別の判断が可能になること、などによって、ネットワークは多少の機能低下を起こすだけで、なお非損傷状態に十分近い機能水準を維持するだけではなく、全く新しい情報にもそれなりに対処することができたのです。このプロセスと結果は、「推論(inference)」と呼んでも差し支えないものといえるでしょう。
コットレルさんのこの顔認識ネットワークは1990年に発表されたものですが、その後、様々なアルゴリズム的課題、問題に対し、数多くの数学的・計算機的改良が施されます。そしてその処理範囲は画像認識から自然言語処理へと拡張され、加えてコンピュータ・テクノロジーの飛躍的進歩と、インターネットの普及による膨大な計算資源の獲得によって、現在の、多層パーセプトロンである深層学習(ディープ・ラーニング)と生成AIという成果に繋がっているのです。しかも、それらは人の神経細胞の情報伝達の仕組みを模したニューラル・ネットワークを基盤としています。AIの大きな特徴である「学習」と「推論」という特性は、基本的には前述してきたような仕組みに基づいている、といっていいでしょう。
特にこの「推論」という特性は、情報が欠損したり、不足した状態でも正解に近い成果を導き出すことのできるAIの能力として知られています。
人工知能研究の中島秀之さんは、知能の定義を「情報が不足した状況で適切に処理する能力」*02としています。この定義に従えば、「推論」という特性を示す最新のGPT-4oなどは、その人間に対する対応能力の高さからも、十分知能があるといっていいのかもしれません。
*01:認知哲学-脳科学から心の哲学へ/ポール・M・チャーチランド/信原幸弘・宮島昭二訳/産業図書 1997.09.04
*02:知能の物語/中島秀之/公立はこだて未来大学出版会 2015-05-31