todaeiji-weblog3
建築随想
異質の知性
今日までは、高度な知能はつねに、発達した意識と密接に結びついていた*01とユヴァル・ノア・ハラリさんはいいます。チェスをしたり、自動車を運転したり、病気の診断をしたり、テロリストを割り出したりといった、高い知能を必要とする仕事は、意識のある私たち人間にしかできなかった、というのです。ところが今では、そのような仕事を人間よりもはるかにうまくこなす、意識を持たない新しい種類の知能が開発されています。なぜなら、そうした仕事はみなパターン認識に基づいており、意識を持たないアルゴリズムがパターン認識で人間の意識をほどなく凌ぐかもしれないからだ、とハラリさんは指摘します。そして少なくとも軍と企業にとっては、知能は必須だが、意識や主観的経験は必要としない、というのです。
AIは人類がつくりだした最新のテクノロジーのひとつです。テクノロジーは文明に恩恵を与えるものとして発達してきました。人々はさらなる利便性を求め、次々と新たなテクノロジーを発明してきました。しかしそれは同時に「事故」を発明することでもあった、とフランスの思想家ポール・ヴィリリオ(1932-2018)*02さんは指摘します。テクノロジーは「事故」を、原罪のように生まれながらに背負っている、というのです。
「現代文明をそれまでの文明と隔てる一つの特徴、とりわけ明確な特徴、それは速度だ」*02とヴィリリオさんはいいます。速度(すなわち力)を得たテクノロジーは、事故を多発化し、重大化させてきたのです。そして同じく原罪として人類が背負ってきた戦争もまた、それら最新のテクノロジーを真っ先に使用し、人々を蹂躙してきたのです。
原子力もまず戦争の道具として使用されました。その後、その力の平和利用として開発された原子力発電所もチェルノブイリや福島第一原子力発電所の事故のように甚大な被害をもたらしています。
この重大な事故を招いた原発というテクノロジーは、たしかに禁断のテクノロジーであったのかもしれません。それでも即廃止という世論が圧倒的多数にならなかったのは、一方でこのテクノロジーが私たちの現代文明に与える利益がいかに膨大であったか、ということをよく示しています。
そしてさらに加速度を増したテクノロジーは、ついに極限の速度を手に入れました。それは遠く離れた場所と場所とを瞬時につなぐ、いわば無限大の速度を得た情報通信テクノロジーです。
ヴィリリオさんは、こうした情報テクノロジーの発達は、古来から続く物理的事故に加え“情報の事故”を引き起こす、と警告しています。すなわち従来の事故に情報の事故が加わって深刻度が累乗化される、というのです。
この情報の事故は、従来の物理的事故とは、あきらかにその質が異なっています。人間の身体能力をはるかに凌駕する速度と力を得たテクノロジーの暴走は人間を物理的に翻弄しますが、速度を超越したテクノロジーの発達は、むしろ人間の知性や心理的なものに揺さぶりをかけるのです。
ヴィリリオさんは、それが“良心なき知性の暴走”を引き起こすことを懸念していましたが、フェイクニュースやSNSの誹謗中傷など情報化社会の発達が人々の対立や分断を一層深刻なものにする状況を見ると、いままさにヴィリリオさんの懸念が現実化してきているのを実感することができます。
そしてAIの発達。AIも世界中を網羅する情報ネットワークの上に成り立っています。それは究極の速度を持つ新しい種類の知能として、私たちの現代文明に、良くも悪くも非常に大きな影響を与えるものと予想されています。「AI兵器」は火薬、核に次ぐ“第3の軍事革命”になる*03といわれ、ケヴィン・ケリーさんは、AIの普及は産業革命の何百倍もの規模で、われわれの生活に破壊的変革をもたらす*04と予想しています。
ケリーさんは、あらゆるところにAIが行き渡ることで、かえって隠れた存在になり、顔のない、見えないものになり「すべてを変える」力をもつようになる、といいます。さらにこのAIというテクノロジーはケリーさんもいうように「異質の知性(Alien Intelligence)」であり、それは「AA(Artificial Alien:人工異星人)」*04とでも呼ぶべき内実をもっているのです。
人工知能
*01:ホモ・デウス-テクノロジーとサピエンスの未来/ユヴァル・ノア・ハラリ/柴田裕之訳 河出書房新社 2019.09.06
*02:アクシデント 事故と文明/ポール・ヴィリリオ/小林正巳訳 2006.02.20
青土社
*03:「AI兵器」の衝撃 “機械は犠牲を理解できず”暗い未来の不安
*04:〈インターネット〉の次に来るもの-未来を決める12の法則/ケヴィン・ケリー/服部桂訳 NHK出版 2016-07-25
知能と意識の分離
スーパーインテリジェンス(人間の能力を超えるAI)へと続く道は、意識という隘路をそっくり迂回し、比べ物にならないほどの早道をたどるかもしれない*01と歴史学者のユヴァル・ノア・ハラリさんはいいます。
それは、AIを開発し、利用しようとしている人々にとって、知能と意識ではどちらのほうが本当に重要なのか、という問題も絡んできます。ハラリさんは、少なくとも軍と企業にとっては答えは単純明快で、知能は必須だが意識はオプションにすぎない、といいます。軍と企業は知能が高い行動主体なしでは機能できませんが、意識や主観的経験は必要としない、というのです。
生物の進化は、何百万年にもわたって、意識の道筋に沿って進んできていました。運動を制御するために発達してきた脳は、言語すなわち伝達記号をもって意識化された思考を生みだしてきました。高度な知能はつねに、発達した意識と密接に結びついてきたのです。ところが非生物であるコンピュータの進化はそのような道を通らないかもしれない、とハラリさんはいうのです。
たしかに、過去半世紀の間に、コンピュータの知能は途方もない進歩を遂げましたが、コンピュータの意識に関しては一歩も前進していません。この数年、特にChatGPTの登場以降、“感情”をもつAIがついに誕生か、と騒がれていますがその実態は一九五〇年代のプロトタイプと同じで、まったく意識を持つまでには至っていない、といっていいでしょう。
とはいえ、私たちは重大な変革の瀬戸際に立っている、とハラリさんはいいます。“人間”という存在自体が経済的な価値を失う危機に直面している。なぜなら、知能が意識と分離しつつあるからだ、というのです。
*01:ホモ・デウス-テクノロジーとサピエンスの未来/ユヴァル・ノア・ハラリ/柴田裕之訳 河出書房新社 2019.09.06
意識という隘路
ニーチェは、本来人間は、人と人との間のコミュニケーションのために「意識」を必要とした*01といいます。そして、いっさいの生あるものは人間と同じく絶えず考えてはいる、がそれを知らないでいる*01というのです。
ニーチェは、意識化された思考、つまり意識の素性は、言葉(伝達記号)によって営まれる、とも指摘します。そしてその言葉は社会的なもので、その社会的な言葉を用いなければ思考はできない*02のです。
この社会的な言葉とは、いま私たちが使っている日本語や英語などの「言語」という様態をとるものだけをいうのではありません。集団の中での社会的関係を構成するためのコミュニケーション手段のすべての様態をそれは指しています。それは地球に生息する多くの生き物たちもそれぞれのかたちでもっているものなのです。たとえばイルカは言葉を持っている、といわれていますが、それは人間に聞こえる10倍の高さの音を発し、聞くことによって行われています。また彼らは体の姿勢で意思疎通をおこない、水中では音を肌で感じることができます。それらすべてを社会的な言葉として彼らは集団のコミュニケーションを計っているのです。
会話するイルカたち
Indo-Pacific Bottlenose Dolphin, Red Sea/ Serguei S. Dukachev
イスラエルの歴史学者ユヴァル・ノア・ハラリさんは、何百万年にもわたって、生物の進化は意識の道筋に沿ってのろのろと進んできた*03と指摘します。今日までは、高度な知能はつねに、発達した意識と密接に結びついていた、というのです。
しかしいま、スーパーインテリジェンス(人間の能力を超えるAI)へと続く道はいくつかあり、意識という隘路を通るものは、その一部だけかもしれない、とハラリさんはいいます。非生物であるコンピュータの進化は、そのような隘路をそっくり迂回し、スーパーインテリジェンスへと続く別の、比べ物にならないほどの早道をたどるかもしれない、というのです。
*01:悦ばしき知識/フリードリッヒ・ニーチェ/ニーチェ全集8 信太正三訳 筑摩書房 1993.07.07
*02:対話がつくる心-運動意味論からみた対話/月本洋/心理学ワールド(64) 日本心理学会 2014.01
*03:ホモ・デウス-テクノロジーとサピエンスの未来/ユヴァル・ノア・ハラリ/柴田裕之訳 河出書房新社 2019.09.06
意識化された思考
AI( Artificial Intelligence=人工知能)は、人間の脳の神経回路の働きを、計算機モデルに変換したニューラル・ネットワーク・モデルから発展してきました。そして最新のAIはすでに人間を凌駕する「知能」をある意味獲得しており、また知性や感情についても同様の状況にある、といっていいでしょう。
では“意識”はどうでしょうか。
ドイツの哲学者フリードリヒ・ニーチェ(1844-1900)は、現生人類が意識というものを生み出すきっかけとなった淘汰圧と、そのプロセスを明らかにし、意識の素性を看破した最初の人物の一人といっていいでしょう。いまから140年ほど前の1880年代のことです。
friedrich-nietzsche-by-edvard-munch/1906
ニーチェは、「他者を理解すること」とは、他者の感情を自分の内で「模倣すること」である*01と言い当てます。人間はこのような他者の感情を理解する技術を、完成度の高い次元まで発達させており、他者の前ではつねに、ほとんど無意識にこの技術を使っている、と指摘します。
ニーチェのこの指摘は、脳科学の分野でいま、STSやEBAなどの脳内にある、視覚的情報として捉えた他者の身体や運動などに反応する領域の存在や、ミラーニューロンなどの他者の行為の観察と自分の行動の遂行とを、実質的に結びつける神経細胞(ニューロン)の発見などによりまさに実証されようとしています。
ニーチェはさらに他者を理解した人間は同類を必要とした、と続けます。人間は自分の危急を言い表わし、自分を分からせるすべを知らねばならず、こうしたすべてのことのために人間は、何はおいてまず「意識」を必要とした*02というのです。つまり意識とは、本来、人と人との間のコミュニケーションの網にすぎなかった、とニーチェは断言するのです。
人間はいっさいの生あるものと同じく絶えず考えてはいる、がそれを知らないでいる*02とニーチェはいいます。意識にのぼってくる思考は、その知られないでいる思考の極めて僅少の部分、いうならばその最も表面的な部分、最も粗悪な部分にすぎない、というのです。
ニーチェは、この意識化された思考が、言語をもって、すなわち伝達記号をもって営まれることに注目します。それこそが意識の素姓そのものであり、言葉の発達と意識の発達(理性の発達ではなく、たんに理性の自意識化の発達)とは、手を携えてすすむものだ、というのです。
このニーチェの卓見をその後、心理学者が理論化し、現代の知見がさらにその脳内の仕組みを明らかにしようとしています。旧ソヴィエトの心理学者レフ・ヴィゴツキー(1896-1934)*03は、社会的な外言は、内化され内言となり、それによって思考などの高次精神機能は発達すると考えました。人工知能研究の月本洋さん*04は、その言葉と意識の発達について、対話→外言→内言→思考の順に発達する、と説明します。
運動を制御するために発達した脳では、運動指令の遠心性コピーによって感覚結果が予測されるようになると、その一連の行為はルーティン化し、内在化します。するとそのルーティンにとって余分な情報は抑制されるようになりますが、発声聴覚系にもそれと同様の機構が存在する、と月本さん*04はいいます。
人間が言葉を発する場合、脳内の目標音声に基づいた運動指令が舌等の発声器官に送られますが、同時にこの運動指令の遠心性コピーが予測器に送られて予測音声に変換されます。
この状況を月本さんは黙読や内言をしているときは遠心性コピーを「聴いている」と説明します。つまり意識にのぼってくる思考とは、舌等の発声器官から音声として発せられない“言葉”なのです。それがニーチェのいう意識の素性ということであり、そして、この内言が高度に発達していくことによって思考が生まれてくる、というのです。
*01:曙光-道徳的偏見についての考察/フリードリッヒ・ニーチェ/ニーチェ全集9 氷上英廣訳 白水社 1997.12.01(原著1881)
*02:悦ばしき知識/フリードリッヒ・ニーチェ/ニーチェ全集8 信太正三訳 筑摩書房 1993.07.07
*03:思考と言語 新訳版/レフ・ヴィゴツキー/柴田義松訳 新読書社 2001.09.26
*04:対話がつくる心-運動意味論からみた対話/月本洋/心理学ワールド(64) 日本心理学会 2014.01
考える「自己」意識
地球上に生息する生き物たちは、動きを制御するために脳を進化させてきました。こうした生き物たちがもつ自然知能は、現実世界の中で次々と起こる出来事や状況変化にリアルタイムで対処できなければならず、常に「有効時間内での問題解決」*01というプレッシャー(時間圧)にさらされてきたのです。そしてそれに対処するために「判断することなき合理的考慮」、すなわち“感情”を必要としてきました。“感情”は、私たちに押し寄せる現実世界の様々な状況の中にあって、それらを「いいもの」「いやなもの」「こわいもの」といったふうに強く色づけて際立たせ、ある判断を別の判断より優先させるように私たちに否応なく迫ったのです。対外的な現実世界の中で生き残る知性にとっては、それは必要不可欠なものだったのです。
一方、脳を情報処理システムとみなした場合、その内部の処理にも“感情”と同様に、階層を超えて働く機能が必要となります。脳の情報処理システムは、並列性を持った処理機構の上になりたっているとみなせますが、その場合、階層的に重ねられた並列処理の病理的相互作用を遮り、リスタートさせるこころのオペレーティング・システムが必要となるのです。
生き物の振る舞いは、より高いレベルの振る舞いが低いレベルの振る舞いをつつみ込む―すなわち各層の目的は下位層の目的を包含している振る舞いの階層構造をつくっている、といわれています。ある層の振る舞いの中で、特に生体に重要な影響を与えるような信号が現れた時、それが階層を超えて振る舞いが包摂されるきっかけとなるのですが、この時の信号を神経学者のアントニオ・R・ダマシオさんはソマティック・マーカー*02と呼んでいます。ソマティック・マーカーは各層のレベルに応じて発現され、その都度、処理がより高次のレベルへと引き上げられていくことになるのです。それは環境世界の中で、ある一定の条件がそろった時に作動し、ある行動を別の行動より優先させる“感情”のシステムの神経的基盤を明らかにしたものといっていいでしょう。
AI研究の究極の目標は、人間と同じ知能、知性、感情を持ち、“意識”をもった存在を人工的につくりだすことにあります。そして最新のAIはすでに人間を凌駕する「知能」をある意味獲得しており、また知性や感情についても同様の状況にある、といっていいでしょう。
では“意識”はどうでしょうか。“意識”にのぼってくる思考、考える「自己」意識*03は人工的につくりだすことはできるのでしょうか。
考える「自己」意識の獲得
*01:脳の中の2枚の鏡-「運動-感覚」と「内受容感覚-感情」のミラー機能/大平英樹/ミラーニューロンと〈心の理論〉/子安増生・大平英樹編/新曜社 2011.07.15
*02:無意識の脳・自己意識の脳-身体と情動と感情の神秘/アントニオ・R・ダマシオ/田中光彦訳/講談社 2003
*03:〈理解を操作する〉ことが“考える”「自己」意識を生む/2018-04-01
「包摂」する階層構造
こころを情報処理システムの複雑な例とみなした場合、心理学では、実世界で何がどのように働いているかを人間が思考する時にこころの中に構築されるモデルをメンタル・モデル(mental model)*01と呼んでいます。認知科学者のフィリップ・ジョンソン=レアード(Phlip N. Johnson-Laird 1936 - )さんは、それをコンピュータ・システムとの関連で再提起*02しました。
彼は、意識の基本的システムとして、並列性を持った処理機構の上で、中央の機構が全体を管理する並列的で階層的なシステムを「こころのオペレーティング・システム」*03と呼んでいます。
並列システムの場合、処理を高速におこなうことができるだけでなく、ある処理機構が故障しても他が補うことで様々な障害に強いといったメリットがある一方、単純な並列システムの場合、容易に相互衝突による病理的状況が発生してしまうというデメリットも持っています。そのためそれらを上位から管理し保護する機構が必要となるのですが、この病理的相互作用をコントロールするためにつくられた管理機構こそが、われわれの「意識」の起源なのだ*03と、ジョンソン=レアードさんは主張するのです。
このこころのオペレーティング・システムと下位機構の関係は一種の情報隠蔽関係によっておこなわれていて、管理機構であるこころのオペレーティング・システムは、下位機構の詳細については何も知らず、内部の処理方式については関与しない、というのです。それは並列システムの中のひとつの処理機構が直接他の内部機構を変えると、相互作用によって不安定で予測できない結果をもたらす可能性が大きくなるからで、信頼できる相互作用方式は処理機構間のメッセージの受け渡しにのみ依存するものとなる、というのです。
このジョンソン=レアードさんの「こころのオペレーティング・システム」を、実際にモノをつくりあげる工学的立場から再構築し、ロボットの分散コントロール手法として提案したのが、ロドニー・A・ブルックスさんの「サブサンプション・アーキテクチャー(subsumption architecture)」*04でした。
サブサンプションとは「包摂」という意味ですが、ここでブルックスさんは、ロボットの行動のより高いレベルの振る舞いが、低いレベルの振る舞いをつつみ込んでいる、つまり各層の目的は下位層の目的を包含している、といった振る舞いの階層構造をつくることを意図したのです。
The Computer and the Mind: An introduction to Cognitive Science/1989/1/1/Philip Johnson-Laird
*01:The Nature of Explanation /Kenneth Craik/1943
*02:メンタルモデル-言語・推論・意識の認知科学/P.N.ジョンソン=レアード/海保博之監修 AIUEO訳 産業図書 1988.09.30
*03:心のシミュレーション-ジョンソン=レアードの認知科学入門/フィリップ・ジョンソン=レアード/海保博之・中溝幸夫・横山詔一・守一雄訳 新曜社 1989.11.10
*04:表象なしの知能/ロッドニイ・A・ブルックス/柴田正良訳 現代思想 1990.03 青土社
生き残っていくための道具
地球上に生息する生き物たちの脳は、動きを制御するために進化してきました。世界で存在し反応することの本質である可動性と、正確な視覚と、動的な環境世界のなかで生存に関連する作業をやってのける能力*01の獲得こそが、生き物たちの脳が発達した最大の理由だったのです。
さらに生き物たちの自然知能は、現実世界の中で次々と起こる出来事や状況変化にリアルタイムで対処できなければなりませんでした。それに対処できなければ自然の中で生き残っていくことはできなかったのです。
このような生き残っていくための道具、すなわち知性は、常に「有効時間内での問題解決」というプレッシャー(時間圧)にさらされていました*02。この時間圧に耐えられない知性はただ滅亡するしかなく、それに耐える能力は、むしろ知性にとっての最低条件だったのです。
哲学者の柴田正良さん*02によれば、自然の中で生きる知性のこうした特性、つまり自然知性一般に特有の《時間圧への優先的な配慮》を可能にするのは、「判断することなき合理的考慮」、すなわち“感情”ということになります。私たちの“感情”は、私たちに押し寄せる現実世界の様々な状況の中にあって、それらを「いいもの」「いやなもの」「こわいもの」といったふうに強く色づけて際立たせ、ある判断を別の判断より優先させるように私たちに否応なく迫るのです。
“判断する”とは、ものごとの真偽・善悪などを見極め、それについて“自分の考えを定める”こと*03ですが、“感情”とは、自分の考えを定めるというプロセスを経ずに、ものごとへの対処を“合理的”に行うことなのです。この合理性とは、環境世界の中で生き抜く生き物たちが永い時間をかけてつくりあげてきたものにほかなりませんでした。
ある判断を別の判断より優先させるという知性のこのシステムは、階層的に重ねられた並列処理の病理的相互作用を遮り、リスタートさせるこころのオペレーティング・システムの構築を意味するものでもあったのです。
*01:表象なしの知能/ロッドニイ・A・ブルックス/柴田正良訳 現代思想 1990.03 青土社
*02:ロボットの心―7つの哲学物語/柴田正良/講談社 2001.12.20
*03:国語辞書類
脳の存在理由
私たちは、自分が何者であるかを知るためにAIを必要としています。AI( Artificial Intelligence=人工知能)は、人間の脳の神経回路の働きを、計算機モデルに変換したニューラル・ネットワーク・モデルから発展してきました。
AI研究の究極の目標は、人間と同じ知能、知性、感情を持ち、“意識”をもった存在を人工的につくりだすことにある、といっていいでしょう。現在の最新のAIは、スーパーコンピュータの力をつかって「学習」「推論」する能力を獲得しており、すでにチューリングテスト(知能をもった機械かどうか判定するテスト)に合格*01し、「情報が不足した状況で適切に処理する能力」を獲得しているという点で「知能」を持っている*02といわれています。
人間の知能は、地球に根差した生き物たち-特に動物たち-の多くが、46億年の地球の歴史をかけて進化し、獲得してきたものの集大成といっていいでしょう。ロボット工学の立場から、AI研究に重要な視点を提供してきたロドニー・ブルックスさんは、真の知能の発展にとって必要不可欠な基盤とは何かを探るうえで、生物的進化が時とともにどのように推移してきたか、ということを顧みることが重要だ*03と指摘します。
最初の単細胞生物が原始の海に出現したのはおおよそ35億年前といわれています。その後、最初の魚類と脊椎動物が登場するのは、今から5億5000万年前のことです。つまり「生存と生殖を最低限保持するのに十分なほど周囲を知覚し、動的な環境世界を動き回ることのできる能力」*03を生命が獲得するまで、実に30億年もかかっている、とブルックスさんはいいます。知能にとってこの段階は、進化がその時間を最も多く費やしたところでした。そのことは、それが他の部分よりもはるかに厄介な問題だったことを示してる、とブルックスさんはいうのです。
ところが、こうした「世界で存在し反応することの本質」*03がいったん獲得されると、その後の知能の進化は加速度的に進行します。昆虫の発生が4億5000万年前。爬虫類3億7000万年前、恐竜3億3000万年前と続き、哺乳類が2億5000万年前に誕生します。そして最初の霊長類は1億2000万年前、類人猿の直系の祖先は1800万年前、我々人類は250万年前に登場しました。その後人類が農耕を始めたのが1万9000年前、文字を書くようになったのは5000年前、「自然科学」的知識の急激な発展はここ数百年のことなのです。
こうした生物的進化の過程を見ると「可動性と、正確な視覚と、動的な環境世界のなかで生存に関連する作業をやってのける能力」*03の獲得こそが、真の知能の発展にとっての不可欠の基盤を提供してきたことがよくわかる、とブルックスさんは指摘します。そしてケンブリッジ大学のダニエル・ウォルパートさんも主張するように、人間をはじめ多くの生き物が脳を持つ理由、それは柔軟で複雑な動きを可能にするためで、脳は動きを制御するために進化*04してきたのです。
*01:Scott, Cameron. "Study finds ChatGPT's latest bot behaves like humans, only better | Stanford School of Humanities and Sciences".2024.02.22
*02:知能の物語/中島秀之/公立はこだて未来大学出版会 2015-05-31
*03:表象なしの知能/ロッドニイ・A・ブルックス/柴田正良訳 現代思想 1990.03 青土社
*04:Filmed July 2011 at TEDGlobal 2011/ダニエル・ウォルパート: 脳の存在理由
AIを必要とする理由
人間の知能・知性と似て非なるもの、それが、AIが獲得しつつある知能・知性なのかもしれません。
そもそも知能・知性とは何かを考えるうえで、生命科学の発展やAIの研究・開発は大きな役割を果たしてきました。
ところが、顔認証システム、囲碁・将棋のAIソフト、自動車の自動運転等々、それらを達成することができるのが超知的なAIのみだ、とかつては主張されてきたのですが、この数年、AIがそれらを成し遂げるたびに、私たちはそれが単なる機械であって真の知性とは言えない、と考えるようになっている*01とケヴィン・ケリーさんは指摘します。AI(人工知能)に「機械学習(マシン・ラーニング)」というラベルを貼ったのがその例です。AIが何かを成し遂げるごとに、それを非AIとして再定義しているのです。
ケリーさんは、過去60年以上にわたり、人間に固有だ、と考えてきた振る舞いや才能を、機械的プロセスがそっくり再現してきたことで、私たちをそれらと分かつものは何か、と絶えず考えてこなくてはならなかった、と振り返ります。そしてより多くの種類のAIが発明されれば、人間に固有だと思われていたものをさらに放棄せざるを得なくなるだろう*01というのです。
これからの30年、もしくは次の世紀まで、人間は一体何に秀でているのか、と絶えずアイデンティティの危機に哂されることになるだろう、とケリーさんはいいます。もし自分が唯一無二の道具職人でないなら、あるいはアーティストや倫理学者でないなら、人間を人間たらしめるものはいったい何だろうか?と問い続けることになるだろう、というのです。
日々の生活で役立つAIのもたらす最大の恩恵は、効率性の増大や潤沢さに根ざした経済、あるいは科学の新しい手法といったものではなく(もちろんそうしたことはすべて起こりますが)、それが人間性を定義することを手助けしてくれることだ、とケリーさんはいうのです。
私たちは、自分が何者であるかを知るためにAIを必要としているのです。
*01:〈インターネット〉の次に来るもの-未来を決める12の法則/ケヴィン・ケリー/服部桂訳 NHK出版 2016-07-25
不気味の谷
最新のAIは「学習」と「推論」という能力を持ち、すでにチューリングテスト(知能をもった機械かどうか判定するテスト)に合格*01し、さらに「情報が不足した状況で適切に処理する能力」を獲得しているという点で「知能」を持っている*02ともいわれています。しかしながら、完成したニューラル・ネットワークの思考の仕組みはブラックボックス化していて、人間が読み解くのは難しく、現時点では、ほぼ不可能に近いのです。
こうして出現したAIのもつ知能とは、果たして私たちが知っている、あるいは理解できる「知能」なのでしょうか。
コットレルさんの顔認識ネットワークの共同研究者であるジャネット・メトカルフェさん*03が再現したホロンHolonと名付けられた画像*04は、シナプス結合の最適な重みづけ配置の正確な値を把握し、私たちが容易に理解できるように画像化したものでした。それは元の訓練セットに含まれていたどの顔とも一致しない、顔の全体論的な特徴を表わしたものでしたが、出力された画像を見ると、それははたして人の顔なのだろうか、と思われるものも含まれていました。画像の粗さ(解像度の低さ)を別にしても、目が窪み黒ベタされたもの、逆に飛び出して見えるもの、鼻や口がつぶれているもの、頬の半分がケロイド状になったもの等々、それはまるでゾンビを見るようでもありました。
このように数値的にすべてのシナプス結合の正確な値がわかっているネットワークでさえ、その意味するところ(再現された画像)は、既知のものとは似て非なるものとなっているのです。それがいまは数億倍のパラメータ数をもつAIへと発展し、しかもその思考プロセスはブラックボックス化しているのです。
こうしたAI発展にともなう様々な脅威については、AI兵器や様々な職種を人々から奪い取るのではないか*05といった問題を多くの人々が論じ、危惧しているところですが、人知を超えるAIへの不安、不気味さについて、あらためてメトカルフェさんの再現したホロン画像をみるとき、「不気味の谷」*06を感じてしまうのは私だけでしょうか。
AIのこの不可解さ、不気味さは、まさにArtificial Alien(人工異星人)と呼ぶべきではないか*08といったケヴィン・ケリーさんの主張通りなのかもしれません。
ホロンの六つの例*04
*01:Scott, Cameron. "Study finds ChatGPT's latest bot behaves like humans, only better | Stanford School of Humanities and Sciences".2024.02.22
*02:知能の物語/中島秀之/公立はこだて未来大学出版会 2015-05-31
*03:EMPATH: Face, Emotion, and Gender Recognition Using Holons. /Garrison W. Cottrell, Janet Metcalfe:/1990
*04:認知哲学-脳科学から心の哲学へ/ポール・M・チャーチランド/信原幸弘・宮島昭二訳/産業図書 1997.09.04
*05:ホモ・デウス-テクノロジーとサピエンスの未来/ユヴァル・ノア・ハラリ/柴田裕之訳/河出書房新社 2018.09.06
*06:「不気味の谷」とは、工学者の森正弘さん*07が見出した、人形やロボットなどの「ひとがた」がリアル(現実=ヒト)に近づけば近づくほど、それまでの親和性から突然畏怖や怯え、あるいは恐怖さえ感じてしまうという現象のことです。動物学者のコンラート・ローレンツさんが見出した動物種に共通する「攻撃」を説明する種の近さと攻撃性のグラフに出現するくさび型カーブの相似形や、それを非線形系に出現する不連続変化として、数学者のルネ・トムさんがまとめたカタストロフィ理論につながるものでもあります。
*07:不気味の谷/森正弘/Energy (エナジー)Vol.7 No.4 /1970.10 /エッソ・スタンダード
*08:〈インターネット〉の次に来るもの-未来を決める12の法則/ケヴィン・ケリー/服部桂訳 NHK出版 2016-07-25
ブラックボックス
AI( Artificial Intelligence=人工知能)の最大の特徴は、自ら「学習」する能力と、その学習成果を利用して、情報が欠損したり、不足した状態でも適切に処理する「推論」という能力を持っていることです。そしてGPT-4などの最新の大規模言語モデルは、非常に高い性能を有していて、ほぼ「知能」を持っていると見做してもよいのではないか、とも言われています。
そこで問題となるのが、このような高い性能を誇るAIモデルが、実は、どのような思考を経て応答を出力しているのかが、開発者ですら把握できていない、という問題です。
AIは、人間の脳の神経回路の働きを、計算機モデルに変換したニューラル・ネットワーク・モデルを根幹とするもので、シナプス結合の最適な重みづけ配置が「学習」によって獲得されたものです。
カリフォルニア大学サン・ディエゴ校のガリソン・コットレルさんが1990年に発表した顔認識ネットワークでは、最適な重みづけ配置がなされた中間層がわずか一層であったことから、ネットワーク内のどのふたつの細胞についても、それらをつなぐシナプス結合の正確な値を知ることができました(ちなみに、このモデルで最適化する必要のある変数(シナプス結合)の数(パラメータ数)は、32万8320個でした)。しかし現在のAIネットワークは、中間層が多層なうえに、膨大な入力資源をもとに、スーパーコンピュータの能力をつかって、いわば力づくで、自動的に実行されていったものなのです(OpenAI社のGPT-3.5のパラメータ数は1750億個、最新のGPT-4はその500倍の100兆個ともいわれています)。それは、莫大な数のニューロンをつなぐ莫大な数のシナプスの「重みづけ」の複雑な関係を表現したネットワークであり、この「重みづけ」すなわち計算根拠をひとつずつ解明するのは、現時点では、ほぼ不可能に近いことなのです。
これをAIのブラックボックス問題と呼んでいます。
完成したニューラル・ネットワークの思考の仕組みはブラックボックス化していて、人間が読み解くのは難しく、したがって修正や評価も困難ということになります。それはたとえばAIを使った車の自動運転のように、人の命を左右するようなシステムの場合、万が一AIの判断ミスで事故が起こってしまっても、その原因を突き止めることが困難になることを示唆しています。このような問題のあるAIシステムの利用は当然懸念材料となります。
そこで、AIの開発者たちはニューラル・ネットワークの思考を理解する手法の開発に取り組んでいます。昨年の10月にはニューラル・ネットワークをニューロン単位ではなく「features (特徴)」という単位にまとめる手法が発表*01されました。ニューラル・ネットワークを特徴ごとに分類することで、たとえば「法律文章に反応する特徴」「DNA列に反応する特徴」といった解釈可能なパターンを見つけ出すことが可能となる、というのです。さらに今年の6月には、OpenAI社が大規模言語モデルの思考を読み取る手法を開発し、GPT-4の思考を1600万個の解釈可能なパターンに分解できたことを発表*02しています。しかしながら、それでも同社はGPT-4の動作全体を分析することはできておらず、また、特徴の検出はニューラル・ネットワークを理解する1つのステップに過ぎない、といいます。同社は、さらなる理解のためには多くの作業が必要と述べていて、未解決の課題を解決するべく研究を続ける姿勢を示しています。
Black box systems
*01:ニューラル・ネットワークの中身を分割してAIの動作を分析・制御 する試みが成功、ニューロン単位ではなく「特徴」単位にまとめるのがポイント/2023-10-10/ GIGAZINE
*02:OpenAIがGPT-4の思考を1600万個の解釈可能なパターンに分解できたと発表/2024-06-07/GIGAZINE
情報が不足した状況で適切に処理する能力
コットレルさんの顔認識ネットワークは、人間の脳の神経回路の働きを、計算機モデルに変換したニューラル・ネットワーク・モデルで、訓練セットの写真に対して、顔性、性別、誰の顔か、についての正解率が100%になるようにシナプス結合の最適な重みづけ配置*01がなされていました。
こうして調整されたネットワークを「学習(training)」済みネットワークと呼んでいますが、この“学習済み”モデルを使うと、まったく新しい対象や人物、部分的に欠損した「既知の」人の顔なども判断することができたのです。
これは入力画像の情報が、第二層の全細胞に分散されたことによって、各細胞には入力層全体に関する重要な情報が(密度の濃淡はあれ)含まれていること。それによって、細胞やシナプスが散在的に失われても、その失われた部分を他の細胞のもつ情報によって補うことが可能となっていること。さらに、ネットワークの訓練中に次第に出現し安定化した第二層の細胞の活性化空間の分割という「カテゴリー」の出現によって、あらたに入力された情報もそのカテゴリー上のどこかに位置づけられ、それによって、顔性や性別の判断が可能になること、などによって、ネットワークは多少の機能低下を起こすだけで、なお非損傷状態に十分近い機能水準を維持するだけではなく、全く新しい情報にもそれなりに対処することができたのです。このプロセスと結果は、「推論(inference)」と呼んでも差し支えないものといえるでしょう。
コットレルさんのこの顔認識ネットワークは1990年に発表されたものですが、その後、様々なアルゴリズム的課題、問題に対し、数多くの数学的・計算機的改良が施されます。そしてその処理範囲は画像認識から自然言語処理へと拡張され、加えてコンピュータ・テクノロジーの飛躍的進歩と、インターネットの普及による膨大な計算資源の獲得によって、現在の、多層パーセプトロンである深層学習(ディープ・ラーニング)と生成AIという成果に繋がっているのです。しかも、それらは人の神経細胞の情報伝達の仕組みを模したニューラル・ネットワークを基盤としています。AIの大きな特徴である「学習」と「推論」という特性は、基本的には前述してきたような仕組みに基づいている、といっていいでしょう。
特にこの「推論」という特性は、情報が欠損したり、不足した状態でも正解に近い成果を導き出すことのできるAIの能力として知られています。
人工知能研究の中島秀之さんは、知能の定義を「情報が不足した状況で適切に処理する能力」*02としています。この定義に従えば、「推論」という特性を示す最新のGPT-4oなどは、その人間に対する対応能力の高さからも、十分知能があるといっていいのかもしれません。
*01:認知哲学-脳科学から心の哲学へ/ポール・M・チャーチランド/信原幸弘・宮島昭二訳/産業図書 1997.09.04
*02:知能の物語/中島秀之/公立はこだて未来大学出版会 2015-05-31
概念の出現
コットレルさんの顔認識ネットワークの第二層で形成されたホロン画像は、顔のまったく全体論的な特徴ないし次元であるように思われた、とチャーチランドさんは指摘*01します。そして彼は、その訓練されたネットワークの第二層の細胞によって構成される80次元の空間を図示しています(下図参照)。もちろん、要点を視覚的につかめるようするために、80次元のうち77次元を省略し、典型的な3つの次元だけで済ませていますが。
学習後の第二層ニューロン活性化空問の階層的分割構造(略図)*01
ここで注目すべきことは、ネットワークの訓練により、この空間をふたつの領域に分ける仕切りがあることだ、とチャーチランドさんは指摘します。すなわち、この空間は、主として顔をコード化する大きな領域と、主として顔でない対象をコード化する、原点近くの小さな領域に分けられる、というのです。この後者の領域が非常に小さいのは、第二層の細胞が顔でない入力に対してはほとんど反応しないからで、第二層の活動がおもに顏の識別に費やされるように、結合の重みが配置されているからだ、と彼は説明します。
顔の領域には、さらにそれを男の顔と女の顔に分ける仕切りがあり、このふたつの領域はほぼ同じ大きさで、それは双方の領域におけるネットワークの識別力がほぼ等しいことを反映している、と彼はいいます。ネットワークはほぼ同数の男と女の顔によって訓練されていましたから、これは驚くに当たらない、というのです。
このような、第二層の細胞の活性化空間の分割は、チャーチランドさんがいうように「カテゴリーとしかよびようがない」ものですが、それらはネットワークの訓練中に次第に出現し安定化したものなのです。
このような階層的に仕切られた領域の出現により、ネットワークが習得する認識・識別の技能を、たんにシナプス結合の観点からではなく、それを越えたさらなる観点から記述し説明することが可能になった、とチャーチランドさんはいいます。ネットワークが訓練中に作り出していくのは、ひと組の初歩的な概念、適切な種類の多様な感覚入力によって活性化される概念であり、認知的な生き物における概念の出現とは、学習によるニューロン活性化空間の分割にほかならない、というのです。
*01:認知哲学-脳科学から心の哲学へ/ポール・M・チャーチランド/信原幸弘・宮島昭二訳/産業図書 1997.09.04
顔の全体論的な次元を表すもの
コットレルさんの顔認識ネットワークの第二層の80個の細胞に投影され、「重みづけ」がなされて第三層に出力されたものを、ジャネット・メトカルフェさんはホロンHolonと名付けました。
このホロンとはなんなのか、どんな特徴をもっているのか、引き続きチャーチランドさんの解説*01を引用しましょう。
第二層で形成されたホロン画像は、鼻の長さや口の大きさ、両眼の距離、といった局所的な顔の特徴に焦点を合わせているのではありませんでした。それは、各細胞が入力層の全表面を包含し、顔の孤立的な特徴ではなく全体的な構造を表現したものだったのです。ここで選択された選好刺激(この細胞がもっとも好む入力パターン)は元の訓練セットに含まれていた個々の顔とは一致しませんでした。むしろ、それらの選好刺激は、顔のまったく全体論的な特徴ないし次元であるように思われた、とチャーチランドさんは指摘しています。
日常言語には、このような次元を表す適当な言葉が存在しませんが、それにもかかわらず、ある顔が入力層に提示されると、これら80個の全体論的な特徴がそれぞれ、さまざまな程度に活性化され、その結果、第二層においてその顔に特有の活性化ベクトルが形成されていったのです。
また、入力層に同じ人の異なる写真が提示されても、第二層の細胞は本質的に同じ活性化ベクトルを形成し、そのため、第三層の出力細胞はその人を正しく同定することができたのです。
入力画像の各画素は第二層のすべての細胞にそれぞれ微小な影響を及ぼします。つまり、各画素の情報は第二層の全細胞に分散されるのです。また、第二層の各細胞は入力層全体に関して少なくとも一部の重要な情報を含んでいます。したがって、細胞とシナプスがネットワーク全体にわたって散在的に失われても、ネットワークは多少の機能低下を起こすだけで、なお非損傷状態に十分近い機能水準を維持することができたのです。
コード化された表現およびその変形の両方がネットワーク全体にわたって広く分散されているので、表現についても変形についても「ボトルネック」となるところが存在していない、とチャーチランドさんは指摘します。つまり、そこに損傷が起こるとネットワークの機能が大きく低下するような簡所は存在しない、というのです。
左:帯によって五分の一隠した顔の入力画像。
右:コットレルの圧縮ネットワークの中間層における表現は、隠された入力領域を、残りの部分と整合的な特徴で補充する*01
*01:認知哲学-脳科学から心の哲学へ/ポール・M・チャーチランド/信原幸弘・宮島昭二訳/産業図書 1997.09.04
Holon
コットレルさんの顔認識ネットワークの振舞いは最終的にすばらしいレベルに達した*01とチャーチランドさんは評します。訓練セットの写真については、顔性、性別、誰の顔かに関して、正解率は100%でした(これは当初の目標どおりの成果といっていいでしょう)。ところがこの顔認識システムは、そのほかにも、まったく新しい対象や人物についてもその顔性と性別(その人の名前[コード番号]については当然ながらわかりませんが)に関して高い確率で正解したのです。さらに特筆すべきは、「既知の」人の顔を五分の一だけ水平の帯で隠した場合でも、ネットワークの成績はほとんど落ちなかった*01というのです。
この成果を受けてチャーチランドさんは次のような問いを発します。
この訓練されたネットワークは、いったいどんなふうにして、このようなことを成し遂げたのか。この驚くべき技能を実現するために、ネットワークの内部でどんなことが起こっているのか。
コットレルさんたちのさらなる研究成果に対するチャーチランドさんの説明*01を引用し、この問いについて話をすすめていきたいと思います。
まず、チャーチランドさんは、コットレルさんのネットワークの第二層にある80個の細胞に着目しています。人間の「網膜」にあたる第一層の入力層は64×64画素に相当する4096個のグリッド細胞からなっていて、各細胞は256段階の異なる活性化度合い(すなわち「明度」)を示すことができました。そして各入力細胞は第二層の80個の(標的)細胞すべてに対して、出力装置である軸索の枝を放射状に伸ばし接続しているのです。つまり第二層の80個の細胞のそれぞれには、入力画像を80分割した断片が投射されているのではなく、入力画像の全体像が80の細胞ひとつひとつに投射されていたのです。そこに逆伝播法によって最適に調整された「重み」が個々に加算されていたのです。
では、ネットワークの第二層の細胞によってコード化されたのは、顔のどんな特徴なのでしょうか。言い換えればネットワークが訓練期間中、容赦ない圧力(調整の繰り返し)にさらされながら、次第に見出していったのは、どんな有効なコード化方法だったのでしょうか。
これについては、コットレルさんのこのネットワークでは、中間層の80個の細胞すべてに対して、この問いにはっきりした明確な答えを与えることができました。それは、このネットワークを訓練したコンピュータ内では、ネットワーク内のどのふたつの細胞についても、それらをつなぐシナプス結合の正確な値を知ることができたからです。
それぞれの顔細胞に対するネットワークの最終的な入力配置を読み出すことによって、その細胞の最適な刺激を構成する網膜入力パターン(これは、この細胞がもっとも好む入力パターンという意味で、その細胞の選好刺激(preferred st imulus)と呼ばれています)を再現できたのです。そしてじっさい、私たちが自分の目で見ることができるような、画像の形で、それを再現することができたのです。
コットレルさんの共同研究者であるジャネット・メトカルフェ(Janet Metcalfe)さん*02は、こうして再現されたものに、入力層全体にわたる選好刺激の拡散的性格を表すものとして、ホロンHolonという名称を与えました。
ホロンの六つの例。これらは顔認識ネットワークの第二層にある細胞の選好刺激の例です。各選好パターンが入力空間全体にわたっている点に注意。*01
*01:認知哲学-脳科学から心の哲学へ/ポール・M・チャーチランド/信原幸弘・宮島昭二訳/産業図書 1997.09.04
*02:EMPATH: Face, Emotion, and Gender Recognition Using Holons. /Garrison W. Cottrell, Janet Metcalfe:/1990
« 前ページ |