Goopleが開発した囲碁のプログラムがプロ棋士に勝利した。5戦5勝だそうである。プロ棋士と言ってもヨーロッパのプロ棋士だから日本のプロ棋士に比べれば大分落ちるのだろうが、その棋譜を見て私自身「これは自分より強そうだ」と思った。数年前までは「強いと言ってもまだ人間に比べると大分劣る。自分なら勝てるだろう」と思っていたのとは大きな違いである。来月には世界的なトップ棋士である韓国のイ・セドル氏と戦うそうだから、これに勝てば日本の名人もかなわないとみて間違いない。
Googleの囲碁プログラムが強くなったのはディープ・ラーニングというAIの手法を用いてポリシーネットワークとバリューネットワークを開発したからだという。ポリシーネットワークとはある局面で可能な候補の手数をその時の石の配置を見て絞り込むもので、教師付き学習でプロ棋士同士の棋譜を入れるなどして学習させた。バリューネットワークとは形勢を判断するものでこれによって何手先まで読んで、読みを打ち切るかを決める。これにモンテカルロ法というシラミ潰し的に読みを入れる従来の手法を組み合わせる。
私自身囲碁のプログラムを作ってみたことがあるのだがその時の経験からすると、このバリューネットワークがとても作れそうにない、という感じだった。最後まで読み切って勝ちと分かればその手を選択すればよいのだがそれは現実的には不可能なのでどこかで読みを打ち切らなくてはならない。自分自身、ある程度で読みを打ち切っているのだが、それが1手先の時もあれば30手先の時もある。プロ棋士も同じだと思う。そこをどうして決めているのかを自分自身「言語化できそうにない」と感じたものである。
これには経験から来るルールが必要である。つまりある局面があって次の手を決めるのだが、その手に対して相手が応じないとひどいことになる「重要な次の手」がある場合には読みを継続しなくてはならない。そしてそういった継続的「重要な次の手」がなさそうな場合に「一段落」と判断してその時に優勢かどうかを判断する、というのが人間のやっていることで、「重要な次の手」がありそうかどうかを形で判断してありそうだと思えば時間をかけて読みを入れる。つまりプロ棋士は形から「重要な次の手」がありそうかということを石の配置から判断するルールとして持っているのだが、このルール形成を教師付き学習で実現したというのが今回のGoogleのプログラムの特徴になると思う。
これはあらゆる分野に応用できる。裁判官の判決を出す判断のベース、医師の検査データからの診断の判断、金融専門家の投資判断など現在高収入を得ている人たちの判断がコンピュータにかなわなくなる日も近いだろう。その中でも一流の人たちは独自のルールで判断しており他の人が着眼していない判断ルールを持っていてこのデータを学習させることはなかなか難しいと思うが、2流の人たちの判断はあっさりとAIに負けるようになると思う。
現在世界では中間層の没落が言われているが、これからは中間層の上位、富裕層の下位の没落が大きな問題となると思う。