日々の寝言~Daily Nonsense~

Google DeepMind が世界モデル生成 AI Genie を発表

2024/2/23 の天皇誕生日に Google DeepMind が発表した
世界モデル生成 AI Genie
が話題になっている。

arXiv の論文はこちら。
Genie: Generative Interactive Environments

Genie は、Interactive Generative Environment
であり、Foundation World Model の一種、
とされているように、「世界モデル」つまり、
ユーザのアクションに対して
一貫した反応を返してくる仮想世界や
AI エージェントを生成できる AI らしい。

これまで、世界モデルを学習させるには、
世界を観測したデータと、
世界で行ったアクションのデータ
の両方が必要だったが、
Genie では、アクションを潜在変数とする
Latent Action Model を使うことで、
世界の観測データだけから
世界モデルを獲得できるのが
一つのポイントのようだ。

今回、画像から 2D ゲームが生成できる AI、
というように紹介されているが、
それは一つの例題で、その本質は
アクションを潜在変数とする
多様な世界モデルの学習と生成なので、
ゲームに限らず、いろいろな世界の観測データから
そこで起こっているアクションを推測して、
アクションで制御できる世界+エージェントを
仮想的に構築することまでを射程に入れている
と思われる。

インタラクティブなゲームというのは、
アクションに対して状態が変わって
画面が変わると言う意味で、
世界モデルの一種だ。

上の発表でも、リアルな世界で動く
ロボットにも応用できる、
とされている。

ChatGPT のような対話エージェントも
ある意味では世界モデルの一種なので、
そういうものの生成も視野に入っている
かもしれない。

外界や人間とインタラクションしながら
動作する AI エージェントを生成する
メタな AI と考えると、AGI の基盤になる技術
という説明がされているのもなんとなくわかる。

DeepMind はずっとゲームの世界で
学習し続けるエージェントの研究を
してきているので、その路線の上にある研究成果
ともいえるが、一つメタな階層にあがった
ともいえるのかもしれない。

関連する技術として、たとえば OpenAI は
ゲームのプレイ動画だけから
ゲームのプレイを学習するエージェントについての論文
を出していたが、Genie は、既存のゲームの
プレイのしかたを学習するのではなく、
ゲーム自体を生成する。

Microsoft も 2/4 に
Foundation World Model に関する論文
arXiv に出している。

OpenAI の動画生成 AI
"Sora" が発表されたばかりだが、
生成 AI の界隈は、今年も、
面白いものが出てきそうだ。
  • Xでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

最新の画像もっと見る

最近の「PC、IT、AI」カテゴリーもっと見る

最近の記事
バックナンバー
人気記事