🌸世界のシミュレーターとしての生成AI
☆少し難しいですが、読めば理解できます
⛳拡散モデルのからくり
☆生成AIは、脳の知能とは現実世界のシミュレーターである
☆生成AIは、脳の知能とは現実世界のシミュレーターである
☆生成AIは多種多様である
*その裏側では、さまざまなアルゴリズムが走っている
*画像生成AIは、拡散モデルというアルゴリズムで作られている
*その裏側では、さまざまなアルゴリズムが走っている
*画像生成AIは、拡散モデルというアルゴリズムで作られている
☆アルゴリズムとは
*画像生成AIの現在主流となっている「拡散モデル」
*画像生成AIの現在主流となっている「拡散モデル」
*既存の画像に徐々にノイズを加えてから
*最終的にはノイズだけの画像に変換する
(この過程を「拡散」という)
*次にこのプロセスを逆回転させて
*徐々にノイズを消して元の画像を再現する
*拡散モデルでは、このトレーニングを積み重ねて
*ノイズから画像を作り出すスキルを身につけていく
☆素材となる「ノイズ」を与えるだけでは
☆素材となる「ノイズ」を与えるだけでは
*機械学習が勝手に勘違いし
*ありもしないリアルな絵を作ってしまう
⛳ニセ画像生成装置と進化競争で画像を作り出すGAN
☆GANはノイズから画像を作るのは同じだが
⛳ニセ画像生成装置と進化競争で画像を作り出すGAN
☆GANはノイズから画像を作るのは同じだが
*訓練方法が拡散モデルとはかなり違う
☆GANはノイズから画像を作る生成器と
*生成器が作ったニセ画像と本物の画像を判別する判別器からなる
☆生成器はなるべく本物そっくりの画像を生成するように
☆生成器はなるべく本物そっくりの画像を生成するように
*パラメータをチューニングする
☆判別器は生成器の作ったニセ画像を本物の画像と区別できるように
☆判別器は生成器の作ったニセ画像を本物の画像と区別できるように
*パラメータをチューニングする
☆これを交互に繰り返し、生成器が本物と区別がつかない
*精緻な画像を作り出せるようにするのがGANの仕組み
☆拡散モデルにおいても、GANにおいても
*ノイズから脱ノイズして意味のある画像を作るという過程で
*ニューラルネットワークが使われている
☆コンピュータにノイズにまみたの画像を与え
*「ノイズを取り除いたらどんな画像になりますか?」という
*当て物を学習させていると言ってもいい
⛳大規模言語モデルで活躍するアルゴリズム「トランスフオーマー」
☆短い文章からハイクオリティのCG動画を生成したSora
⛳大規模言語モデルで活躍するアルゴリズム「トランスフオーマー」
☆短い文章からハイクオリティのCG動画を生成したSora
*拡散トランスフォーマーという技術が使われていた
*画像生成Alのアルゴリズムである「拡散モデル」と
*チャットGPTを含む大規模言語モデル(LLM)を採用する
*トランスフォーマーというまた別のアルゴリズムを結合した
*ハイブリッドモデルである
☆LLMで使われているトランスフォーマーのキーとなる技術は
*「セルフアテンション」というもので
*文を入力して穴埋め問題を解かせると
*なぜか文中の単語の関係を学習してしまう「謎機能」を持っている
*プロセスに、ニューラルネットワークが使われている
(敬称略)
⛳知識の向上目指し、記事を参考に自分のノートとしてブログに記載
⛳出典内容の共有、出典の購読、視聴に繋がればと思いブログで紹介
☆記事内容ご指摘あれば、訂正・削除します
⛳私の知識不足の為、記述に誤り不明点あると思います
⛳投資は、自己責任、自己満足、自己判断で
⛳詳細は、出典原書・記事・番組・画像でご確認ください
⛳出典、『知能とはなにか』
⛳知識の向上目指し、記事を参考に自分のノートとしてブログに記載
⛳出典内容の共有、出典の購読、視聴に繋がればと思いブログで紹介
☆記事内容ご指摘あれば、訂正・削除します
⛳私の知識不足の為、記述に誤り不明点あると思います
⛳投資は、自己責任、自己満足、自己判断で
⛳詳細は、出典原書・記事・番組・画像でご確認ください
⛳出典、『知能とはなにか』



『拡散モデル』『GAN』『LLM』
(『知能とはなにか』記事他より画像引用)
※コメント投稿者のブログIDはブログ作成者のみに通知されます