『拡散モデル』『ＧＡＮ』『ＬＬＭ』

2025年05月05日 | ＩＴ

🌸世界のシミュレーターとしての生成ＡＩ

　☆少し難しいですが、読めば理解できます

⛳拡散モデルのからくり
　☆生成ＡＩは、脳の知能とは現実世界のシミュレーターである　

　☆生成ＡＩは多種多様である
　＊その裏側では、さまざまなアルゴリズムが走っている
　＊画像生成ＡＩは、拡散モデルというアルゴリズムで作られている

　☆アルゴリズムとは
　＊画像生成ＡＩの現在主流となっている「拡散モデル」

　＊既存の画像に徐々にノイズを加えてから

　＊最終的にはノイズだけの画像に変換する

　（この過程を「拡散」という）

　＊次にこのプロセスを逆回転させて

　＊徐々にノイズを消して元の画像を再現する

　＊拡散モデルでは、このトレーニングを積み重ねて

　＊ノイズから画像を作り出すスキルを身につけていく
　☆素材となる「ノイズ」を与えるだけでは

　＊機械学習が勝手に勘違いし

　＊ありもしないリアルな絵を作ってしまう

⛳ニセ画像生成装置と進化競争で画像を作り出すＧＡＮ
　☆ＧＡＮはノイズから画像を作るのは同じだが

　＊訓練方法が拡散モデルとはかなり違う

　☆ＧＡＮはノイズから画像を作る生成器と

　＊生成器が作ったニセ画像と本物の画像を判別する判別器からなる
　☆生成器はなるべく本物そっくりの画像を生成するように

　＊パラメータをチューニングする
　☆判別器は生成器の作ったニセ画像を本物の画像と区別できるように

　＊パラメータをチューニングする

　☆これを交互に繰り返し、生成器が本物と区別がつかない

　＊精緻な画像を作り出せるようにするのがＧＡＮの仕組み

　☆拡散モデルにおいても、ＧＡＮにおいても

　＊ノイズから脱ノイズして意味のある画像を作るという過程で

　＊ニューラルネットワークが使われている

　☆コンピュータにノイズにまみたの画像を与え

　＊「ノイズを取り除いたらどんな画像になりますか？」という

　＊当て物を学習させていると言ってもいい

⛳大規模言語モデルで活躍するアルゴリズム「トランスフオーマー」
　☆短い文章からハイクオリティのＣＧ動画を生成したＳｏｒａ

　＊拡散トランスフォーマーという技術が使われていた

　＊画像生成Ａｌのアルゴリズムである「拡散モデル」と

　＊チャットＧＰＴを含む大規模言語モデル（ＬＬＭ）を採用する

　＊トランスフォーマーというまた別のアルゴリズムを結合した

　＊ハイブリッドモデルである

　☆ＬＬＭで使われているトランスフォーマーのキーとなる技術は

　＊「セルフアテンション」というもので

　＊文を入力して穴埋め問題を解かせると

　＊なぜか文中の単語の関係を学習してしまう「謎機能」を持っている

　＊プロセスに、ニューラルネットワークが使われている

　　　　　　　　　　　　　　　　　　　　　　　　（敬称略）
⛳知識の向上目指し、記事を参考に自分のノートとしてブログに記載
⛳出典内容の共有、出典の購読、視聴に繋がればと思いブログで紹介
　☆記事内容ご指摘あれば、訂正・削除します
⛳私の知識不足の為、記述に誤り不明点あると思います
⛳投資は、自己責任、自己満足、自己判断で
⛳詳細は、出典原書・記事・番組・画像でご確認ください
⛳出典、『知能とはなにか』

2025年8月
日	月	火	水	木	金	土
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

慶喜

心意気 「明日迄の命の気持ちで、人生を！」 「不老不死の気持ちで、知識の習得を！」

『拡散モデル』『ＧＡＮ』『ＬＬＭ』

このブログの人気記事

コメントを投稿

「ＩＴ」カテゴリの最新記事

goo blog お知らせ

プロフィール

ログイン

goo blog おすすめ

カレンダー

最新記事

カテゴリー

最新コメント

バックナンバー

ブックマーク

心意気
「明日迄の命の気持ちで、人生を！」
「不老不死の気持ちで、知識の習得を！」