Googleの機械学習モデル「Transformer」は、データを時系列に処理しなくても、自然言語などのデータを翻訳やテキスト要約することが可能で、ChatGPTなどの自然な会話が可能なチャットAIのベースとなっています。また、Transformerの手法を画像分野に応用したモデルが「Vision Transformer」です。ソフトウェアエンジニアのデニス・タープ氏が、「Vision Transformer」のコンポーネントがどのように機能し、データはどのような流れをたどるのか、ビジュアル化して解説しています

A Visual Guide to Vision Transformers | MDTURP
https://blog.mdturp.ch/posts/2024-04-05-visual_guide_to_vision_transformer.html

« 東工大スパコン「TSUBAME4.0... | トップ | Meta、大規模言語モデルの最... »

このブログの人気記事

最新の画像［もっと見る］

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

日	月	火	水	木	金	土
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

アクセス
閲覧	288	PV
訪問者	205	IP
トータル
閲覧	5,008,312	PV
訪問者	1,266,768	IP

	dアカウント連携で最大2,000ptのdポイントプレゼント
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！
	goo blogは20周年を迎えました！

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは？

Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは？

このブログの人気記事

コメントを投稿

「Weblog」カテゴリの最新記事

カレンダー

Twitter

最新記事

検索

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは？

Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは？

このブログの人気記事

コメントを投稿

「Weblog」カテゴリの最新記事

カレンダー

Twitter

最新記事

検索

ログイン

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ