臨床上の質問における大規模言語モデルのパフォーマンス比較

2024年04月14日 | AI・機械学習

Han T, Adams LC, Bressem KK, et al.
Comparative Analysis of Multimodal Large Language Model Performance on Clinical Vignette Questions.
JAMA. 2024 Mar 18:e2327861. Epub ahead of print. PMID: 38497956.

NEJMからemail-alertが来るたびに、最近はChatGPT（有料）、Gemini（無料）、Claude 3（無料）にImage Challangeの問題文をコピペして遊んでいる。ほとんどは正解するんだけど、時々答えが違う時があって面白い。違うときはほぼChatGPTが正解なのだけど、それって有料だからなんだろうなと思っていたが、どうもそうでもないらしい。

« ICU設計の変更が譫妄とメラト... | トップ | 血症性ショックにおける毛細... »

このブログの人気記事

最新の画像［もっと見る］

モニタに表示する血圧の測定値は平均血圧だけにしちゃえばいいのに。 2週間前
2007年から2021年までの中国におけるICU病床数の変化 2ヶ月前
2007年から2021年までの中国におけるICU病床数の変化 2ヶ月前
BlendedICUデータセットの紹介 2ヶ月前
ICUにおける血液ガスのベストプラクティス 3ヶ月前
入院患者の診断におけるAIの影響を測定してみた。 4ヶ月前
COVID-19の低酸素患者におけるICU外でのHFNCの安全性と治療成績 4ヶ月前
病院のコーヒーメーカーは病原菌を媒介するか？ 4ヶ月前
日本の病院のICUベッド数（R4年度） 5ヶ月前
日本の病院のICUベッド数（R4年度） 5ヶ月前

コメントを投稿

「AI・機械学習」カテゴリの最新記事

2024年5月
日	月	火	水	木	金	土
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

検索

アクセス状況

アクセス
閲覧	754	PV
訪問者	418	IP

goo blog おすすめ

おすすめブログ

@goo_blog

お客さまのご利用端末からの情報の外部送信について

goo blog お知らせ

	goo blogは20周年を迎えました！
	訪問者数に応じてdポイント最大1,000pt当たる！
	皆さんにおすすめしたい人気ブログをご紹介
	今週のお題「#GW」をチェック

Dr内野のおすすめ文献紹介

集中治療関連の文献紹介が主な趣旨のブログ。
しかし、セミリタイアした人間の文献紹介なんて価値があるのか？

臨床上の質問における大規模言語モデルのパフォーマンス比較

このブログの人気記事

コメントを投稿

「AI・機械学習」カテゴリの最新記事

カレンダー

ブックマーク

プロフィール

バックナンバー

検索

最新記事

カテゴリー

アクセス状況

goo blog おすすめ

goo blog お知らせ

Dr内野のおすすめ文献紹介

集中治療関連の文献紹介が主な趣旨のブログ。 しかし、セミリタイアした人間の文献紹介なんて価値があるのか？

臨床上の質問における大規模言語モデルのパフォーマンス比較

このブログの人気記事

コメントを投稿

「AI・機械学習」カテゴリの最新記事

カレンダー

ブックマーク

プロフィール

バックナンバー

検索

最新記事

カテゴリー

アクセス状況

goo blog おすすめ

goo blog お知らせ

集中治療関連の文献紹介が主な趣旨のブログ。
しかし、セミリタイアした人間の文献紹介なんて価値があるのか？