Dr内野のおすすめ文献紹介

集中治療関連の文献紹介が主な趣旨のブログ。
しかし、セミリタイアした人間の文献紹介なんて価値があるのか?

臨床上の質問における大規模言語モデルのパフォーマンス比較

2024年04月14日 | AI・機械学習
Han T, Adams LC, Bressem KK, et al.
Comparative Analysis of Multimodal Large Language Model Performance on Clinical Vignette Questions.
JAMA. 2024 Mar 18:e2327861. Epub ahead of print. PMID: 38497956.


NEJMからemail-alertが来るたびに、最近はChatGPT(有料)、Gemini(無料)、Claude 3(無料)にImage Challangeの問題文をコピペして遊んでいる。ほとんどは正解するんだけど、時々答えが違う時があって面白い。違うときはほぼChatGPTが正解なのだけど、それって有料だからなんだろうなと思っていたが、どうもそうでもないらしい。
コメント    この記事についてブログを書く
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« ICU設計の変更が譫妄とメラト... | トップ | 血症性ショックにおける毛細... »
最新の画像もっと見る

コメントを投稿

AI・機械学習」カテゴリの最新記事