Han T, Adams LC, Bressem KK, et al.
Comparative Analysis of Multimodal Large Language Model Performance on Clinical Vignette Questions.
JAMA. 2024 Mar 18:e2327861. Epub ahead of print. PMID: 38497956.
NEJMからemail-alertが来るたびに、最近はChatGPT(有料)、Gemini(無料)、Claude 3(無料)にImage Challangeの問題文をコピペして遊んでいる。ほとんどは正解するんだけど、時々答えが違う時があって面白い。違うときはほぼChatGPTが正解なのだけど、それって有料だからなんだろうなと思っていたが、どうもそうでもないらしい。
Comparative Analysis of Multimodal Large Language Model Performance on Clinical Vignette Questions.
JAMA. 2024 Mar 18:e2327861. Epub ahead of print. PMID: 38497956.
NEJMからemail-alertが来るたびに、最近はChatGPT(有料)、Gemini(無料)、Claude 3(無料)にImage Challangeの問題文をコピペして遊んでいる。ほとんどは正解するんだけど、時々答えが違う時があって面白い。違うときはほぼChatGPTが正解なのだけど、それって有料だからなんだろうなと思っていたが、どうもそうでもないらしい。
※コメント投稿者のブログIDはブログ作成者のみに通知されます