goo blog サービス終了のお知らせ 

Dr内野のおすすめ文献紹介

集中治療関連の文献紹介が主な趣旨のブログ。
しかし、セミリタイアした人間の文献紹介なんて価値があるのか?

SCCM系雑誌への投稿の準備と審査におけるAIの適正使用

2024年02月21日 | AI・機械学習
Buchman TG, Tasker RC.
Fair Use of Augmented Intelligence and Artificial Intelligence in the Preparation and Review of Submissions to the Society of Critical Care Medicine Journals: Critical Care Medicine, Pediatric Critical Care Medicine, and Critical Care Explorations.
Crit Care Explor. 2024 Jan 19;6(1):e1017. PMCID: PMC10798684.


Statements
2. (途中から)For example, “Dr. Smith submitted the text to the Generative Pretrained Transformer version 4.0 (GPT-4.0) to analyze the spelling, grammar, syntax and usage of the prose and to propose edits that conform to standard scientific English.” Such reporting is always appropriately included in the Methods section of the submission.

4. Certain uses of artificial intelligence during the creation of the report are strongly discouraged. These discouraged uses include creation of prose, tables, or figures; creation of reference lists to accompany prose that is either already written or being generated by computers.

AIに文章を書いてもらったり図表を作ってもらうのはダメだけど、文章を直してもらうのはOKと。

Critical CareもOKだったし、SCCM系の雑誌もこれでOKをもらったし。もうビビらずに、どの雑誌に投稿する時も、
"ChatGPT-4.0 was used to analyze the spelling, grammar, syntax and usage of the prose and to propose edits that conform to standard scientific English.”
これをコピペしてMethodsに貼って、英文校正にお金を払うのはやめようかなと思っている。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

入院患者の診断におけるAIの影響を測定してみた。

2023年12月31日 | AI・機械学習
JAMAにAI関連のRCTが掲載された。
僕の今年の最後の文献紹介としては相応しいと思うので、ちょっと長めに紹介。

Jabbour S, Fouhey D, Shepard S, et al.
Measuring the Impact of AI in the Diagnosis of Hospitalized Patients: A Randomized Clinical Vignette Survey Study.
JAMA. 2023 Dec 19;330(23):2275-2284. PMID: 38112814.


呼吸不全の診断を普段からしている418人の医療者(医師、NP、PA)に、9例の呼吸不全患者の情報(既往歴、現病歴、身体所見、検査所見、胸部レントゲン)を見せて、肺炎か心不全かCOPDなのかを診断させた。詳細は省くけど、情報提供の方法をいろいろ工夫して、下記の比較ができるようにした。
・自分だけで診断する
・AIの診断が見られる
・AIの診断と、その診断をした画像所見の説明も見られる
・バイアスのかかったAIの診断が見られる
・バイアスのかかったAIの診断と、その診断をした画像所見の説明も見られる
・コンサルトした人の診断も見られる(実際は100%正解)
その結果、自分だけで診断した正解率は73%で、情報提供により、
・AI:+2.9%
・AI+説明:+4.4%
・バイアスAI:-11.3%
・バイアスAI+説明:-9.1%
・コンサルト:+8.1%
と正解率が変化した。

面白い。
もちろん、誰が何を診断するか、どのようなAIの情報提供が行われたかによって、影響の程度は異なるのだろうけど、少なくともこの環境では、
・AIによって少し診断率が向上
・バイアスのかかったAIによって大きく診断率が悪化
・AIの診断根拠を提示されても影響は少ない(正しい情報に自信が持てたり、間違った情報を見破ったりはあまりできない)
という結果になったと。

自治さいたまでは、僕が作ったAIによる患者予測を毎日ICUの医療従事者に提供しているので、少し怖くなりました。できる限り正確な情報を提供しないといけないわ。

ということで、今年はおしまい。
また来年、よろしくお願いしまーす。


タイトル:「ICUのお正月」
ちゃんと注文を出せばもっとマシな絵を描いてくれるのだろうけど、なんかバカっぽくて笑えるので一発採用。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

複雑な臨床例を診断するためのGPT-4の使用

2023年12月26日 | AI・機械学習
NEJM AIの第1号からもう一つ紹介。

Use of GPT-4 to Diagnose Complex Clinical Cases.
Authors: Alexander V. Eriksen, M.D., Sören Möller, M.Sc., Ph.D, and Jesper Ryg, M.D., Ph.D.
Published November 9, 2023 NEJM AI 2023;1(1)


自分でも試しにやってみた。
NEJMのイメージクイズの本文と選択肢だけをコピペしたところ、回答、その理由、それ以外の選択肢の可能性がなぜ低いか、をスラスラ説明してくれた。もちろん正解。

こんな記事もあったけど、2050年よりももっと早くに、画像診断だけでなく臨床診断も、予後予測も、治療選択も、AIの方が正確になるでしょう。そうなったときにICUの医療者は何をするべきか?

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

NEJM AIへの投稿で大規模言語モデルの使用を奨励する理由

2023年12月25日 | AI・機械学習
NEJM AIという、個人的にはヨダレがでそうな雑誌ができた。
その第1号にこんな記事が出ている。

Why We Support and Encourage the Use of Large Language Models in NEJM AI Submissions
Daphne Koller, Ph.D., Arjun Manrai, Ph.D., Euan Ashley, M.B., Ch.B., D.Phil, et al., for the editors and editorial board of NEJM AI
Published December 11, 2023, NEJM AI 2023;1(1)

(まだMedLine収載されていないからPubMedからコピペできない)

例えばScienceは、"Text generated from AI, machine learning, or similar algorithmic tools cannot be used in papers published in Science journals, nor can the accompanying figures, images, or graphics be the products of such tools, without explicit permission from the editors"と宣言しているけど、NEJM AIでは、"we have elected instead to allow the use of LLMs for submissions, as long as authors take complete responsibility for the content and properly acknowledge the use of LLMs. However, this policy does not allow an LLM to be listed as a coauthor."であると。
理由もいくつか書いてあって、例えば、
・現状では研究の実施に人間の関与は不可欠であること
・非英語話者を助けることができること(この研究ではChat先生に英文校正してもらいました)
・LLMの関与を正確にチェックすることは不可能なこと
などが記載されている。

ですよね。
こちらの態度の方が正しいと思います。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

抜管のAI予測について考える。

2023年11月16日 | AI・機械学習
以前、こんなのを書きましたが、
AI予測をICUの実臨床でリアルタイムに使用する①
AI予測をICUの実臨床でリアルタイムに使用する②
今回はより具体的に、抜管について考えたいと思います。

AIが抜管を予測してくれると聞いたら、どんなものを想像するだろうか。
抜管してよいかどうか、再挿管のリスクはどれくらいあるか、NPPV/HFNCを必要とするかどうか。そんなことを抜管前に教えてくれたら便利かな、と思われる人は少なくないのでは。実際、自治さいたまでは「72時間以内に抜管されている確率」と「今抜管したら再挿管になる確率」を提供しているのだけど、AUROCは0.8~0.9、キャリブレーションも抜管については相当いい感じの予測ができているので、それなりに臨床の参考にしてもらっている。

でも実は、抜管の予測というのはちょっと難しい面がある。その理由を列挙。
・抜管の比較的直前に医療介入(鎮静をオフにしたり人工呼吸器の設定を変更したり)が行われることが少なくないので、それに応じて患者さんの状態も変化するから、その状態変化が記録されないと予測に使えない。介入から抜管までの期間が短かったりすると、予測に反映されるのを待っているのが手間になるかもしれない。
・例えばカンファ中に抜管するかどうかについて予測を参考にしようとしても、まだ介入が行われていなければ正確に予測できていない。
・介入後から抜管までの時間が短いと予測をするための教師データが少なくなってしまう。
・抜管時にはカフリークやコフピークなどを測定して抜管の判断に使用したりするけど、それを経過表に記録することはほぼないのでは。そうすると予測に使えないし、モデル作成のための教師データにも使えない。
・「X時間後に抜管されているか」という予測では、過去の似たような状況の患者さんを抜管したかどうかを計算しているのであって、目の前の患者さんを「抜管してよい」かどうかを予測するのとは少し異なる。
・「今抜管したら再挿管になるか」という予測では、過去ログに書いた通り、極端にサンプル数が小さくなる。それに抜管直前の状態ではFiO2は低いし筋弛緩も使用されていないので、予測にこれらの項目は使用されない。

AI関連の文献には、こんなこともあんなこともAIが予測できて、精度高いよー、きっと臨床で便利だよー、と書いてある。抜管についても文献はたくさんあって、なんとすでにsystematic reviewも行われている。研究の中でAUCや感度・特異度が高いといっても、実際はこれらの問題のため、抜管についてはしばらくは参考程度の情報提供しかできないでしょう。まあさすがに患者さんを実際に見て触っている人には、数字しか知らない機械は勝てません。
とは言っても、「どうしようかな?」と悩んでいる時に「全然OK」と言われれば自信が持てるし、「ちょっとやめといたら?」と言われたら明日にしようかなと思うし、自分の判断と違う予測結果を見たら「何か見落としてないか?」と考えることができる。それって十分に有益だと思うし、臨床でもそう思って使ってくれているようだ。

そんなこと言っているうちに、鎮静の調整も人工呼吸器の設定変更もカフリークもコフピークも、そしても抜管も全部自動でやってくれる時代がすぐ来たりして。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

術中低血圧の予測:希望から誇大広告、そして現実へ

2023年11月07日 | AI・機械学習
まず過去ログ。
術中の低血圧を機械学習で予測
MAPは低血圧予測アルゴリズムと同等か?
Hypotension Prediction Indexについての追記。
Hypotension Prediction Indexについての追記の追記。

で、このHPI、気がついたら2ヶ月前から発売されていた
ということは、使った人もボチボチいるのでは。
そんな方に、このeditorialを捧げます。問題点がよくまとまっている。

Michard F, Futier E.
Predicting intraoperative hypotension: from hope to hype and back to reality.
Br J Anaesth. 2023 Aug;131(2):199-201. PMID: 36997473.


こんなのもあった。
OP中に使うと10人中9人に、平均して5回、時間に直すと手術時間の10%でアラームが鳴るらしい。
Kouz K, Scheeren TWL, van den Boom T, Saugel B.
Hypotension Prediction Index software alarms during major noncardiac surgery: a post hoc secondary analysis of the EU-HYPROTECT registry.
BJA Open. 2023 Oct 19;8 PMID: 37869057.


まだ使ってない方へ。
少なくともしばらくは(高い確率で永久に)使わなくてもよさそう。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

大規模言語モデルは研究論文に有用なフィードバックを提供できるか?

2023年10月13日 | AI・機械学習
集中治療関連ではないですが。

Can large language models provide useful feedback on research papers? A large-scale empirical analysis
Weixin Liang, Yuhui Zhang, Hancheng Cao, et al.


「全体として、半数以上(57.4%)のユーザーがGPT-4が生成したフィードバックを役に立った/非常に役に立ったと回答し、82.4%のユーザーが少なくとも何人かの人間のレビュアーからのフィードバックよりも有益であると回答した。」

おお。。。

「人間の専門家による査読は厳密な科学的プロセスの基礎であり、今後もそうあるべきだが、LLMのフィードバックはタイムリーな専門家のフィードバックが得られない場合や査読前の原稿作成の初期段階において、研究者に利益をもたらす可能性がある。」

控えめな表現かもね。
数年で人間を追い越しそうだし。

編集長もAI、査読もAI。
翻訳もAI。読んで情報のまとめを作るのもAI。
ついでに執筆もAI(動画)
なんか、すごい世界だ。。。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

集中治療における臨床判断支援のためにFDAが認可した機器

2023年10月11日 | AI・機械学習
Lee JT, Moffett AT, Maliha G, et al.
Analysis of Devices Authorized by the FDA for Clinical Decision Support in Critical Care.
JAMA Intern Med. 2023 Oct 9. Epub ahead of print. PMID: 37812404.


2022年12月までにFDAが認可した商品のリストが表1にまとめられている。
全部で10商品。心電図解析が一番多くて4つ、バイタル解析が3つ、病棟急変が3つ。
うち、根拠が文献化されているのが3つ、performance biasの評価をしているのはゼロ。
ちなみにEpicの敗血症予測はFDAの認可はないそうだ。

商品化されているという点では日本のはるか先だけど、その根拠は?となるとちょっとね、という状況らしい。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

勤務表を作るのが大変だ、と思っている方へ

2023年10月07日 | AI・機械学習
ここでもチラッと書いたけど、1年ほど前から自治さいたまICU医師の勤務表(の原案)を作成している。
慈恵にいた頃は勤務表作成担当を結構長い間やっていて、エクセルで関数とかいっぱい使って工夫していたけど、それでも数時間は必要だった。「コンピューターで自動で作れたらいいのに」とずっと思っていたのだけど、やり方が分からなかった。自治さいたまでも秘書さんが大変そうに作っていたので、Pythonも使えるようになったことだし、ちょっと勉強してみようかな、と思って買ったのがこの本。



数理最適化は式の書き方が普通のフログラムとはちょっと違うので慣れるのが少し難しいけど、その壁を越えれば基本的なやり方だったら結構すぐにできるようになる。勤務表作成なら複雑な式は不要なのでこれで十分。
そして一度プログラムが出来上がれば、15人くらいの勤務表なら5秒でできてしまう。まあ、勉強時間とプログラム作成に数十時間かかっているから、コストパフォーマンス的にはどうか、という問題はあるけど、勤務表の修正も同じ時間でできちゃうから、相当便利。しかも与えられた条件でベストの答えを出すので、スタッフの負担軽減という意味でも人間が作るよりも質が高くなる。

日本のICUを100施設回っている時に、「勤務表の作成がすごく大変で何日もかかっている」という話を何度か聞いた。ちょっと勉強は大変だけど、質の良い勤務表が短時間でできるようになるので、お勧めです。
コメント (2)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

集中治療にAIの可能性をもたらすには。

2023年10月03日 | AI・機械学習
昨日の記事にとっても関連するレビューがあった。

Wardi G, Owens R, Josef C, et al.
Bringing the Promise of Artificial Intelligence to Critical Care: What the Experience With Sepsis Analytics Can Teach Us.
Crit Care Med. 2023 Aug 1;51(8):985-991. PMID: 37098790.


表1に、「人工知能が集中治療コミュニティに受け入れられていない潜在的理由」というタイトルで、懸念事項がリストアップされている。
自分のやっていることを評価してみるに、それなりに上手くやっているんじゃないか、と思った。
明らかにできていない項目は、
・Lack of definitive multicenter randomized trials
・Lack of infrastructure for real-time predictive scores
の2つ。1つ目はまだまだ先の話だけど、2つ目はメーカーと交渉中。

こんな研究もあるし、患者の予後予測に関しては専門家に匹敵するものを作れるのは間違いないでしょう。
あとはそれを使った臨床が予後を改善するかどうか。
AIによる予測が患者予後を改善するかどうかについてNEJMレベルの研究が行われるようになるのは、どれくらい先だろうね。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする