温故知新~温新知故?

音楽ネタが多いだろうけど、ネタのキーワードは、古きを訪ねて新しきを知ると同時に新しきを訪ねて古きを知るも!!

コロナ禍とベイズ理論

2020-08-10 17:14:54 | ニュース
少し前に、ある人からベイズ理論の存在を教えてもらった。
グーグル、インテル、MSが注目するベイズ理論 - CNET Japan
今日のコンピュータ界を動かす18世紀の確率論
 今日のコンピュータ界をリードする権威ある数学者の1人であるThomas Bayes(トーマス・ベイズ)は、他の数学者と一線を画する。ベイズは神の存在を方程式で説明できると主張した人物だ。そんな彼の最も重要な論文を出版したのはベイズ本人ではなく他人であり、また、彼は241年前に亡くなっている。
サーチエンジン超大手のGoogleと情報検索ツールを販売するAutonomyの両社もベイズの原理を採用し、百発百中ではないにしろ高い確率で適当なデータを探し当てる検索サービスを提供している。

ベイズ統計あるいはベイズ理論とは何か?。
ベイズ理論とは何か。それは、以下にあるように事象Xが起こった状況下で事象Aが起こる確率(事後確率)を示す理論ということだ。
 ベイズ理論は、おおまかに言うと「未来を推測するには過去を振り返らなければならない」と要約することができる。つまり、ベイズは未来の出来事の確率はその事象の過去の発生頻度を求めることで計算できると説いたのだ。例えば、宙に投げられたコインが表向きに着地する確率が0.5であることは実験データから分かるといった具合だ。
 スタンフォード大学のRon Howard教授は、「ベイズ曰く、全ての事柄は必然的に不確実で、その確率の分布は様々である」と述べている。
 例えば、コインの代わりにプラスチックの押しピンを投げて、針が上向きの状態で落ちる確率や、ピンが横向きに落ちた場合に針がどちら向きになるかを調べたいとする。結果に影響を与えると思われるのは、押しピンの形状、製造工程でのばらつき、重量分布などの要素だけでなく、ピンの着地パターンの種類の多さだ。

UCLAのJudea Pearlなどの研究者が様々な現象間のある特定の関係だけに的を絞ったベイズモデルの作り方を習得したこともさらに重要だ。それにより計算の数が大幅に減る。
例えば、全国民を対象とする調査から肺癌の発祥原因を見出そうとすると、肺癌患者は少なく見えるかもしれない。しかし、喫煙者に限定した調査を行えば相関性が見つかるかもしれないし、さらに肺癌患者のみを対象とした調査を行えば、肺癌と生活習慣の間にある因果関係の仮説を立てるヒントを得られるかもしれない。

確率の数式は以下の論文のようになります。
ベイズ統計学とは?初心者向けのやさしい解説 | AVILEN AI Trend
ベイズの定理の式は以下のようになります。
P(A|X) = P(X|A)P(A)/P(X) = P(A) × P(X|A)/P(X)
P(A|X):事象Xが起こった状況下で事象Aが起こる確率(事後確率)
P(A):事象Aが起こる確率(事前確率)
P(X):事象Xが起こる確率

そこで、これはコロナ禍の事象に対して何か使えるのではと思って検索したら、やはり、何件かヒットした。
ベイズ構造時系列モデルを用いた新型コロナウイルスが産業に与える影響の予測~上場企業の売上高に与える影響は約108兆円~
要旨
ベイズ構造時系列モデルは、複雑に影響が絡み合うトレンドや季節性、外生変数の影響等を構造化して表現できる柔軟性と可読性に優れた時系列モデルである。
本提言では、野村證券が2020年2月と3月に算出した、新型コロナウイルスの影響の顕在化前後でのマクロ経済予測結果に基づき、新型コロナウイルスが上場企業の売上高に与える影響をモデル化した。
上記結果として、上場企業の売上高に与える影響は約108兆円、最も影響が大きい業界は輸送機器業界、影響のピークは20年第一四半期と予測された。
今後は、さらにマクロ経済予測の更新に伴い最新の予測に修正していくとともに、各業界についてのより詳細な分析を随時提言していく予定である。

以下は、PCR検査の精度70%ととよくいわれていることから罹患率などを推定するサイトです。
ベイズの定理と新型コロナウイルスPCR検査|sgk|note
今日,PCR検査数も増加したので4月23日厚労省のデータを用いて,再計算をしてみました.どのように変わったでしょうか?
中略
従って,サンプル集団で推定される罹患率は0.088×0.80+0.912×0.017=0.086
すなわち,8.6%(前回5.9%)と推定できます

また、以下は世間で紹介されている数字がベイズ 統計に基づいているとの指摘です。
◆【新型コロナ】専門家会議の実効再生産数の算出手法はベイズ統計であるようです:実効再生産数の「95%信用区間」(Credible Interval)という用語からわかります | One of my favorite things is ... - 楽天ブログ
その実効再生産数の計算式などの詳細は、明らかにされていませんが、一つ確実にわかることがあります。

資料のなかで、「95%信頼区間」ではなく、「95%信用区間」という表現になっていることから、この実効再生産数が、ベイズ統計の手法によって推定されていることがわかります。

これらの推定には、いろいろ間違いがあるようです。
◆【新型コロナ:誤りの部分を訂正しました】来年の大学入試に出そうな「偽陽性者」と「真の陽性者」の確率の問題:検査拡大への懐疑論の一つの論拠は「偽陽性者」の問題のようです:多くの偽陽性者が医療崩壊を招きかねないという考え方があるようです:確かに検査の仕方によっては「偽陽性者」が大量に発生します | One of my favorite things is ... - 楽天ブログ
【下記の計算の誤った部分を訂正しました:太字の部分が誤りでした:お詫びして訂正します】
仮に、検査の精度について、「感染者を感染者として正しく検出できる確率が70%」「感染していない人を誤って感染していると判定する確率が1%」とします。
スペインの抗体検査の例にならって、全人口のうち、「感染者が5%」「感染していない人が95%」の割合だとします。
10万人の集団について考えると、前提として「感染者は5千人」「感染していない人は9万5千人」ということになります。
この場合、
「感染していて、感染していると判定される人数」は、5000人の70%の3500人です。
「感染していないのに感染していると判定される人数」は、95000人の1%の950人です。
「感染していると判定される人数」は、3500+950=4450人です。
10万人の集団から1人を無作為で選んで検査を実施して「感染していると判定された」ときに、「本当に感染している」確率は、3500÷4450=78.7%ということになります。

以下では、いろいろ間違いはあるものの、PCR検査で陰性、陽性を判断したところで、対応する方法は同じという意見。どれもなるほどと思えるものです。
◆【新型コロナ:誤りの部分を訂正しました】来年の大学入試に出そうな「偽陽性者」と「真の陽性者」の確率の問題:検査拡大への懐疑論の一つの論拠は「偽陽性者」の問題のようです:多くの偽陽性者が医療崩壊を招きかねないという考え方があるようです:確かに検査の仕方によっては「偽陽性者」が大量に発生します | One of my favorite things is ... - 楽天ブログ
まあ、「全員のPCR検査」は極論で、今のところ現実的ではないと思いますが。
どうやら、「検査拡大」と「軽症者・無症状者用の隔離施設」は必ずセットにすべきもののようです。それから、医療機関が大量の検査を実施することになると、医療機関の大きな負担になるので、検査専門の「検査センター」もセットに加える必要があります。
つまり、「検査拡大」「検査専門の検査センター」「大規模な隔離施設」の3点セットが必要だということだと思います。これは、「韓国方式」そのもののようです。

しかし、以下は長くて、内容もすぐには把握できませんが、ベイズ 推定をこのコロナに適用するのは間違いだとの意見。結局何を信じたらいいか分からなくなりました。
「コロナは全員PCRしろ」という人は「ベイズ推定」と検査の実効を理解する必要がある|sheemer|note
「コロナは全員PCRしろ」という人は「ベイズ推定」と検査の実効を理解する必要がある
「コロナは全員検査しろ」という人は、これを読んでいただきたい。そしてご自身の「勘違い」に向き合っていただきたい。「勘違い」を自分で修正することは、いつでもできますし、それができる人は賞賛されます。
ベイズ推定をおおまかに理解し、想像する
「ベイズ推定」(≒「ベイズ統計」「ベイズの定理」)は、今話題になっているコロナ感染症でPCRをやるかやらないか、という議論の背景を理解するために欠かせない考え方です。ベイズ推定を、数式でなく直感的にでも理解していないと「誰でも全員PCRしろ」という(現況では)誤謬から逃れられません。

なぜ日本だけが囚われる「PCR検査抑制デマ」が生まれたのか? その根源に迫る(HARBOR BUSINESS Online) - Yahoo!ニュース
なぜ日本だけが囚われる「PCR検査抑制デマ」が生まれたのか? その根源に迫る
7/19(日) 8:33配信
本邦独自、エセ医療デマの中心は、ベイズ推定のトホホ誤用
 さて、この「PCR検査をすれば患者が増える」、「PCR検査をすれば医療崩壊する」といったジャパンオリジナルの嘘ですが、その論拠とされるものがベイズ推定です。一般の医療検査における不確かさが起こす誤診を警鐘するものとして、医師国家試験でも頻出問題とされるものです。しかしこれから二回にかけて説明する理由でPCR検査にこのベイズ推定は「使ってはいけない」のです。だから日本を除く世界では使われているのを見たことがありません。今後抗体検査がパンデミック収束後の感染実態把握のために用いられますが、そのときに初めて補助的に使われるものです。

しかし、メディアやワイドショーなどで、ともかく全員PCR検査をするべきだという単純な話で煩瑣そうな気がしました。ある程度勉強しないといけないですね。