実行再生産数の計算式は意外とシンプル！

2020-05-19 08:12:37 | AI・BigData

【8割おじさん西浦教授に聞く】新型コロナの実効再生産数のすべてオンライン講演会生中継/主催：日本科学技術ジャーナリスト会議
https://live2.nicovideo.jp/watch/lv325833316

について、やっとメモできたので、メモメモ

（以下の数式は、github
https://github.com/contactmodel/COVID19-Japan-Reff/nishiura_Rt会議_12May2020.pdf
から引用）

■ごあいさつ

■ファシリテーターから
・趣旨説明
　「科学的助言」　東日本大震災でもあったが、これまでと違う
　→専門家の顔が見える（いままで　政府：御用学者）
　　どう扱っていい？政治家、官僚、メディアも困惑
　　
　提言と違うじゃないか？→健全なこと
　　背景が見えるようになる
　　オープンサイエンス

　今回はあくまで北海道大学の西浦先生がＪＡＳＴＪの勉強会で語る
　　　→政府のクラスター班ではなく・・

　タイトルの「すべて」は盛りすぎです。

　第一部　講演
　第二部　代表質問（江島先生　インディアナ大学）
　第三部　質疑応答

■第一部　講演「実行再生産数とその周辺」
・背景にある理論、実装、問題を話す
・githubに今日のスライド、データセット、Ｒコードある
https://github.com/contactmodel/COVID19-Japan-Reff

・研究員
　　今日の分析
　　　　ＭＣＭＣ，Ｒ　ＳＴＡＮを使っている
　　　　公開していいデータ
・高校理系数学以上のバックグラウンドを想定
・個人として発表（クラスター班反映してない）

・基本再生産数
　R0 0一番最初、
　　　ばーじんそいる（みんなが感染しうる）集団において
　　　１人の感染者が生み出す二次感染者数の平均値と解釈できる数値
　　　あーるぜろ→あーるのーと（ぬるのはせい）

フォーマルに

i(t)あいおぶてぃ：t時の新規感染者数
i(t-τ)あいおぶてぃまいなすたう：過去の(t-τ）時の感染者数
A(τ）：二次感染の割合
　　　τ：感染後経過時刻

全てのプロセスを通じて二次感染者が出た割合→Ｒ０
数理的に出てくる

・流行の増殖期
Ro本質的に数理的
実践性として定量化しやすいものが必要→実行再生産数

人口学でも使われる
Ｒｎ：ねっとりぷろだくとれーしお

・実行再生産数：Ｒ０じゃないときのＲ０っぽいのをＲｅと言っている
　主に4つ
　今回ＡとＤの意味合いを込めたＤ

再生産方程式

下に書いてあるのはＳＩＲモデル

できるだけ一般的に
1人当たり

Ｒ（ｔ）はA(t,τ）をτで積分（Ｓ（ｔ）／ＮＲｏ）
　人口学だとピリオド合計特殊出生率に相当
→流行対策の評価：ピリオドの評価が適している

二次感染者数の平均

Ｒ（ｔ）はA(t+τ,τ）→τを前向きに積分（Ｓ（ｔ）／ＮＲｏ）
人口学では、コホート合計出生率

・Ｒｔ＜１
　1を下回ると、新規感染者数が減っているといえる
　落とし穴ある：流行のメカニズム→再感染がある場合など
　（１以下でも安定化委がある可能性：そういう病気は知ってる限りないが。。。）

・単純化されたケース
　３日間で次の世代に移り変わる
　→３日ごとの比を取れば、Ｅ（Ｒｎ）
　実際にはカレンダー日付でいくつもの世代

　デイリーのどう対応
　再生産方程式

　A(t,τ）をＲ（ｔ）ｇ（τ）　R(t)と、のこりのτの部分を出しg(t)とする
　　　g(t)既知と想定：世代時間（の確率密度）→発病間隔（の確率密度）

　発病間隔
　　発病してから二次感染の発病までの時間→感染から感染までとざっくり同じ

・観察データの問題
　感染イベント　時刻わからない　　　潜伏期間
　発病　　　　　少しわかる　　　　　診断の遅れ
　診断　　　　　報告されたらわかる　報告の遅れ

　２週間遅れてプレスデータへ
　→受診の目安などかかわってる　発病後４日間診断されない

・流行の対策を知るのは感染日を知りたい・・・けど見れない
　→逆計算する

　Ｃ１,2,3,4　１日目、２日目・・・の発病者
　i　感染者
　fo 発病する確率（感染者Ｘ発病する確率・・・発病した人）

　→畳み込み（１日、２日・・・を全部足す）する

・毎日の感染者数が分かっているので、
　積分でなく挿話にして
　ポアソン分布
→Ｒではサーベイランスとしてパッケージ化

　スムージングする（イーブンＮｏで）

・日本のデータ
　逆計算の問題だけではない
　発病日、確定日：ずいぶんサイズちがう（どちらもわからない人も）
　報告の遅れもある
　３月の後半から発病時刻が東京抜けている
　ボランティア班で今回は作っている
　国立感染症研究所のサーベイランスが公式

　分析は２パターン
　　発病時刻既知の人
　　確定日が分かっている人→感染時刻推定も

・Ｒｔの推定
　Ｅ：期待値
iドメスティック：国内
　iトータル：国内国外全部
　Ｆ：報告の遅れを加味（累積　畳み込み）
ＭＣＭＣを用いて推定

　後日：報告の遅れありうる→東京
　１８日前にデータをトランケートしている
　　→リアルタイム性に乏しい

・対応できていない
　インピュテーション
　年齢別、空間
　リンクのある人（接触歴）とそうでない人

・Ｒ（ｔ）が「いつのまにか」倍加時間で評価
　　C(t)=C(0)2^1/Td
　→オーバーシュートを可能な限りふせぐため
　Ｒ(t)はバックワード
　ダブリングタイムは増えているとき
　→患者が増加しているときはダブリングタイム
　　ダブリングタイムをしっかり見ないといけない

　北海道：２段になっているとき→リアルタイムにみている
　　　　　（１回累積をリセットする）

・Ｒ（ｔ）について、どうしていくべきか（私見）
　ダッシュボード
　　カンマーアンドダンス減ってから増える→Ｒｔのアップデート
　Ｒ（ｔ）のリアルタイム性
　　でぃすぱーしびりてぃーれーしお　Ｘ　これくてぃんぐふぁくたー
　→たとえば、
　　　直近７日間の患者数　＜　その前の７日間の患者数
　　（精密な情報失う、報告の著しい遅れの場合）

・Ｒ（ｔ）のまとめ
　非定常状態での流行増減の記述（ダイナミックに起こる）
　Ｒ０と一定の関係
　増えているか否か、スピードがわかる
　万能ではない

■第二部　代表質問

・スムージングをしてとは何のこと？
　感染時刻の逆計算をノンパラメトリックでやっています。
　Ｃ：患者数　iの感染者数推定
　単なる最尤推定だと、でこぼこになる
　→ＥＭあるごりずむを使う：スムージングしている
　　　→パッケージングに実装されている。
　　　　スムージングパラメーターを指定する（偶数でないといけない）
　　　　次第に挙げて推定

・R(t)の推定へ
　　Iが観察データ、Ｅが期待値（モデル）

・全部を補足できていない
（１）確定患者は氷山の一角？感染者全員ではないのでは？
　ふけんせいかんせい
　→j(t)=ki(t)
　　J感染者　k何倍か i 感染者
　　Jはiをk倍したものなので、再生産方程式は使える

（２）時刻とともに変わる場合
　　→ピーク付近が過小評価
　　q(t)　入院比率などで修正できる　ＰＣＲ件数：あんまりかわっていない
→２とおりのインピュテーション問題

■第三部
・誤植について（上下逆だった）

・世代時間　長いと想定すれば、再生産数は大きくなる
　分散は大きくなると小さくなる
　もともとのシリアルインターバル　香港大学の武漢の観察
　　平均６日より長い
　ＳＡＲＳ　８．なんにちか　シンガポールの家庭内
　似て非なる特徴　感染の怒り方の違い
　　ＳＡＲＳ　肺炎が起こる前後に二次感染→病院伝播がおおい
　　自分自身で４．８と出した→サンプル数多くない
　　今アップデート

　Ｒ（ｔ）としての推定：起こりえる　誠実な対応としては感度分析
　　オリジナルで研究をやっていたので、今回使ったが、
　　感度分析を

　日本のシリアルインターバル：東北大学で研究中
　　ホストの異質性も加味したうえで推定（場）

・逆計算で死亡とか回復は入れなくていいの？
　→加味しないでいい

・非定常ポアソン過程
　ＳＩＲモデルを微分方程式：ばらつき考慮していない
　　→ポアソン過程　バリエーションを無視した場合

　時刻とともにすそ野の長いようなとき
　　→確率的揺らぎの場合、二項分布でキャプチャしやすい

　いまはポアソン分布、裾の長いようになった時には
　バリアンスを考え直す

・世界部分と西浦先生の共通部分と差
　再生産方程式を解く
　　山中先生がアップしている→ロンドンのパッケージ
　西浦先生：マニアック
　　感染者数を逆計算→劇的にダイナミクスをとらえるため
　ドイツの
　　報告日別
　アメリカ
　　発病日別
→政策を評価するため
　ドイツ：報告日ベースだと、土日下がる（ウィークエンドバイアス）

・バイアスについて
　年齢、地域、検査数
　検査数：要請率の変動やっとでそう　まだＲ（Ｔ）には組み込んでない
　→見方には組み込んでいる
　今できない：ＰＣＲのＭＡＸのキャパシティーになってしまう

　年齢：やっと流行曲線整備

・アメリカの議論の様子
　日本：エキスパート１人という状況はあり得ない
　　→他に選択肢がない
　勘所を抑えた人が増えると

・注文
　実行再生産数：再現している〇
　ほかのグループにも参入してほしい
　オープンデータで実装できる！どんどんやりましょう！！
　→とくに物理、情報の先生
　モデル元年！

　意外にシンプル！

　推定したよあったら連絡してね！

・日本：分業はっきりしすぎている
　ＦＡＸでやっていたのが報告が遅れる原因だった・・・
　　→結構、あったり；推測つく（変なノイズ）

・（アメリカの先生）よくわからない基準を作っている先生もいる
　→なんでＲ（ｔ）が使われているか
　　政策の評価ができる
　　なんで（細菌の先生の）基準が使われていないか考えてほしい

　（西浦先生）まず、学術に出してみよう！！！

■締めのあいさつ

ランキングに参加中。クリックして応援お願いします！

« Zoomのバーチャル背景で、顔... | トップ | 「治療薬アビガン、有効性示... »

このブログの人気記事

最新の画像［もっと見る］

チーズ揚げ餃子食べた 14時間前
SpringBootとMicroProfileどっちがいいか、聴いてきた。 2日前
SpringBootとMicroProfileどっちがいいか、聴いてきた。 2日前
今、一番使われているJavaのLTSは 3日前
今、一番使われているJavaのLTSは 3日前
「Java First Java always」を聴いてきた 3日前
「Java First Java always」を聴いてきた 3日前
柑橘（かんきつ）香るしらすの冷しそばとは・・・ 4日前
柑橘（かんきつ）香るしらすの冷しそばとは・・・ 4日前
「Spring for GraphQLの実践」を聴いてきた！ 5日前

日	月	火	水	木	金	土
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

アクセス
閲覧	1,861	PV
訪問者	829	IP
トータル
閲覧	34,434,134	PV
訪問者	8,479,591	IP
ランキング
日別	506	位
週別	657	位

	dアカウント連携で最大2,000ptのdポイントプレゼント
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！
	goo blogは20周年を迎えました！

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）