ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

実行再生産数の計算式は意外とシンプル!

2020-05-19 08:12:37 | AI・BigData
【8割おじさん西浦教授に聞く】新型コロナの実効再生産数のすべて オンライン講演会生中継/主催:日本科学技術ジャーナリスト会議
https://live2.nicovideo.jp/watch/lv325833316


について、やっとメモできたので、メモメモ

(以下の数式は、github
https://github.com/contactmodel/COVID19-Japan-Reff/nishiura_Rt会議_12May2020.pdf
から引用)




■ごあいさつ

■ファシリテーターから
・趣旨説明
 「科学的助言」 東日本大震災でもあったが、これまでと違う
 →専門家の顔が見える(いままで 政府:御用学者)
  どう扱っていい?政治家、官僚、メディアも困惑
  
 提言と違うじゃないか?→健全なこと
  背景が見えるようになる
  オープンサイエンス

 今回はあくまで北海道大学の西浦先生がJASTJの勉強会で語る
   →政府のクラスター班ではなく・・

 タイトルの「すべて」は盛りすぎです。

 第一部 講演
 第二部 代表質問(江島先生 インディアナ大学)
 第三部 質疑応答

■第一部 講演「実行再生産数とその周辺」
・背景にある理論、実装、問題を話す
・githubに今日のスライド、データセット、Rコードある
https://github.com/contactmodel/COVID19-Japan-Reff

・研究員
  今日の分析
    MCMC,R STANを使っている
    公開していいデータ
・高校理系数学以上のバックグラウンドを想定
・個人として発表(クラスター班反映してない)

・基本再生産数
 R0 0一番最初、
   ばーじんそいる(みんなが感染しうる)集団において
   1人の感染者が生み出す二次感染者数の平均値と解釈できる数値
   あーるぜろ→あーるのーと(ぬるのはせい)

フォーマルに

i(t)あいおぶてぃ:t時の新規感染者数
i(t-τ)あいおぶてぃまいなすたう:過去の(t-τ)時の感染者数
A(τ):二次感染の割合
   τ:感染後経過時刻

全てのプロセスを通じて二次感染者が出た割合→R0
数理的に出てくる

・流行の増殖期
Ro本質的に数理的
実践性として定量化しやすいものが必要→実行再生産数

人口学でも使われる
Rn:ねっとりぷろだくとれーしお

・実行再生産数:R0じゃないときのR0っぽいのをReと言っている
 主に4つ
 今回AとDの意味合いを込めたD

再生産方程式

下に書いてあるのはSIRモデル

できるだけ一般的に
1人当たり

R(t)はA(t,τ)をτで積分(S(t)/NRo)
 人口学だとピリオド合計特殊出生率に相当
→流行対策の評価:ピリオドの評価が適している

二次感染者数の平均

R(t)はA(t+τ,τ)→τを前向きに積分(S(t)/NRo)
人口学では、コホート合計出生率

・Rt<1
 1を下回ると、新規感染者数が減っているといえる
 落とし穴ある:流行のメカニズム→再感染がある場合など
 (1以下でも安定化委がある可能性:そういう病気は知ってる限りないが。。。)

・単純化されたケース
 3日間で次の世代に移り変わる
 →3日ごとの比を取れば、E(Rn)
 実際にはカレンダー日付でいくつもの世代

 デイリーのどう対応
 再生産方程式

 A(t,τ)をR(t)g(τ) R(t)と、のこりのτの部分を出しg(t)とする
   g(t)既知と想定:世代時間(の確率密度)→発病間隔(の確率密度)

 発病間隔
  発病してから二次感染の発病までの時間→感染から感染までとざっくり同じ

・観察データの問題
 感染イベント 時刻わからない   潜伏期間
 発病     少しわかる     診断の遅れ
 診断     報告されたらわかる 報告の遅れ

 2週間遅れてプレスデータへ
 →受診の目安などかかわってる 発病後4日間診断されない

・流行の対策を知るのは感染日を知りたい・・・けど見れない
 →逆計算する

 C1,2,3,4 1日目、2日目・・・の発病者
 i 感染者
 fo 発病する確率(感染者X発病する確率・・・発病した人)

 →畳み込み(1日、2日・・・を全部足す)する

・毎日の感染者数が分かっているので、
 積分でなく挿話にして
 ポアソン分布
→Rではサーベイランスとしてパッケージ化

 スムージングする(イーブンNoで)

・日本のデータ
 逆計算の問題だけではない
 発病日、確定日:ずいぶんサイズちがう(どちらもわからない人も)
 報告の遅れもある
 3月の後半から発病時刻が東京抜けている
 ボランティア班で今回は作っている
 国立感染症研究所のサーベイランスが公式

 分析は2パターン
  発病時刻既知の人
  確定日が分かっている人→感染時刻推定も

・Rtの推定
 E:期待値
iドメスティック:国内
 iトータル:国内国外全部
 F:報告の遅れを加味(累積 畳み込み)
MCMCを用いて推定

 後日:報告の遅れありうる→東京
 18日前にデータをトランケートしている
  →リアルタイム性に乏しい

・対応できていない
 インピュテーション
 年齢別、空間
 リンクのある人(接触歴)とそうでない人

・R(t)が「いつのまにか」倍加時間で評価
  C(t)=C(0)2^1/Td
 →オーバーシュートを可能な限りふせぐため
 R(t)はバックワード
 ダブリングタイムは増えているとき
 →患者が増加しているときはダブリングタイム
  ダブリングタイムをしっかり見ないといけない

 北海道:2段になっているとき→リアルタイムにみている
     (1回累積をリセットする)

・R(t)について、どうしていくべきか(私見)
 ダッシュボード
  カンマーアンドダンス減ってから増える→Rtのアップデート
 R(t)のリアルタイム性
  でぃすぱーしびりてぃーれーしお X これくてぃんぐふぁくたー
 →たとえば、
   直近7日間の患者数 < その前の7日間の患者数
  (精密な情報失う、報告の著しい遅れの場合)

・R(t)のまとめ
 非定常状態での流行増減の記述(ダイナミックに起こる)
 R0と一定の関係
 増えているか否か、スピードがわかる
 万能ではない

■第二部 代表質問

・スムージングをしてとは何のこと?
 感染時刻の逆計算をノンパラメトリックでやっています。
 C:患者数 iの感染者数推定
 単なる最尤推定だと、でこぼこになる
 →EMあるごりずむを使う:スムージングしている
   →パッケージングに実装されている。
    スムージングパラメーターを指定する(偶数でないといけない)
    次第に挙げて推定

・R(t)の推定へ
  Iが観察データ、Eが期待値(モデル)

・全部を補足できていない
(1)確定患者は氷山の一角?感染者全員ではないのでは?
 ふけんせいかんせい
 →j(t)=ki(t)
  J感染者 k何倍か i 感染者
  Jはiをk倍したものなので、再生産方程式は使える

(2)時刻とともに変わる場合
  →ピーク付近が過小評価
  q(t) 入院比率などで修正できる PCR件数:あんまりかわっていない
→2とおりのインピュテーション問題

■第三部
・誤植について(上下逆だった)

・世代時間 長いと想定すれば、再生産数は大きくなる
 分散は大きくなると小さくなる
 もともとのシリアルインターバル 香港大学の武漢の観察
  平均6日より長い
 SARS 8.なんにちか シンガポールの家庭内
 似て非なる特徴 感染の怒り方の違い
  SARS 肺炎が起こる前後に二次感染→病院伝播がおおい
  自分自身で4.8と出した→サンプル数多くない
  今アップデート

 R(t)としての推定:起こりえる 誠実な対応としては感度分析
  オリジナルで研究をやっていたので、今回使ったが、
  感度分析を

 日本のシリアルインターバル:東北大学で研究中
  ホストの異質性も加味したうえで推定(場)

・逆計算で死亡とか回復は入れなくていいの?
 →加味しないでいい

・非定常ポアソン過程
 SIRモデルを微分方程式:ばらつき考慮していない
  →ポアソン過程 バリエーションを無視した場合

 時刻とともにすそ野の長いようなとき
  →確率的揺らぎの場合、二項分布でキャプチャしやすい

 いまはポアソン分布、裾の長いようになった時には
 バリアンスを考え直す

・世界部分と西浦先生の共通部分と差
 再生産方程式を解く
  山中先生がアップしている→ロンドンのパッケージ
 西浦先生:マニアック
  感染者数を逆計算→劇的にダイナミクスをとらえるため
 ドイツの
  報告日別
 アメリカ
  発病日別
→政策を評価するため
 ドイツ:報告日ベースだと、土日下がる(ウィークエンドバイアス)

・バイアスについて
 年齢、地域、検査数
 検査数:要請率の変動やっとでそう まだR(T)には組み込んでない
 →見方には組み込んでいる
 今できない:PCRのMAXのキャパシティーになってしまう

 年齢:やっと流行曲線整備

・アメリカの議論の様子
 日本:エキスパート1人という状況はあり得ない
  →他に選択肢がない
 勘所を抑えた人が増えると

・注文
 実行再生産数:再現している〇
 ほかのグループにも参入してほしい
 オープンデータで実装できる!どんどんやりましょう!!
 →とくに物理、情報の先生
 モデル元年!

 意外にシンプル!

 推定したよあったら連絡してね!

・日本:分業はっきりしすぎている
 FAXでやっていたのが報告が遅れる原因だった・・・
  →結構、あったり;推測つく(変なノイズ)

・(アメリカの先生)よくわからない基準を作っている先生もいる
 →なんでR(t)が使われているか
  政策の評価ができる
  なんで(細菌の先生の)基準が使われていないか考えてほしい

 (西浦先生)まず、学術に出してみよう!!!

■締めのあいさつ
この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« Zoomのバーチャル背景で、顔... | トップ | 「治療薬アビガン、有効性示... »
最新の画像もっと見る

AI・BigData」カテゴリの最新記事