【久しぶりに記事を書く動機は以下の通り】
福島県の県民健康調査の話題を目にすることが多くなった。
1巡目の先行調査の結果もまとまり、2巡目の本格検査の結果も公表されつつある。
この件に関して、情報を収集して深く考えて見ようとか
自分の考えを書き残そうとかは考えていなかったが、
直ぐに目につく程度のことでも直観はある程度働くし、
目についた議論をみるだけでも、色々考えることがあり、気が変わった。
この件に関する自分の直感は正しいのか、間違っているのか、
間違っているなら何故間違った直感が働いたのかを、後で検証したいと思い、
出来る限り客観的に自分の直観的な判断と考え方を書き残す気になったのである。
【結論】
大雑把なある仮定のもとでは、
福島県の県民健康調査で異常が多数発見されている理由は
検査をしたために見つかりにくい異常を見つけただけ(スクリーニング説)
ということは否定される。
自分の立てた大雑把な仮定は適切でなく、より細やかな仮定の元で考え直すことが必要である。
【お断り 他人が読みやすくなるようには書いてありません】
後から自分が見て、誤りがあるならそれはどこにあったのかが
わかりやすいように書くことにする。そのため中身の割に、大変冗長な記述になる。
【】のところ、あるいはその直後をつまみ読みすれば読みやすくなるように
書くことを心掛ける。
【自分の直観 本格検査の異常の数は先行検査に比べて大きすぎる】
あくまで直観なので自分が気づかぬうちに前提としていることはまだ明確になっていない。
この直観が何を前提にしたものなのか、これから少しずつ考えながら議論する。
【約束事 病名等は具体的に書かず「異常」と書く】
今後この話題を記述する際は病名を具体的に記述することは避ける。
事実と考察だけを綴りたいので、具体的に書くべきなのだが、
具体的に書くとなんともやりきれない気持ちになって書き進められないからである。
将来、そんな気持ちが薄れて何故具体的に書いてないか自分で疑問に思うことも
ありうるので、その理由をここに記しておくことにした。
【考察する事実は次の通り】
「先行検査では、約30万人に対して116名の異常またはその疑い。
本格検査では、約23万人に対して 51名の異常またはその疑い。
本格調査は先行検査が行われた対象にその2年後から3年後に行われた。」
【自分の直観をより詳しく】
「51という増分は、2年から3年の間のものとして、それ以前の累積と見られる116に対して
大きすぎるように思う。」
【約束事 注目するのは「異常またはその疑い」それを単に「異常」ということがある】
「異常またはその疑い」から「異常」を確定するまでには時間がかかる。
本格検査ではその十分な時間がとれていないことから、注目するのは「異常またはその疑い」
とする。また先行検査を見る限り、「異常またはその疑い」と「異常」の差は
大きいとはいえない。それらの理由から、「異常」の数そのものよりも
「異常またはその疑い」の数に注目するのは妥当なことである。
以降、「異常またはその疑い」を単に「異常」ということがある。
【約束事 「異常」が真の意味で「異常」なのかは問わない】
このたびの先行検査あるいは本格検査における「異常」発見の割合は、
それより前に知られていたものよりも大きい。
にもかかわらず、今観察されている「異常」発見数の多さは
「異常」の多発を意味しない、という方がおられる。
その説は細部に色々違いはあるが、大筋において次のようなものである。
---------------------------------------------------------------
今まで行っていない方法で観察しているのだから、
その方法により今まで発見できなかったものを発見する可能性は否定できない。
「異常」を多数発見はしているが、それらは従来なら見つからないままだった
可能性のあるものだから、従来と同じ意味での「異常」あるいは
真の意味での「異常」が多発しているとは言い難い。
「異常」を過剰に診断している可能性がある。
----------------------------------------------------------------
自分の直観を検証するのに、真の意味での「異常」の定義は
不要と考えられるので、そこには踏み込まない。
ここでは、あくまでも発見されている「異常」の数についてを考察する。
真の意味では「異常」ではないものまでも「異常」と呼ぶのが気になる方は、
「異常」の代わりに何か別の言葉を用いればよい。
自分も病名の代わりに「異常」と書いて既に言葉の置き換えを行っている。
上の見解について
「今まで行っていない方法で観察しているのだから、
その方法により今まで発見できなかったものを発見する可能性は否定できない」
というところまでは同意できる。
【約束事 スクリーニング説の定義】
「異常の数が増えたのは検査自体をしたことが主な原因である」
あるいはもっとはっきり
「今発見されている異常は検査をしたために見つかったものである」
をここでのスクリーニング説の定義とする。
他の定義も色々あろうし、世間での一般的な「スクリーニング説」とは
異なるかもしれない。しかし自分はそれらの違いに興味がない。
【方針 まずは大雑把な仮定で検証】
今回の議論は大雑把な仮定をおいてのものである。
明確な結論が出ていないことを議論する際になんらかの仮定を立てるのであれば、
まずはできるだけ単純な仮定を立てて検証し、必要に応じてより細やかな仮定を立て直すのが筋だと考える。
いくつもの仮定を用いて低い確率が計算されたなら、そのうちの特定の仮説を否定するようなことはすべきではないと考える。
【自分の直観の言いかえ 大雑把な仮定のもとではスクリーニング説は否定されるだろう】
【以下は自分の直観の検証】
スクリーニング説を認めると非常に珍しいことが起こっていることを示す。
まずはスクリーニング説を認める。
【仮説0】 上記で定義したスクリーニング説は正しい。
「異常またはその疑い」は全て検査をしたから見つけたものである。
他にも議論を進めるために必要と思われる仮定をおく。
【仮定1】 調査開始以降、異常発見に影響を与える要因は無いものとする。
【仮定2】 先行検査(1巡目)でも本格検査(2巡目以降)でも診断の質に差はないとする。
年齢別の詳細データがないために、乱暴な仮定をおく。
ある程度のデータはあるが、そのようなデータはここでは利用しない。
【仮定3】 一定期間に新たに発生する観測可能な異常は、年齢によらず同じ割合で発生する。
【仮定4】 調査対象の年齢構成にそれほど違いはない
現実には、0~5歳では異常は発見されていないので、
より精密な議論をする際は仮定3を別の形で置き換える必要がある。
また、年齢構成は調査対象の上の方は少な目であることが知られていて、
先行調査の上の方の年齢層が少な目であることは、先行調査の異常の数はもっと大きいものであったことを意味し、
仮説0を棄却するのに有利に働いてしまうので、より精密な議論をする際は仮定4も見直す必要がある。
本格調査は上の方の年齢層がさらに少な目であるが、
仮定3を認めれば、異常の増分は年齢にかかわらず一定なので、本格検査では年齢構成は考察に影響しない。
仮定3も仮定4も乱暴な仮定であるが、ここでは議論を先に進めることを急ぐ。
【仮定5】先行検査は、事故当時に行われたとする。
【仮定6】本格検査は、先行検査後3年後に行われたとする。
仮定5も仮定6も仮説0を棄却するには不利に働くための設定である。
仮定5により、先行検査時の年齢は実際より若くなることになり、生まれてから実際より短い期間で
異常が蓄積されたと考えられ、先行検査から予想される異常の増加する割合は、大き目に見積もられる。
仮定6により、先行検査と本格検査の間の期間は大きめに見積もられる。
異常の増加する割合も検査の間の期間も大きめに見積もれば、その間の異常の増加は大き目に見積もられ、
本格検査の異常が大きいことの妥当性を押し上げ、仮説0を棄却するには不利に働く。
以下において仮説0、仮定1から6のもとで得られることを命題と記す。
命題といいながら実際には仮説や仮定を用いて導くので、その多くは仮説に過ぎない。
【命題7】 先行検査が約23万人で行われていたら「異常またはその疑い」の数はおよそ90とみなしてよい。
年齢構成の比を保つなら「異常またはその疑い」の数は調査対象の数に比例すると考えて良い。
116x23/30=88.933...
切り上げて90にすることは仮説0を棄却するには不利に働く。
【命題8】 先行検査の調査対象は全員9歳丁度とみなしてよい。
仮定3と仮定4より調査対象は全員が平均年齢だと考えてよい。
調査対象は19歳未満と考えられ、平均年齢は9.5歳である。
先行検査の平均年齢を小さく見積もることは、仮定5の妥当性と同様、
仮説0の棄却に不利に働く。
【命題9】 先行検査の異常の数は同じ調査対象の9年間の増加分とみなしてよい。
命題8と仮定3よりあきらか。
【命題10】約23万人の調査対象において1年間におよそ10人ずつ異常が増える。
仮定3と命題9より約23万人の1年間の異常の増加は 90/9=10
厳密にいえば、調査対象は異常が出た分だけ減っていくことになるが、
23万に対して10は小さいからそのようなことは無視できる。
【命題11】約23万人の調査対象において3年間での異常の数は平均30と見積もられる。
仮定3と命題10より 10x3=30
【命題12】約23万人の調査対象において3年間での異常の数は近似的に平均30のポアソン分布に従うと考えられる。
命題11とポアソン分布の定義による。
【命題13】仮説0は仮定1から仮定7までのもとで危険率1パーセントで棄却される。
命題12より、異常の数が51以上の上側累積確率を求めると、2.98x10^(-4)<0.01。
【考察】
とんでもなく低い確率が計算されたので、仮説0、仮定1から6のどれかは棄却される。
仮定3と仮定4には問題があると考えられる。
【今後の方針】
○仮定3は、0歳から5歳で異常が0を考慮して立て直したものに置き換える。
仮定4を必要としない詳細データをまつか、今あるおおまかなデータを補正して考え直す。
○他国のデータで2万500中に異常0というものを見た記憶があるので、そのデータと先行検査を比較する。
○ヨウ素129を参考にしたヨウ素131マップとの比較を考える。
【いくつか感じていること】
○先行検査と本格検査の調査の大きさがそろっているときに異常の数が同等になると思うかどうかを尋ねている人をみかけた。
先行検査で得られた特定の年齢の異常の数をそこまでの各年齢ごとに発見される異常の数の累積と考えるならば、
先行検査と本格検査の直接比較は関数の値と関数の増分を比較するような不自然なことのように思える。
○先行検査と本格検査の分布の形が異なることを気にしている方を見かけた。
先行検査で得られた特定の年齢の異常の数をそこまでの各年齢ごとに発見される異常の数の累積と考えるならば、
先行検査と本格検査で分布の形が異なることに何の不思議もない。
仮定3は見直す必要があるものの、先行検査で年齢と異常の数が正比例を仮定すれば、本格検査では一様分布になり、分布の形は異なる。
○先行検査で得られた特定の年齢の異常の数をそこまでの各年齢ごとに発見される異常の数の累積と考えにくい理由があるのだろうか。
○自分の考えに誤りがあることを恥じるよりも、それを訂正することを拒む姿勢こそを恥じたい。
【お詫び】
納得いく形に仕上げる前に数分あるいはもう少し長い時間公開してしまっていたようです。
一度公開したものは極力無断で訂正や追記をしないようにしていますが、
今回ははかなり追記しています。
福島県の県民健康調査の話題を目にすることが多くなった。
1巡目の先行調査の結果もまとまり、2巡目の本格検査の結果も公表されつつある。
この件に関して、情報を収集して深く考えて見ようとか
自分の考えを書き残そうとかは考えていなかったが、
直ぐに目につく程度のことでも直観はある程度働くし、
目についた議論をみるだけでも、色々考えることがあり、気が変わった。
この件に関する自分の直感は正しいのか、間違っているのか、
間違っているなら何故間違った直感が働いたのかを、後で検証したいと思い、
出来る限り客観的に自分の直観的な判断と考え方を書き残す気になったのである。
【結論】
大雑把なある仮定のもとでは、
福島県の県民健康調査で異常が多数発見されている理由は
検査をしたために見つかりにくい異常を見つけただけ(スクリーニング説)
ということは否定される。
自分の立てた大雑把な仮定は適切でなく、より細やかな仮定の元で考え直すことが必要である。
【お断り 他人が読みやすくなるようには書いてありません】
後から自分が見て、誤りがあるならそれはどこにあったのかが
わかりやすいように書くことにする。そのため中身の割に、大変冗長な記述になる。
【】のところ、あるいはその直後をつまみ読みすれば読みやすくなるように
書くことを心掛ける。
【自分の直観 本格検査の異常の数は先行検査に比べて大きすぎる】
あくまで直観なので自分が気づかぬうちに前提としていることはまだ明確になっていない。
この直観が何を前提にしたものなのか、これから少しずつ考えながら議論する。
【約束事 病名等は具体的に書かず「異常」と書く】
今後この話題を記述する際は病名を具体的に記述することは避ける。
事実と考察だけを綴りたいので、具体的に書くべきなのだが、
具体的に書くとなんともやりきれない気持ちになって書き進められないからである。
将来、そんな気持ちが薄れて何故具体的に書いてないか自分で疑問に思うことも
ありうるので、その理由をここに記しておくことにした。
【考察する事実は次の通り】
「先行検査では、約30万人に対して116名の異常またはその疑い。
本格検査では、約23万人に対して 51名の異常またはその疑い。
本格調査は先行検査が行われた対象にその2年後から3年後に行われた。」
【自分の直観をより詳しく】
「51という増分は、2年から3年の間のものとして、それ以前の累積と見られる116に対して
大きすぎるように思う。」
【約束事 注目するのは「異常またはその疑い」それを単に「異常」ということがある】
「異常またはその疑い」から「異常」を確定するまでには時間がかかる。
本格検査ではその十分な時間がとれていないことから、注目するのは「異常またはその疑い」
とする。また先行検査を見る限り、「異常またはその疑い」と「異常」の差は
大きいとはいえない。それらの理由から、「異常」の数そのものよりも
「異常またはその疑い」の数に注目するのは妥当なことである。
以降、「異常またはその疑い」を単に「異常」ということがある。
【約束事 「異常」が真の意味で「異常」なのかは問わない】
このたびの先行検査あるいは本格検査における「異常」発見の割合は、
それより前に知られていたものよりも大きい。
にもかかわらず、今観察されている「異常」発見数の多さは
「異常」の多発を意味しない、という方がおられる。
その説は細部に色々違いはあるが、大筋において次のようなものである。
---------------------------------------------------------------
今まで行っていない方法で観察しているのだから、
その方法により今まで発見できなかったものを発見する可能性は否定できない。
「異常」を多数発見はしているが、それらは従来なら見つからないままだった
可能性のあるものだから、従来と同じ意味での「異常」あるいは
真の意味での「異常」が多発しているとは言い難い。
「異常」を過剰に診断している可能性がある。
----------------------------------------------------------------
自分の直観を検証するのに、真の意味での「異常」の定義は
不要と考えられるので、そこには踏み込まない。
ここでは、あくまでも発見されている「異常」の数についてを考察する。
真の意味では「異常」ではないものまでも「異常」と呼ぶのが気になる方は、
「異常」の代わりに何か別の言葉を用いればよい。
自分も病名の代わりに「異常」と書いて既に言葉の置き換えを行っている。
上の見解について
「今まで行っていない方法で観察しているのだから、
その方法により今まで発見できなかったものを発見する可能性は否定できない」
というところまでは同意できる。
【約束事 スクリーニング説の定義】
「異常の数が増えたのは検査自体をしたことが主な原因である」
あるいはもっとはっきり
「今発見されている異常は検査をしたために見つかったものである」
をここでのスクリーニング説の定義とする。
他の定義も色々あろうし、世間での一般的な「スクリーニング説」とは
異なるかもしれない。しかし自分はそれらの違いに興味がない。
【方針 まずは大雑把な仮定で検証】
今回の議論は大雑把な仮定をおいてのものである。
明確な結論が出ていないことを議論する際になんらかの仮定を立てるのであれば、
まずはできるだけ単純な仮定を立てて検証し、必要に応じてより細やかな仮定を立て直すのが筋だと考える。
いくつもの仮定を用いて低い確率が計算されたなら、そのうちの特定の仮説を否定するようなことはすべきではないと考える。
【自分の直観の言いかえ 大雑把な仮定のもとではスクリーニング説は否定されるだろう】
【以下は自分の直観の検証】
スクリーニング説を認めると非常に珍しいことが起こっていることを示す。
まずはスクリーニング説を認める。
【仮説0】 上記で定義したスクリーニング説は正しい。
「異常またはその疑い」は全て検査をしたから見つけたものである。
他にも議論を進めるために必要と思われる仮定をおく。
【仮定1】 調査開始以降、異常発見に影響を与える要因は無いものとする。
【仮定2】 先行検査(1巡目)でも本格検査(2巡目以降)でも診断の質に差はないとする。
年齢別の詳細データがないために、乱暴な仮定をおく。
ある程度のデータはあるが、そのようなデータはここでは利用しない。
【仮定3】 一定期間に新たに発生する観測可能な異常は、年齢によらず同じ割合で発生する。
【仮定4】 調査対象の年齢構成にそれほど違いはない
現実には、0~5歳では異常は発見されていないので、
より精密な議論をする際は仮定3を別の形で置き換える必要がある。
また、年齢構成は調査対象の上の方は少な目であることが知られていて、
先行調査の上の方の年齢層が少な目であることは、先行調査の異常の数はもっと大きいものであったことを意味し、
仮説0を棄却するのに有利に働いてしまうので、より精密な議論をする際は仮定4も見直す必要がある。
本格調査は上の方の年齢層がさらに少な目であるが、
仮定3を認めれば、異常の増分は年齢にかかわらず一定なので、本格検査では年齢構成は考察に影響しない。
仮定3も仮定4も乱暴な仮定であるが、ここでは議論を先に進めることを急ぐ。
【仮定5】先行検査は、事故当時に行われたとする。
【仮定6】本格検査は、先行検査後3年後に行われたとする。
仮定5も仮定6も仮説0を棄却するには不利に働くための設定である。
仮定5により、先行検査時の年齢は実際より若くなることになり、生まれてから実際より短い期間で
異常が蓄積されたと考えられ、先行検査から予想される異常の増加する割合は、大き目に見積もられる。
仮定6により、先行検査と本格検査の間の期間は大きめに見積もられる。
異常の増加する割合も検査の間の期間も大きめに見積もれば、その間の異常の増加は大き目に見積もられ、
本格検査の異常が大きいことの妥当性を押し上げ、仮説0を棄却するには不利に働く。
以下において仮説0、仮定1から6のもとで得られることを命題と記す。
命題といいながら実際には仮説や仮定を用いて導くので、その多くは仮説に過ぎない。
【命題7】 先行検査が約23万人で行われていたら「異常またはその疑い」の数はおよそ90とみなしてよい。
年齢構成の比を保つなら「異常またはその疑い」の数は調査対象の数に比例すると考えて良い。
116x23/30=88.933...
切り上げて90にすることは仮説0を棄却するには不利に働く。
【命題8】 先行検査の調査対象は全員9歳丁度とみなしてよい。
仮定3と仮定4より調査対象は全員が平均年齢だと考えてよい。
調査対象は19歳未満と考えられ、平均年齢は9.5歳である。
先行検査の平均年齢を小さく見積もることは、仮定5の妥当性と同様、
仮説0の棄却に不利に働く。
【命題9】 先行検査の異常の数は同じ調査対象の9年間の増加分とみなしてよい。
命題8と仮定3よりあきらか。
【命題10】約23万人の調査対象において1年間におよそ10人ずつ異常が増える。
仮定3と命題9より約23万人の1年間の異常の増加は 90/9=10
厳密にいえば、調査対象は異常が出た分だけ減っていくことになるが、
23万に対して10は小さいからそのようなことは無視できる。
【命題11】約23万人の調査対象において3年間での異常の数は平均30と見積もられる。
仮定3と命題10より 10x3=30
【命題12】約23万人の調査対象において3年間での異常の数は近似的に平均30のポアソン分布に従うと考えられる。
命題11とポアソン分布の定義による。
【命題13】仮説0は仮定1から仮定7までのもとで危険率1パーセントで棄却される。
命題12より、異常の数が51以上の上側累積確率を求めると、2.98x10^(-4)<0.01。
【考察】
とんでもなく低い確率が計算されたので、仮説0、仮定1から6のどれかは棄却される。
仮定3と仮定4には問題があると考えられる。
【今後の方針】
○仮定3は、0歳から5歳で異常が0を考慮して立て直したものに置き換える。
仮定4を必要としない詳細データをまつか、今あるおおまかなデータを補正して考え直す。
○他国のデータで2万500中に異常0というものを見た記憶があるので、そのデータと先行検査を比較する。
○ヨウ素129を参考にしたヨウ素131マップとの比較を考える。
【いくつか感じていること】
○先行検査と本格検査の調査の大きさがそろっているときに異常の数が同等になると思うかどうかを尋ねている人をみかけた。
先行検査で得られた特定の年齢の異常の数をそこまでの各年齢ごとに発見される異常の数の累積と考えるならば、
先行検査と本格検査の直接比較は関数の値と関数の増分を比較するような不自然なことのように思える。
○先行検査と本格検査の分布の形が異なることを気にしている方を見かけた。
先行検査で得られた特定の年齢の異常の数をそこまでの各年齢ごとに発見される異常の数の累積と考えるならば、
先行検査と本格検査で分布の形が異なることに何の不思議もない。
仮定3は見直す必要があるものの、先行検査で年齢と異常の数が正比例を仮定すれば、本格検査では一様分布になり、分布の形は異なる。
○先行検査で得られた特定の年齢の異常の数をそこまでの各年齢ごとに発見される異常の数の累積と考えにくい理由があるのだろうか。
○自分の考えに誤りがあることを恥じるよりも、それを訂正することを拒む姿勢こそを恥じたい。
【お詫び】
納得いく形に仕上げる前に数分あるいはもう少し長い時間公開してしまっていたようです。
一度公開したものは極力無断で訂正や追記をしないようにしていますが、
今回ははかなり追記しています。