米国で乳児死亡が増えている可能性についてなんですが、
前回、リンクを貼らせていただいた関係で、トラックバックをさせていただきましたが、早速ご本人からコメントをいただきまして恐縮です。
☆☆☆
>4都市での事故前10週間での1歳未満の死亡数は55人。事故後10週間での死亡数は78人で48%増えている。
>前年同期で確認すると、事故前に相当する10週間の前年同期の死亡数は53人で、ほぼ変わらないが、
事故後の数字を前年同期比で比べると47%増加している。繰り返すが、これは統計的に有意な結果だ。
この4都市がホットスポットだという証明はありますか?また、なぜもっと広い期間の範囲でデータがあるのに10週間に期間を限定して比較するのでしょうか?
結局、これも詭弁になっていると思います。
元のデータが少ない程、偶然によるデータの値の偏りが大きくなり、誤った結果が出やすくなります。
もうちょっと統計の基礎知識を勉強する必要があるのではないでしょうか?
自分の出したい結論に添う様にデータの選択を行うのは、大きな誤りです。
そして、ある統計で原発事故後で死亡数が仮に急増していたとしても、別の理由(感染症の流行など)も考えられます。最終的にはそういう「因果関係」の立証も必要になることも忘れてはいけません。
ついでに紹介します。こちらも統計のトリックを扱ったものです。
「牛にホメオパシーが効くってホント?」
http://d.hatena.ne.jp/warbler/20110105/1294199038
☆☆☆
実のところ、特に異論はありません。
カウンターパンチの再調査によって、確定的に言えることは少ないと思います。
ついでなんで、一つ一つ見てゆきますと。
1.ホットスポットと4都市の関係について
カウンターパンチの再調査は、ホットスポットと乳児死亡との関連については何ら主張をしていません。
選ばれた4都市は、当初の調査で8都市の選定が恣意的、ないしは良いとこどり(cherry-picking)だ、との批判を受けて、地域を北西部沿岸部に限定した上で、当初調査で落としていた都市を加えたものです。都市の選定に恣意性が入らないように都市を地理的に狭く、くくって選びなおしたんですな。
北西沿岸部なら放射性物資が多く落ちてきただろう、という想定をして、北西部都市というくくりで調べてみたんでしょうが、調査そのものは、『福島事故の直後に、乳児死亡が増えた』、ということを言っているのみで、放射性物質については特に調査とは関係していない。
ホットスポット問題を持ちだしたのは私なんですが、それは、都市の選定についてはあまり問題にすべきではなく、異常値を示す都市があるというだけで、十分意味のある調査だ、なぜならばホットスポットはまだらに散らばるから、という文脈です。
カウンターパンチは都市の地域限定にあくまでこだわり、北西部太平洋側沿岸500マイル内かつSanta Cruz以北でくくって4都市を選んでいます。良いとこどりだとの批判を回避するため、都市選定の条件を地理的に絞ったのですね。
2.なぜもっと広い期間の範囲でデータがあるのに10週間に期間を限定して比較するのでしょうか?
これも、当初の批判に応えてのものですね。事故前4週間と事故後10週間がバランスしてなくておかしい、との批判にこたえ←もっもと彼らがやった調査じゃないんですが、事故前10週間と事故後10週間に修正した。確かにもっと長くしても良いと思いますが、当初調査の再検証として行ったので同じ10週間にしたんだと思います。
期間の長さは、捉えたい事象の性質によるんでしょうね。通常、放射線を浴びて癌になるまでに10年近くかかると言われていますが、発癌との関連を調べるのに10週間は短すぎますな。しかし、今回の乳児死亡は、この調査によれば、事故直後に3倍に増えて、その後数週間で元に戻る現象なので、余り長くすると捉えられなくなりますね。
ちなみに、カウンターパンチの名誉のために付け加えますと、データが小さ過ぎることには留保を置いていて、These results are necessarily approximate because the weekly sample of deaths is too small for precise statistical conclusions.
週毎の死亡者数でいくと、サンプル数が小さ過ぎるので正確な統計結果だとは言えず、どうしても概算値になってしまう、と書いてます。期間が短いのではなくサンプル数が小さ過ぎるんですね。48%増えたとは正確には結論できない。もっと高いかも知れないし低いかも知れない、けど統計的に有意であるとは言える、との結論です。
3.自分の出したい結論に添う様にデータの選択を行うのは、大きな誤りです。
一般論としてはご指摘の通りです。しかし、カウンターパンチは、そうした良いとこどり(cherry-picking)批判をかわすために、データ選定方法を修正しているので、このデータ選択がさらに恣意的だと批判するには、もう少し反論がいりそうです。
4.ある統計で原発事故後で死亡数が仮に急増していたとしても、別の理由(感染症の流行など)も考えられます。最終的にはそういう「因果関係」の立証も必要になることも忘れてはいけません。
これは重要な指摘だと思います。その通りであって、ここで言えるのは、事故に前後して特定の場所でそういう事象があったということだけですね。
こうした簡単で、突っ込みどころの多い調査ではありますが、とても大事だと思うんですな。もしかしたら原発事故によるものかも知れないし、そうじゃないかも知れない。しかしウォーニングが発されることが後の調査につながり、万一への備えもできるわけでして。
因果関係が証明されるまでには随分待たされるわけだし、最後まで結論が出ない、なんてこともあり得ますな。公害訴訟なんかを考えてみると、そう思うんですね。何十年も待っているわけにはいかないんで。
5.牛にホメオパシーについて
拝読いたしました。何度も試行して、有意な結果が出たものだけを良いとこどりしたケース、ですね。
カウンターパンチの再調査は、そうした批判をかわすためにデータ選定方法を修正していますが、イロイロとやってみて、異常値が出る組み合わせを選んだ、可能性もありますね。そして、結果だけ出した。BoisieとIdahoを4都市に追加して6都市でやってみても、結果はほとんど変わらないと書いてあるので、いろいろとやってみていることは間違いありませんが。
しかし、今回の調査は実験ではなく、現実世界の中の異常値探しであって、いろんな条件で探してみると、こういうのが見つかった、ということで、方法として変ではないと思います、というか他にやりようが無い。選定の条件に恣意性が入り込んではいけないということは、上での議論の通り。
ということで、いただいたコメントを元にして、今回のカウンターパンチの再調査によって言えることは何か、を整理してみますと、
1.ある特定の地域にある4都市で、福島事故に前後して乳児死亡率が上昇した可能性が高い
2.現時点での人口数や構成が不明なので死亡率については誤差がある。確実に言えることは絶対数としての死亡数の上昇
3.データ選定当たって、事故前10週間と事故後10週間、地理的には太平洋沿岸部米国北西部の都市を選定しているが、調査者は異常値を探す意図をもってデータ選定をしており、表面的には客観的に見えても恣意性が入り込んでいる可能性がある。
4.事故を挟んで20週間という調査対象期間は、短すぎるかも知れないし、長すぎるかも知れない。
5.サンプルが小さ過ぎるため、誤差がある
だれも、そうだと主張しているわけではありませんが、一応、これも。
6.福島事故直後に乳児死亡率が増えたからと言って、福島事故が原因だとは決められない
とまあ、以上ですが、再調査に対する見方は少し違っているかも知れませんが、一つ一つご指摘いただいたことについては、基本的に異論は無いんですね。今回コメントをいただいたおかげで、随分考えが整理できたような気がします。
よろしければ今後も、どうぞよろしく。
前回、リンクを貼らせていただいた関係で、トラックバックをさせていただきましたが、早速ご本人からコメントをいただきまして恐縮です。
☆☆☆
>4都市での事故前10週間での1歳未満の死亡数は55人。事故後10週間での死亡数は78人で48%増えている。
>前年同期で確認すると、事故前に相当する10週間の前年同期の死亡数は53人で、ほぼ変わらないが、
事故後の数字を前年同期比で比べると47%増加している。繰り返すが、これは統計的に有意な結果だ。
この4都市がホットスポットだという証明はありますか?また、なぜもっと広い期間の範囲でデータがあるのに10週間に期間を限定して比較するのでしょうか?
結局、これも詭弁になっていると思います。
元のデータが少ない程、偶然によるデータの値の偏りが大きくなり、誤った結果が出やすくなります。
もうちょっと統計の基礎知識を勉強する必要があるのではないでしょうか?
自分の出したい結論に添う様にデータの選択を行うのは、大きな誤りです。
そして、ある統計で原発事故後で死亡数が仮に急増していたとしても、別の理由(感染症の流行など)も考えられます。最終的にはそういう「因果関係」の立証も必要になることも忘れてはいけません。
ついでに紹介します。こちらも統計のトリックを扱ったものです。
「牛にホメオパシーが効くってホント?」
http://d.hatena.ne.jp/warbler/20110105/1294199038
☆☆☆
実のところ、特に異論はありません。
カウンターパンチの再調査によって、確定的に言えることは少ないと思います。
ついでなんで、一つ一つ見てゆきますと。
1.ホットスポットと4都市の関係について
カウンターパンチの再調査は、ホットスポットと乳児死亡との関連については何ら主張をしていません。
選ばれた4都市は、当初の調査で8都市の選定が恣意的、ないしは良いとこどり(cherry-picking)だ、との批判を受けて、地域を北西部沿岸部に限定した上で、当初調査で落としていた都市を加えたものです。都市の選定に恣意性が入らないように都市を地理的に狭く、くくって選びなおしたんですな。
北西沿岸部なら放射性物資が多く落ちてきただろう、という想定をして、北西部都市というくくりで調べてみたんでしょうが、調査そのものは、『福島事故の直後に、乳児死亡が増えた』、ということを言っているのみで、放射性物質については特に調査とは関係していない。
ホットスポット問題を持ちだしたのは私なんですが、それは、都市の選定についてはあまり問題にすべきではなく、異常値を示す都市があるというだけで、十分意味のある調査だ、なぜならばホットスポットはまだらに散らばるから、という文脈です。
カウンターパンチは都市の地域限定にあくまでこだわり、北西部太平洋側沿岸500マイル内かつSanta Cruz以北でくくって4都市を選んでいます。良いとこどりだとの批判を回避するため、都市選定の条件を地理的に絞ったのですね。
2.なぜもっと広い期間の範囲でデータがあるのに10週間に期間を限定して比較するのでしょうか?
これも、当初の批判に応えてのものですね。事故前4週間と事故後10週間がバランスしてなくておかしい、との批判にこたえ←もっもと彼らがやった調査じゃないんですが、事故前10週間と事故後10週間に修正した。確かにもっと長くしても良いと思いますが、当初調査の再検証として行ったので同じ10週間にしたんだと思います。
期間の長さは、捉えたい事象の性質によるんでしょうね。通常、放射線を浴びて癌になるまでに10年近くかかると言われていますが、発癌との関連を調べるのに10週間は短すぎますな。しかし、今回の乳児死亡は、この調査によれば、事故直後に3倍に増えて、その後数週間で元に戻る現象なので、余り長くすると捉えられなくなりますね。
ちなみに、カウンターパンチの名誉のために付け加えますと、データが小さ過ぎることには留保を置いていて、These results are necessarily approximate because the weekly sample of deaths is too small for precise statistical conclusions.
週毎の死亡者数でいくと、サンプル数が小さ過ぎるので正確な統計結果だとは言えず、どうしても概算値になってしまう、と書いてます。期間が短いのではなくサンプル数が小さ過ぎるんですね。48%増えたとは正確には結論できない。もっと高いかも知れないし低いかも知れない、けど統計的に有意であるとは言える、との結論です。
3.自分の出したい結論に添う様にデータの選択を行うのは、大きな誤りです。
一般論としてはご指摘の通りです。しかし、カウンターパンチは、そうした良いとこどり(cherry-picking)批判をかわすために、データ選定方法を修正しているので、このデータ選択がさらに恣意的だと批判するには、もう少し反論がいりそうです。
4.ある統計で原発事故後で死亡数が仮に急増していたとしても、別の理由(感染症の流行など)も考えられます。最終的にはそういう「因果関係」の立証も必要になることも忘れてはいけません。
これは重要な指摘だと思います。その通りであって、ここで言えるのは、事故に前後して特定の場所でそういう事象があったということだけですね。
こうした簡単で、突っ込みどころの多い調査ではありますが、とても大事だと思うんですな。もしかしたら原発事故によるものかも知れないし、そうじゃないかも知れない。しかしウォーニングが発されることが後の調査につながり、万一への備えもできるわけでして。
因果関係が証明されるまでには随分待たされるわけだし、最後まで結論が出ない、なんてこともあり得ますな。公害訴訟なんかを考えてみると、そう思うんですね。何十年も待っているわけにはいかないんで。
5.牛にホメオパシーについて
拝読いたしました。何度も試行して、有意な結果が出たものだけを良いとこどりしたケース、ですね。
カウンターパンチの再調査は、そうした批判をかわすためにデータ選定方法を修正していますが、イロイロとやってみて、異常値が出る組み合わせを選んだ、可能性もありますね。そして、結果だけ出した。BoisieとIdahoを4都市に追加して6都市でやってみても、結果はほとんど変わらないと書いてあるので、いろいろとやってみていることは間違いありませんが。
しかし、今回の調査は実験ではなく、現実世界の中の異常値探しであって、いろんな条件で探してみると、こういうのが見つかった、ということで、方法として変ではないと思います、というか他にやりようが無い。選定の条件に恣意性が入り込んではいけないということは、上での議論の通り。
ということで、いただいたコメントを元にして、今回のカウンターパンチの再調査によって言えることは何か、を整理してみますと、
1.ある特定の地域にある4都市で、福島事故に前後して乳児死亡率が上昇した可能性が高い
2.現時点での人口数や構成が不明なので死亡率については誤差がある。確実に言えることは絶対数としての死亡数の上昇
3.データ選定当たって、事故前10週間と事故後10週間、地理的には太平洋沿岸部米国北西部の都市を選定しているが、調査者は異常値を探す意図をもってデータ選定をしており、表面的には客観的に見えても恣意性が入り込んでいる可能性がある。
4.事故を挟んで20週間という調査対象期間は、短すぎるかも知れないし、長すぎるかも知れない。
5.サンプルが小さ過ぎるため、誤差がある
だれも、そうだと主張しているわけではありませんが、一応、これも。
6.福島事故直後に乳児死亡率が増えたからと言って、福島事故が原因だとは決められない
とまあ、以上ですが、再調査に対する見方は少し違っているかも知れませんが、一つ一つご指摘いただいたことについては、基本的に異論は無いんですね。今回コメントをいただいたおかげで、随分考えが整理できたような気がします。
よろしければ今後も、どうぞよろしく。
※コメント投稿者のブログIDはブログ作成者のみに通知されます