会計スキル・USCPA

会計はビジネスの共通語。一緒に勉強しましょ。

米国で乳児死亡率が上昇その2 批判と検証

2011-07-03 16:35:51 | 政治

前回、フィラデルフィアの乳児死亡率のニュースをご紹介して、それから、その他の米国北西部の都市でも増えている、というハナシだったんですが、

どうも、このハナシは結構話題になった後だったようでして、
しかも、乳児死亡上昇については眉唾だ、とかの指摘があって、

Are Babies Dying in the Pacific Northwest Due to Fukushima? A Look at the Numbers


このブログが分かりやすいですな。

原発事故以降アメリカ北西部で乳幼児の死亡数が35%上昇しているって、ホント?

これは、フィラデルフィアの方ではなくて、後者の、北西部で死亡率が増えているとの調査に対するものですが、要するに、

データの取り方、

それと、

都市の選定が、恣意的、ないしは意図的だ、ということなんですな。

なんで、事故前が4週間で、事故後が10週間なのよ、ということ。
もっと長いタームで取ってみると、そんな傾向は無いじゃないか。

都市も、死亡率が増えている都市だけをピックアップしているじゃないのか。同じ北西部で増えていない都市があるのに調査は無視している。

てなわけですね。

私は、当初の調査の原文を読んでいないので、この批判が正当なものかよく分からないんですが、

まあ、こういう指摘を簡単に受けてしまうのは、調査の方に問題があるんでしょうな。

で、それじゃあ、この批判のように完全にイカサマ扱いしていいものか、という点はどうでしょうか。


1.都市の選定について

この批判は見当はずれだと思います。異常値を示しているデータを調査は指摘しているんで、異常値を示した都市をピックアップするのは当然ですね。

これホットスポット問題なのであって、

こないだ紹介したニューヨークのアカデミーが出したチェルノブイリ被害に関するレポートでも、汚染の度合いは、ほんの10メートル違えば、数値が異なったと書いてある。たとえ、同じ北西部であっても、汚染度合が大きく異なるのは自然であって、気にしなくてはいけないのは、異常値がどこかで発生した、ということだけですな。

この記事にコメントの書き込みがあって、

This criticism is also flawed, as it assumes by omission that the level of radionuclides from Fukushima were deposited equally on all cities where data was collected. Without this as a variable in a study, any analysis is flawed. Oddly enough, the highest spike in infant mortality was in Pennsylvania, where the highest bequerel count was noted by the EPA.

この批判も同じく間違っている。福島からの放射性物質が均等に各都市に降り注いだとの暗黙の前提を置いているからだ。この変数無しには、どんな分析も間違ってしまう。乳児死亡の上昇が最も高かったのは、ヘンシルバニアであって、EPAの調査で最も高いベクレル数を記録した場所であるという点は、やはり変だ。

ヘンシルバニアというのは、ニュースで取り上げられていたフィラデルフィアのある場所ですな。福島後48%上昇したというコトなんでした。


2.データの取り方について

これは、ヤッパまずかったんでしょうね。なんで4週間と10週間なのかよく分かりません。
しかし、やはりコメントに指摘があるんですが、あるニューズレターが追試というか再検証をしているんですね。統計の専門家に依頼したとかで。

カウンターパンチという、有名なニューズレターで、ただ、権威あるとは言えなさそうなんですが。

カウンターパンチ wikki

Post-Fukushima Infant Deaths in the Pacific Northwest

しかし、目配りはしっかりされているようでして、まず、使っている統計数値ですが、たんなる死亡数であって、全体の母数が現時点で分かっていないので、死亡率としては計算できていないことを断っています。だから、増えた減ったというのは、人口や年齢別構成比が変わらないとの仮定のもとでのハナシだ、と最初に言ってるんですな。

まず、データの取り方は別として、調査で出ている計算そのものは合っていたそうです。

で、問題のデータ期間の取り方ですが、


Sprey collated the death numbers for the ten week period before, then did the calculations comparing infant deaths for ten weeks before and ten weeks afterwards for the same eight cities. His result was a statistically insignificant difference in deaths per week before and after– an increase of infant deaths of only 2.4 per cent.

事故前10週間と事故後10週間で比較すると、2.4%しか増えていない。

事故前4週間をとったからおかしな数字が出たってことですな。


To further guard against the possibility of some seasonal effect due to comparing a period earlier in the spring with one later in the spring, Sprey also compared the ten weeks after Fukishima with the identical weeks in 2010. He found exactly the same result: a 2.4 per cent increase in infant deaths over the prior year which, given 128 deaths in the ten week sample, is entirely insignificant statistically.

前年同期で確認しても、事故後10週間の数字は2.4%増えただけ。

というわけで、この調査はアウトとの結論です。

ところが、

3.それでも乳児死亡率は上がっている可能性が高い

But then Sprey went further and looked at the Sherman/Mangano selection of eight cities from the 122 reporting to CDC: the eight were Berkeley, Portland, Sacramento, San Francisco, San Jose, Santa Cruz, Seattle and Boisie. Apparently, they selected Pacific Coast cities that were more or less within 500 miles of the coast and north of Santa Cruz. However their selection did not include all CDC cities within this categorization, because they left out Tacoma and Spokane, thus leaving themselves open to suspicions of cherry-picking cities.

もう少し、独自に調べてみたそうで、まず、批判のあった都市の選定についてですが、都市の選定が恣意的であるとの批判を回避すべく、太平洋側で沿岸から500マイル内かつSanta Cruzより北部にある都市、に限定。調査で除かれていたTacoma and Spokaneを加えて、

Simply by moving the boundary line northward from Santa Cruz Sprey found that the four northernmost Pacific Northwest cities in the CDC sample – Portland, Tacoma, Seattle and Spokane – show remarkably significant results – a larger infant mortality increase than the original Sherman-Mangano results.


4都市にサンプルを限定して調べたら、結果は極めて重大で、元の調査よりさらに悪化することになった。

During the ten weeks before March 11 those four cities suffered 55 deaths among infants less than one year old. In the ten weeks after Fukushima 78 infants died – a 42 per cent increase and one that is statistically significant.

4都市での事故前10週間での1歳未満の死亡数は55人。事故後10週間での死亡数は78人で48%増えている。

To confirm once again that these results were not due to seasonality Sprey compared these infant deaths in the ten weeks after Fukushima to the deaths in the equivalent ten weeks a year earlier. The results were almost identical with the ten weeks before Fukushima in 2011. Within the equivalent ten weeks of 2010 53 infants died in these four cities.

前年同期で確認すると、事故前に相当する10週間の前年同期の死亡数は53人で、ほぼ変わらないが、

The post-Fukushima deaths are 47 per cent higher than they were in the same period a year before – once again statistically significant. If you add Boisie, Idaho to the four city sample the results remain almost unchanged.

事故後の数字を前年同期比で比べると47%増加している。繰り返すが、これは統計的に有意な結果だ。


Looking a little more closely at the time trend of the infant deaths after Fukushima, Sprey found that the most dramatic increases in deaths were in the two weeks right after the March 11 disaster. Those two weeks saw a near tripling of weekly deaths, followed by a period of somewhat elevated weekly deaths lasting for about five weeks – roughly 25 per over the pre-March 11 rate, then settling down close to the average pre-Fukushima death rate for the last three weeks of the ten week period post-disaster. These results are necessarily approximate because the weekly sample of deaths is too small for precise statistical conclusions.

もう少し細かく見てゆくと、3月11日の事故直後からの2週間に、死亡数が大きく上昇。最初の2週間で死亡が3倍近くになり、次の5週間ほどは3月11日以前より25%程度高い状況が続き、最後の3週間はもとの数字近くまで戻った。

これらの数字はあくまで概算にすぎない。週間の死亡者数は統計的に正確な結論を出すには数が小さすぎる。


というわけでして、当初の調査には問題があるが、もっときちんと調べてみたら、やっぱヤバそうじゃん、って感じです。


本来日本でこそ、こういうデータが集計されて、広く議論されるべきだと思いますが、
なんで、アメリカの議論を参照せなイカンのよ。




最新の画像もっと見る

2 コメント

コメント日が  古い順  |   新しい順
なぜ都市数を減らして10週間ずつだけで比較? (warbler)
2011-07-04 05:25:57
>4都市での事故前10週間での1歳未満の死亡数は55人。事故後10週間での死亡数は78人で48%増えている。

>前年同期で確認すると、事故前に相当する10週間の前年同期の死亡数は53人で、ほぼ変わらないが、
事故後の数字を前年同期比で比べると47%増加している。繰り返すが、これは統計的に有意な結果だ。

この4都市がホットスポットだという証明はありますか?また、なぜもっと広い期間の範囲でデータがあるのに10週間に期間を限定して比較するのでしょうか?
結局、これも詭弁になっていると思います。

元のデータが少ない程、バラツキが大きくなり、偏った結果が出やすくなります。もうちょっと統計の基礎知識を勉強する必要があるのではないでしょうか?

自分の出したい結論に添う様にデータの選択を行うのは、大きな誤りです。
そして、ある統計で原発事故後で死亡数が仮に急増していたとしても、別の理由(感染症の流行など)も考えられます。最終的にはそういう「因果関係」の立証も必要になることも忘れてはいけません。


ついでに紹介します。こちらも統計のトリックを扱ったものです。
「牛にホメオパシーが効くってホント?」
http://d.hatena.ne.jp/warbler/20110105/1294199038
返信する
言葉の訂正 (warbler)
2011-07-04 06:40:51
元のデータが少ない程、バラツキが大きくなり、偏った結果が出やすくなります。

→元のデータが少ない程、偶然によるデータの値の偏りが大きくなり、誤った結果が出やすくなります。
返信する

コメントを投稿