おもしろニュース拾遺

 BC級ニュースが織り成す可笑しくも愛しい『人間喜劇』。おもしろうてやがて悲しき・・・

250人の誕生日が同じ日で論文偽装バレる

2006-01-16 22:11:56 | 詐欺
 韓国の黄禹錫ファン・ウソク ソウル大学教授の論文捏造事件の後を追うように、日本でも東大教授のグループが英科学誌ネイチャーなどに発表した論文について捏造の疑いが出ている。再実験で論文の結果が再現できなかったとして、東大では教員懲戒委員会に審査を依頼するかどうか判断するという。

 そして今日もまた論文捏造のニュース。「ノルウェー・ラジウム病院(オスロ)は15日、同病院の医師(44)が昨年10月、英医学誌ランセットに発表した口腔(こうくう)がんに関する論文が架空のデータに基づいていたことを明らかにした。」(ロイター共同1月16日)というが、バレた理由が何ともお粗末で、「論文でサンプルとされた908人のうち、250人の誕生日が同じ日だった」というから、完全な手抜きだ。

◆「この中に同じ誕生日の人が必ずいる」

 この記事を読んで思い出したのが、確率の入門書などには必ず出てくる「誕生日の問題」だ。今、あなたが参加者30人のこぢんまりしたパーティに出席しているとしよう。そしてそれぞれお互いのことをよく知らない。「皆さん、ここで賭をやりましょう。この中に同じ誕生日の人がいるかいないか。私はいる方に賭ける」。「いる」確率をpとすると、この場合p=0.706・・程度なので賭に勝つ確率は7割と高い。(どの日も均等に生まれると仮定した。実際はそうでない。この点は記事末の【付録】参照)

 計算方法は、なぜかWebにはやたらとこの「誕生日のパラドックス」問題を解説したページが多いのでそちらを参照されたい(たとえばここ)。高校で習う確率論の、「積事象」と「余事象」の概念を知っていれば計算方法の理解も容易だ。計算も100円電卓で(関数電卓があればもっと便利だが)可能だ。
 なぜこの問題が「パラドックス」と呼ばれるのかというと、たぶん直感的に予想されるよりも「いる」確率が高いからだ。その場の人数をnとして、n=23でp=0.507..なのでこの人数ですでに「いる」確率の方が高くなり、40人学級だとp=0.891..だから10クラスに9クラスは「同じ誕生日の人がいる」ことになる。

 なぜこの確率が高く感じられるかというと、この問題を「この場に自分と同じ誕生日の人がいるか」という問題と混同するからだ。後者の場合は、「いる」確率が五割を超えるのは、n=>253だから、相当の人を集めないとダメだ(計算方法は上記URLで)。直感的には180人程度かと思う(n=180ではp=0.39に過ぎない)ので、これもまた誕生日のパラドックスと言えるかもしれない。(実際365人集めるとほとんど確実思えるが、この場合でもp=0.633に過ぎないからあまり自信を持って断言できない)。

◆新「誕生日のパラドックス」

 ちなみに「908人のうち、250人の誕生日が同じ日」という確率はどれほどになるのか?こういう問題も考えておかないと、数学に弱い人は偽装家に「こうなることは確率論的に0ではない」と言われると黙ってしまうかもしれないからだ。
 この計算は「二項分布」の計算だが、nが大きいので、「ポワソン分布」で計算。これらについてはWebでは例えばここを見ていただきたいが、統計学の入門書が必要かもしれない。計算も関数電卓か表計算ソフトが必要なので、何でも自分で計算しないと納得しない方以外は、以下の結果だけを信じてください。

 「250人の誕生日が同じ日」というのは「250人以上の誕生日が同じ日」として考えるのが妥当。それでもこれはあまりにも大きい数字(小さな確率)なので、その無意味さを理解してもらうためにもっと小さい数字で計算してみた。
「908人のうち、ある特定の日に5人以上の誕生日が重なる確率p」  p=0.041
「10人以上」p=0.000059    「30人以上」p=6.8e-12
最後の数字は小さすぎて分かりにくい。だいたい1470億分の一という確率だ。30人にしてこの数字。250人なら pはもう「無限小」、完全に起こり得ないと断言してよい。

 まさしくこの医師の偽装は「誕生日のパラドックス」だった。あまりにもあり得ない数字を持ち出して馬脚を現した。データーを偽造するなら、少しは汗をかけ。誕生日欄を単にコピペで作っているからこういうことになる。姉歯の爪の垢でも煎じて飲めばいい。彼は「専門家が見れば一目瞭然」と”謙遜”しているが、「専門検査機関」が「複雑すぎて見抜けない」ほどの数値の偽装を何十件(何百件?)もやってのけたのである。

【付録】 誕生日の分布
 うるう年を考えないとしても実際の誕生日は1/365の確率で均一に分布していない。厚生省がそのデーターを持っているはずだと思い、Webを検索したが見当たらない。直接問い合わせると、かなり時間がかかっての返答は、「厚生労働省に直接来れば資料を見せてやる。」
 別に担当者が意地悪なのではない。これがお役所発想というものです。つまりコスト概念が全くないのです。一般の人も自分たちと同じく情報を得るためにコストを払わなくていいと思ってしまう。
 しょうがないので、ここでは西日本新聞が厚生労働省「人口動態統計」をもとに作成した1998年の資料を使わせてもらう。
 この年、一番出生者が多かったのは9月22日(4236人)だ。最下位の1月1日(2201人)とは倍近くの差がある。しかしこれは届け出上の数字であることに注意。元日生まれの子供は「お目出たいヤツ」と学校でいじめられるかも知れぬ、元旦と誕生日の祝いが重なるのは面倒だ、などの理由でこの日を誕生日と届けるのを避ける傾向があるのだろう。実際例えば12月24日が26位と上位に来ているのは、誕生日とクリスマスパーティが一緒にできてケーキ代が節約できるという親の配慮があるに違いない。

 厚生省が秘密にしている?この資料を別の方法で集計すれば、日本人の「繁殖期」が突き止められると思うのだが、その様な研究をご存じの方はぜひご教示ください。

「土佐宇宙酒」まもなく出荷へ

2006-01-16 11:14:08 | 発見
 だいぶ昔のことだが、高知県のある大学の学長が酒宴の最中トイレに立って階段から足を滑らせてお亡くなりになるという気の毒な事件があった。しかしこの事件を伝えたある週刊誌が、地元ではこの学長に対する同情よりも非難の声が出ていると伝えていた。「1升程度の酒で足元がふらつくとは情けない」というのである。
 昔から土佐では「酒をしょうしょう飲む」とは、「升升」ということで2升程度を意味する。高知と秋田は昔から酒豪の多いところとして有名だ(単純に一人当たりの酒量では「酒好き」かどうか分からない。この議論は煩瑣になるので記事末を参照)。

 その酒好き高知で世界初の「宇宙酒」の醸造が始まっている。<「土佐宇宙酒」の初搾り>asahi.com高知1月11日。実は日本酒なのだが、この酵母がロシアの宇宙船ソユーズに乗せられて宇宙を旅したことから「土佐宇宙酒」と命名されているのだ。
 この酵母は冒頭に掲げた写真のようにカプセルに入れられて、昨年の10月1日カザフスタンのバイコヌール宇宙基地から打ち上げられ、同11日に地球に帰還した。乾燥させた粉末状のドライ酵母8種類、寒天を培地にしたウエット酵母4種類が2グラムずつ10日間の「宇宙旅行」を体験して、現在もう初搾りの段階にまで進んでいる。

 関係者は「地球を回っている時の地磁気の影響で、酵母に変化があったかもしれない。」と語っている(朝日新聞1月5日)が、影響があるとすれば、「磁気」よりも重力だろう。そして細胞分裂の盛んなウエットタイプの酵母が突然変異の可能性が高い。しかし10日間は短い。もう少し長く滞在していればもっと「変異」の可能性が高かっただろう。
 とは言え、それは費用と効果のバランスの問題。いくら酵母が軽いとは言え、宇宙船への「乗車賃」が必要だった。今回の費用は総額1200万円。700万円を酒造組合と県の補助金でまかない、残りは賛同する企業などが負担したという。

 この「宇宙酒」は一般にも販売され、Webなどで予約(4月1日から販売)を受け付けているが、気になるお値段は、720mlビンで一本3150円とされている。
 その「効能」については誰にも分からない。酔っ払って突然「宇宙人語」をしゃべる人があるかもしれないし、「たま出版」に入社したくなる人が出るかもしれないし、何の変化もないかもしれない。

 「宇宙酒」は酒文化の成果の一つと言えるが、一方飲酒のもたらす弊害、特に公務員の飲酒運転の頻発に苦慮した高知県は1997年に下戸の橋本知事が、飲酒運転の県職員は即刻懲戒免職との通達を出し、これが「厳しすぎる」といまだに議論が続いている。しかしこれも驚きだ。つまり飲酒運転「程度」では懲戒免職にしないというのが「普通」のお役所ということだから。

 最近少し厳しくなったが、日本の法律が飲酒運転に「寛大」なのは”国策”のせいである。飲酒を制約して酒税が減少するのがイヤな大蔵省と、モータリゼーションにブレーキがかかってしまうのを恐れる通産省がバックにいた。罰則強化の「抵抗勢力」だったと言えよう。
 このように我々が「日本の文化」と思っているものの多くは、実はお役所の「指導」によるものが多い。例えば、お花見と言えば今ではソメイヨシノだが、これは戦前に「パッと咲いてパッと散る」この品種が、「お国のために命を捨てる」教育に効果的と思った国が植樹を奨励したからだ。ちなみにソメイヨシノは江戸時代に作られて以降接ぎ木で増えていったから、日本中にあるこの桜はすべて「クローン」である。恐るべき「画一化」だ。だから例えば西行が今の日本の「花見」を見たとしたら、「これは”日本文化”でない」と抗議することだろう。

 宇宙空間での滞在がもう少し長くなれば、突然変異で酔い覚めのスゴく早い日本酒を産み出す酵母が誕生するかもしれない。費用が問題だが、アルコール中毒の増加に悩むロシアにうまく働きかけて共同研究という形を取ればかなり節約できるはずだ、

【付録】 「飲んべえ」都道府県はどこ?

 国税庁の統計によって、一人当たりの消費酒量を知ることはできる。これによると東京、大阪、高知の順だ。しかしなぜ東京、大阪が多いのか?これは要するに飲食店の数が多いからだ。例えば埼玉から都心に通っているサラーリーマンが飲酒するのは東京都に換算される。だから本当の自家消費量を知ることが出来ない。
 東京、大阪の特殊事情を考えれば、やはり高知県が一番の「飲んべえ」県と推定される。

 またアルコール度数の問題がある。強い酒と日本酒は単純に量を比較してもダメだ。これについては「エチルアルコール換算の都道府県別1人当たりのアルコール消費量」を計算した結果がある。これについても、上記の「補正」をしなければ東京人が一番の飲んべえという誤った結果に導かれてしまう。
 このページでは、酒に弱い人強い人と遺伝子の相関についての議論がされている。詳しくは上記ページを参照されたいが、結論的に言うと、「縄文人は酒に強く、弥生人(渡来人)は弱い」ということだ。日本人の起源について一つの示唆を与えている。