日々是好日

身辺雑記です。今昔あれこれ思い出の記も。ご用とお急ぎでない方はどうぞ・・・。

筑波大学「豆まきデータ」騒ぎ 問われるのは科学者としての姿勢

2010-07-04 23:04:09 | 学問・教育・研究
昨夜は楽しみにしている韓国歴史ドラマ「朱蒙」が午後7時に始まるので、それまでに食事を終えておこうといつもより早めに食卓に坐った。そして4チャンネル毎日テレビにスイッチを入れたお陰でTBS系列報道特集「科学は裁けるのか… 解雇された世界が認める筑波大元教授の主張は」を始めから終わりまで観ることが出来た。

筑波大学が「本学教員が発表した論文における不適切なデータ解析について」なる文書を2008年3月に公表したことでこの問題が世間に知られるようになった。実験データ解析が問題の焦点の一つになっていることから、現役時代に分野は異なるものの私もデータ解析に取り組んでいたので、その立場から筑波大プラズマ研 不適切なデータ解析についてなる意見をブログに載せたところ、意外な反響を呼ぶこととなった。私が問題となる実験データのことを「豆まきデータ」と表現したところ、この言葉が私の知らない間に関係者の間に飛び回っているようなのである。その辺の事情を「豆まきデータ」と揶揄した債務者とは私のこと?で質してみたが、答えは戻ってこなかった。ところが昨夜の番組で、ナレーターが『大学側の言う「豆まきデータ」・・・』と少なくとも2回は言ったので、どうも筑波大学が裁判関係の書類のなかで「豆まきデータ」なる言葉を使ったのではないかと見当をつけた。この言葉を使っていただいたこと自体ある意味では光栄であるが、私は「豆まきデータ」ではデータ解析に値しないから測定を繰り返してデータ精度を上げるべきだ、との積極的提言への取っかかりとして用いていたのである。しかし察するに原告側からは揶揄と受け取られた使い方をされたようで、その意味では残念である。

私にはこの「豆まきデータ」騒ぎが、『研究論文の実験データ改ざんを理由に懲戒解雇』と世間に報道されているような実験データ改ざんに当たるのかどうか、マスメディアを通じて入る情報だけでは判断出来ないので最初から態度を保留している。私の関心事は秋の珍事? 報道特集NEXT「大学教授はなぜ解雇された」の波紋に述べたことに尽きるので、ここにその部分を再掲する。

私が問題にしているのはデータの解析方法ではなくて、あくまでもデータ収集の手段なのである。同じ測定を繰り返し積算してデータの精度を上げる、これが実験科学者の鉄則であるからだ。

しかしが昨夜の報道番組で取り上げられたのはあくまでも「豆まきデータ」の処理を巡っての話で、それに耳を傾けているうちに私は問われるべきなのはデータ解析の妥当性というよりは、科学者としての姿勢であるよう気がしだした。昨年10月に放映された前回の番組もそうであったが、原告と被告の主張をそれぞれ依怙贔屓無く報じて是非の判断を視聴者に委ねるというのものではなく、あくまでも原告側に肩入れした報道なのである。一般向けのプロパガンダとしてはそれなりの出来であるが手法自体は古くさい。お見受けするところ実験現場からはすでに引退しているが、肩書きのあるいわゆる権威者を登場させて原告側の業績を称揚させるだけで終わっていたからである。ついでにノーベル賞学者を登場させればよかったのに、そこまでは力が及ばなかったようである。しかし私が注目したのは、「豆まきデータ」の取り扱いについて二、三の研究者の意見を紹介していたところで、それぞれ考えさせられた。

最初は一人の研究者のコメントである。「豆まきデータ」を両横から押して時間軸を圧縮すると、左端では何点かが上部に集中しているように見え、右端ではそれよりも下部に何点かが集中しているように見える。だからプロットが減少するのは明らか、というような発言であった。横軸を縮めようと縦軸を縮めようと「豆まきデータ」の本質が変わるわけではないから、データの散らばりをどう受け取るのかその人の主観を述べただけのことである。もし学生がこういうことを言ったとしたら、データの特徴をよく読み取ったと褒める指導者は一人もいないだろう。しかしこの方からは、少なくともこの「豆まきデータ」からある傾向を掴もうと努力する姿勢は窺われるので、この点は納得出来た。データから学ぶという実験科学者の基本姿勢は失われていないように思ったからである。ところがこれと対照的なのが同じく「豆まきデータ」から出発して、異なる解析手法によっても論文に示されたのと同じフィッティング結果が得られたと主張した別のお二人であった。

研究者が予断を持って実験するのは当たり前のこと、と言わんばかりに「豆まきデータ」を原告論文と同じ数式モデルにフィッティングさせると、解析方法が異なっているにもかかわらず原告論文と同じ形の関数が導かれたと言うのである。すなわち原告論文のデータ解析の妥当性を主張したつもりなのであろう。横軸を圧縮した例では少なくとも「豆まきデータ」に基づいて何らかの傾向を見つけようとの姿勢があったが、この例では最初から実験モデルありき、で解析を進めたのである。真摯な実験科学者なら実験データからまず学ぼうとするだろう。もし得られたのが「豆まきデータ」のように何が何やらわけの分からないデータであれば、測定を繰り返しデーターを積算して、それこそ見ただけでどのような傾向にあるのか、ときには関数の形さえ判断出来るところまでデータの精密度を上げようとするだろう。

一方、データを説明するある数式モデルを最初から持っておれば、そのデータがいかに乱雑であってもその数式モデルのパラメータは導かれる。ただ「豆まきデータ」から出発する以上、フィッティング曲線の「豆まきデータ」に対する適合度はかなり程度が低いことであろう。だからこういう試みも出来る。原告論文の数式モデルの代わりに、この「豆まきデータ」を楕円関数にフィットさせることを学生に課題として与えたら、100人が100人とも、たとえ異なった解析ソフトを使っても「豆まきデータ」にベストフィットする同じ楕円関数を導くことであろう。さて、原告論文の関数、そしてここで導かれた楕円関数をそれぞれ生「豆まきデータ」と比べてどちらのほうがもっともらしいフィッティング曲線となることだろう。こいうお遊びが出来るのも「豆まきデータ」を使うからこそであって、実験が正しくてデータ精密度が高いと自ずから楕円曲線の可能性は否定されてしまう筈ある。

私はすでに「論文不正あった」解雇認める=筑波大元教授敗訴で思うことで次のように述べている。

私は当初、このような杜撰なデータをなぜPhysical Review Lettersの査読者が見逃したのかが不審であったが、この論文そのものを目にして謎が解けた。査読者が生の「豆まきデータ」を目にはしていなかったのである。筑波大学が公開した資料2説明資料にのみに「豆まきデータ」から論文に掲載された図が導かれる経緯が出ていたのである。これでは査読者が不審を抱きようがない。

実はこの記事を書くに先立って、④の報道特集の映像がYoutubeで公開されていることを知ったのでそれを見てみた。長さんの言い分を全面に後押しせんばかりの一方的な報道姿勢で、科学のゆがめられたワイドショー化の現状がよく分かる映像である。そのなかで長さんを支持する世界の名だたる?核融合研究者の長さんに好意的なコメントばかりが紹介されていたが、私ならその一人ひとりに「豆まきデータ」を直接示して、あなたならこのデータをどのように扱いますか、と問いただす。彼らがほんとうに世界の名だたる核融合研究者であるなら、言葉を詰まらせるはずだ。

実験データから学ぶのではなく、すでに頭に描いている数式モデルをデータに当てはめる。このような場合もあることを完全に否定はしないが、私はそこまで自然に対して傲慢ではない。あの乱雑な「豆まきデータ」でエイ・ヤーッと一刀両断、あらかじめ頭に描いている数式モデルのパラメーターを決めてしまうのは見方によれば極めて剛胆である。それに引き替え、同じ測定を繰り返しデータを積算してその精密度を上げるべきだという私の意見は重箱の隅をほじくっているように見えるだろう。しかし生データとそれぞれのフィッティング曲線との適合度を比較すると、精密度の高いデータを使ったものほどより優れた適合度を与えることになり、それだけ説得力に重みが増す。

実験データそのものに多くを語らせることが出来ると、『データからこのような数式モデルが導かれてそのパラメータはかくかくしかじかである』と言うことが出来る。しかし一方、『得られたデータがこの数式モデルで表されると仮定してそのパラメータを求めるとかくかくしかじかになった』と言うので満足するのであれば、「豆まきデータ」を用いて、そのようにすればよいのである。要するに「仮定」で満足出来るかいなかで解析データに対する要求度が大きく異なるのである。ただ科学者は「仮定」を実証するのが仕事である。後者の例のように、「仮定」が前提となっているのに、あたかもそれを実証したかのように振る舞うとこれは人を欺くことになる。実験データいかんに関わらず、あらかじめ頭の中にある数式モデルをデータ解析に持ち出すことは、その時点で後者の道を歩み始めたことになる。その意味で「豆まきデータ」にどう立ち向かうかが自ずと科学者としての姿勢を示すことになる。そのことを考えさせたこと一つで、この報道番組は無駄ではなかった。