![](https://blogimg.goo.ne.jp/user_image/19/7b/64140e8f52f2811c3ad76ccb1b5d6658.jpg)
(陶芸の里あすかのHPより引用。)
壺があって、その中に赤い豆1,000粒と白い豆1,000粒が混ざって入っていると想像してください。
目隠しをしてその壺から豆を10粒取り出すとします。(これを1トライと呼ぶことにします。)取り出した10粒の豆は、赤と白がほぼ半々になるでしょう。しかし、全部赤い豆だったり、全部白い豆だったりすることもまれにあります。むろん、赤い豆が1粒で残りの9粒が白い豆のこともあります。
このトライを100回くらい行うと、全部赤い豆や白い豆という例はきわめて少なく、5:5とか4:6ということが圧倒的に多いでしょう。そのときに、壺の中には赤い豆と白い豆が同じ数はいっていると言いきってよいかという問題が生まれます。
200トライくらい行えば、5粒と5粒というケースが一番多いヒストグラムが出来上がります。200トライのまとまりをさらに20回行うとします。
そうすると「壺の中には赤白が(ほぼ)同数入っている」という主張が20回できます。この20回の主張のうち、1回くらいは間違っていてもよいと制限をゆるくすると、「壺の中には赤白が(ほぼ)同数入っている」という主張は有意水準(危険値)を5%と見込むなら、言ってもよいということになります。
しかしながら、有意水準を1%ときつくすると、まだまだトライの数が足りません。
実は抗うつ剤SSRIの薬効調査で、プラセボーより効くという調査結果はすべて有意水準5%で行われています。1%ととするとほとんどの調査でプラセボーとの有意差がなくなってしまいます。
さらに、有意水準5%で統計をとってもプラセボーとの有意差が見いだせられなかった調査は、そもそも発表さえされません。これを出版(公表)バイアスといい、現在問題になっていることは、2014-05-16 に述べたとおりです。そのページから「すべての治験を登録して公表せよ」というTEDの動画が見られますが、ここに再録します。(All Trials Registered...)。日本語字幕がついていて、たいへん分かりやすいので、ぜひご覧ください。
(私は統計学者ではないので、上の説明は数学的に不完全かもしれません。でも、概念的にお分かりいただければOKです。)