![](https://blogimg.goo.ne.jp/user_image/6e/13/49f7b4ac0b84eabf407b4d94302e7207.png)
(田辺三菱製薬のHPより引用。)
今日の話は少しこんがらがりやすいかも知れません。でも、ちょっと頭をひねってください。
ある個人にとって、Aという薬がどれくらいよく効くかは、とてもよく効く→まあ効く→効かないといった100点から0点までのグラデーションをつけることができるでしょう。それによって薬効がどの程度測定できるのか?というのが今日のテーマです。
上のグラフは、実薬とプラセボーで効き方が日数によってどう変化するかを示したものです。実薬群もプラセボー群も日が経つにつれて効くようになります。2本の線が右肩下がりなのがそれを表します。
ところが、この曲線は各群の効いた効かないという程度を、各群の「平均点や合計点で表したもの」です。つまり、個人にどう効いたかではなく、群としてどうだっだかということが測定されています。
ここでは簡単のために「効いた・効かなかった」の二値で評価する場合を考えましょう。そのようにして効果を測定すると、必ず集団を対象としなくてはならなくなります。つまり、100人いたら何人に効いたか効かなかったかという値が必要になります。
ここで問題となるのは、ひとりの「個人での薬効の現れ方」が、「集団で測った時の現れ方」で代用できるという(根拠のない)テーゼが正しいと前提してよいのだろうかということです。
言い換えれば次のようなことです。個人でも薬効が100%現れる人と0%の人が存在するはずです。その中間にいろんなレベルの人がいるでしょう。100人の人に投与した場合、60人の人に有効だったとして、この60%という数字から、「個人においても60%くらいの効き目がある」と推論してしまってよいのでしょうか?
つまり、一番初めに効く・効かないの二値で測定したのに、個人に対して60%の効果があるという結論を主張しうるでしょうか?ということです。
今回、話が小難しくてすいません。結論してよい・いけない・それは定義次第と言った回答が考えられますが、明快にお答えが出せる方、ご教示ください。
※今日、気にとまった短歌
知る者のこの世にゐない校長の胸像部屋の隅に置かれぬ 『青昏抄』・楠誓英
つまり、色の濃さに程度の違いがある事象を(コインの裏表のように)二値問題で考えてはいけないということですか?
記事の問題の場合、危険値(p)は一応無視しているのですが、無視できないという意味ですか?
この他によく目にするのが統計計算の信頼度を示す危険値(p)の大小を実験対象の結果の差の大きさと勘違いしている人がいます。