
前回「その4」では、”パスカルの賭け”を中心に述べましたが、39歳という短い生涯を”パスカルの原理”に基づくランダムネスの確率の計算に捧げただけでなく、確率論の中核をなす期待値の概念である”勝ち点問題”にも大きな影響を及ぼしました。
例えば、ワールドシリーズの7試合制での勝敗の不公平さや、少人数での閣議決定による誤謬と矛盾は、期待値(=勝ち点問題)で説明できる。それだけでもパスカルの先見の明の偉大さを理解出来る。
また、パスカルの研究を更に発展させた18世紀初頭の天才数学者ヤコブ・ベルヌーイは「大数の法則」を発見し、確率論上でも大きな業績を残したが、これは試行回数を増やす程に理論上の確率に近づく事を意味する。
一方で、自然界に蓄積され得る数字はランダムではなく低い数字に偏る事が「ベンフォードの法則」により証明されている。
前者は株価予測や価格決定、スポーツ選手の成績評価などに用いられ、後者は犯罪捜査や日常周りの様々な分野に応用されている。
事実、世の中には思わぬ所に思わぬ法則が隠れ、それが社会にも役立つ。また、自然界に現わる事象は多様性があり、ランダムに行われてる様で、実は何らかのルールに基づいてる事の方が多い。つまり、ランダムネスの科学とは、偶然の神秘を可視化するもので、未来を予見する重要な道標となっているのだ。
そこで今日は、ベルヌーイの「大数の法則」と「小数の法則」との比較を中心に纏めたいと思います。
ジャガーの観察と潜在的確率への挑戦
ランダムの世界ではAIが弾き出す乱数がよく用いられるが、疑問に思うのは、その乱数とは完全なのか?それとも不完全なのか?である。
因みに「モンテカルロ法」とは、ある不確実な事象において起こりうる結果を予測する数学的技法で、ランダム法や多重確率シミュレーションとも呼ばれる(上図参照)。
元々、中性子のランダムな運動を研究してたS・ウラムによって考案され、不確実な状況下での意思決定を改善する為に、第2次世界大戦中にV・ノイマンが命名した。
こうしたランダムな現象を確率モデルとして計算する時、コンピュータで乱数を発生させ、シミュレーションを繰り返す方法を言う。
具体的に言えば、サンプリングとそれに基づく計算(割合・平均・分散など)を数万回も試行すると、ある種の方程式の解は一定の値に収束(「大数の法則」)し、近似解を得られる。
事実、コインの表と裏が出る確率は1/2だが、実際のその確率が正しいかを求める為に、コンピューターを使い、コイン投げ(0又は1をランダムに発生させる)を数万回以上行う。その結果を集計すれば、回数を増やすほど表の出る確率が1/2に限りなく近づく事が分かる。
現在こうした手法は、株価・売上予測・プロジェクト管理・価格設定など、実際に実験が難しい現実のリスク算出などで使われ、ルーレットと同様に偶然の要素が中核となる事から、”モンテカルロ”と名付けられた。
では、1〜36と0の37通りの目がある(ヨーロッパ式)ルーレットでは同じ事が言えるのか?(アメリカ式では更に00が加わるから38通り)つまり、モンテカルロのルーレットは完璧なランダムさ(=乱数)を発生できるのか?
1873年、製麺工場の熟練工であったJ・ジャガーは6台あるルーレット1つ1つに1人ずつ12時間の見張りをつけ、ルーレット台が完全ではない事に賭けた。事実、5台は傾向的な歪みは見いだせなかったが、残り1台は他の5台よりも歪みが顕著な事を彼は見抜いた。
その7日後、カジノへと向い、7,8,9,17,18,19,22,28,29という9つの数字に大量に賭け始めるが、その日だけで7万ドルを稼ぎ、4日目までには30万ドルを稼ぐ。だが、5日目以降は負け始め、所持金の半分を失った時、彼は再び6つの台を鋭く観察した。
確かに、勝ってる時の台には小さな傷があったが、今はその傷がない。つまり、カジノ側は毎晩の様に彼が賭ける台を入れ替えていたのだ。だが、ジャガーはそれを見抜き、再び勝ち始める。
再びカジノ側が戦略を変え、毎晩毎にルーレット盤の数字表をぐるりと周し、毎日出易い数字が変わる様にした。こうなると彼にはその数字が読めなく、負け始めた事もあり、賭けるのを辞めた。結果、彼には32万5千ドル(今の500万ドル)が残り、仕事もギャンブルも辞めて、その金を不動産に投資した。
こうした一連のジャガーの策略は、一見だが的確だった様にも見える。だが、完璧なルーレットでも正確に正しい頻度で0,1,2,3,…,36と出る訳でもない。つまり、平均より出る数字もあり、そうでない数字もある。
彼は幾つかの数字が出る頻度が高い事を観察したが、偶然の産物だったかも知れないし、高い確率を示唆するものではなかったかも知れない。これは、一連の潜在的な確率を前提にすれば、あるシステムに対する観察結果は、それら潜在的確率とどれ程一致するのだろう?
この数学的な問いを科学革命、微分積分の発明の中にその答えが見いだせるとしたら?話は大きく変わってくる。
補足
因みに、ルーレットでどの数字にボールを落とすかを、カジノ側はコントロールできるのか?という質問がよくなされるが、答えは”不可能だ”という。
まず、そんな面倒な手間をしなくても、ルーレット全部の賭け目に対するカジノ側の控除率は5.3%(1/38)ある(ユーロスタイルは2.7%=1/37)ので、オッズだけで儲けが出る。故に、ルーレットの期待値はカジノ側が有利に設定されてるが、今では様々なベッドシステムが存在するが、賭け金が膨らみ、プレーヤーの損失が大きくなる危険性も指摘されている。
また、回転盤のバンク部の突起物にボールが当たり、挙動が予測できない程不安定になるので、伝説のディーラーがいるとしても、その確率は良くて1/38程らしい。
仮に、ディーラーが意図的に出目を狙えるとしても、客と共謀して簡単に不正ができる為にカジノ側は雇わないし、その様なインチキな回転盤は採用しない。一方で、特定の出目を外すコントロールは実現性があり、実際にその様なディーラーが存在してたという噂もある。
従って、カジノ側は完全な乱数においても損をしない仕組みになってるし、不正なディーラーや細工された回転盤を使い、信用度を下げる様なヘボな事は行わないのである。
つまり、1870年代のカジノだったから、ジャガーの様な伝説の賭け師を生まれたのだろう。
ベルヌーイの”推測”と「黄金定理」
ヤコブ・ベルヌーイ(1655-1705)は17〜18世紀にかけて数学と物理学に大きな業績を残したベルヌーイ家(弟はヨハン、甥はダニエル)の長で、最も秀でた人物であった。彼はライプニッツの微積分学を研究し、積分という語を初めて用いたが、最大の業績は確率の基本原理(大数の法則、ベルヌーイ試行)を作り上げた事にある。
1680年、大彗星が地球の近くを大接近した時、ニュートンはその7年後に人類史上初めて、”ケプラーの法則”を用い、この彗星の軌道を計算した。が当時、若き神学者のヤコブはニュートンよりも6年前に”彗星の軌道が幾つかの基本法則に従う”と主張した。もし彼の理論が完璧であったら万有引力はヤコブの偉業になってたであろう。つまり、ニュートンの偉業は偶々運が良かっただけという事になる。
以来彼は、教会よりも数学に専念する事になるが、特にホイヘンスの”偶然のゲーム”に大きく触発され、合理的意思決定をするには確率を決定する数学的手法が必要だと考えた。
彼は(前述の)ジャガーがやった様に、観察により確率を識別すべきであるとし、”潜在的確率が実際の結果にどれだけ反映されるか?”に答えを見出す。
つまり、”試行回数を大きくする程に観察される相対頻度は正しい潜在的確率を示すだろう”との「大数の法則」を提案した。更に、その概念を論述して定量化し、確率に微積分の重要性を説いた最初の人物でもある。
当時の微積分に関しては、ニュートン=ライプニッツ論争が激化した頃だったが、ヤコブは数列と級数(数列の合計)と極限を使って、微積分の本質を解き明かした。
そこで彼は、”試行回数を極限にまで大きくした時、正しい潜在的確率に限りなく近づく”と考えた。事実、それを実験で証明したのは、1940年代のカーリヒ(独)という数学者で、コインを100回投げた時点でオモテの確率は44%だが、1万回では50,67%にまで達した。だが、この現象を約2世紀も前に定量化したヤコブの偉業には頭が下がるばかりである。
つまり、ヤコブの20年間にも及ぶ研究により、潜在的な確率が数学史上初めて完全な形で姿を表したのだが、彼はこの法則を「黄金定理」と名付けた。但し、現在では「大数の弱法則」とも呼ばれる。
そこで彼は、瓶に3千個の白い石と2千個の黒い石を入れ、ランダムに石を抜き取っ手は返すという行為を繰り返し、白い石が抜き取られる比率が60%に近づくのは、どんな確率で期待できるか?を1つ1つ調べ上げた。
これは、1つの試行に、白又は黒という2つの数学的結果(確率空間)が存在し、数学的処理が使えるが、各試行が独立してる事が必要で、”ベルヌーイ試行”や”ベルヌーイ過程”と呼ばれる。つまり、AかBかに投票するとか、買うか買わないか、死ぬか生きるか、という様な2つの互いに排他的結果を有する行動や意思決定もベルヌーイ施行の例となる。
更に言えば、白い石を59~61%の確率で取り出すには最低でも何回の試行が必要か?なども「黄金定理」が扱う問題となる。故に、60%という潜在的比率に近づく誤差の許容範囲と
不確かさの許容範囲の2つを指定する必要がある。
一方、「黄金定理」は2つの誤差の許容範囲を厳しくしても、十分に試行を増やせば、上の確率が60%に近づく事を保証するし、それら条件が与えられれば、十分な試行回数を求める式も与えてくれる。
但し、ヤコブの誤差の基準が厳しすぎて、彼が編み出した式では、多くのケースにて実用的な数字は割り出せなかった。
例えば、バーゼル市の有権者の60%が市長を支持してるとすると、何人を調べれば、その結果が58~62%(その精度が±2%)の範囲にある確率が99.9%になるのだろうか?
その答えは25550人となるが、これはヤコブが生きてた頃のバーゼル市の人口とほぼ同じで、現実的ではない。この様に、彼の評価が最適でなかった原因として、彼の証明が様々な推量に基づいてた事と、もう1つは、確かさの基準として99.9%を選んだ事にある。つまり、(±2%以上の誤差を持つ)間違った答えを得る確率が0,1%になる様にしたが、それが厳しすぎたのだ。
ヤコブはこれを”強い確信”と呼び、確かさの程度としたが、今日ではこの”強い確信”を破棄し、答えが間違ってる確率を1/20(=5%)以下とした”統計学的有意性”を使う様にしている。従って、現在の統計学では僅か370人(人口の1.45%)を調査するだけで、±5%の精度で統計学的に有意な結果を達成できるし、仮に1000人(同3.9%)調べれば、正しい結果からのズレが±2%内に収まる確率が90%になる。
因みに、「大数の法則」を式で表すと、εを十分に小さい数、確率分布の平均をμ、実際に観察されたn個の値の平均をavg(Xₙ)とすると、avg(Xₙ)=(X₁+…+Xₙ)/n、P(|avg(Xₙ)−μ|<ε)→1(n→∞の時)とシンプルな形となる。
これは、確率分布の平均μから観測の平均値avg(Xₙ)がズレる確率(誤差が十分に小さくなる確率)を求めるもので、n→∞となる時は確率1、即ち100%の確率で収まる事を意味する。
故に、ベルヌーイの「大数の法則」は、試行回数が十分であれば母集団の潜在的構成をほぼ正確に反映する事を明らかにし、今日でも統計学の基本中の基本とされる。
小数の法則とは?
一方で、試行回数が少なくなると、データから得られた結果が妥当なのか?単なる運によるものか?が判断できなくなる。
つまり、少量のサンプルが潜在的確率を正確に反映するという誤解や誤った直感があまりにも広く行き渡ってた事から、心理学者のトベルスキーとカーネマンは、”大数の法則”を捩って「少数の法則」を提唱した。
上の例で、市の住民5人だけ調査したとすると、前回「その4」の”パスカルの原理”で見た様に、サンプルの60%(即ち3人)が市長を支持する確率は約1/3(=10/32)しかない。一方、0人,1人,2人,4人,5人が市長を支持する確率は1/3よりも低いから、逆にミスリードする確率は、約2/3(=22/32)に跳ね上がる。また、5人全員が市長を支持するか?しないか?のどちらかに偏る確率は、約10%=(2/32)×(60%/40%)となる。
従って、5人のサンプルの統計を無分別に鵜呑みにすれば、市長の人気を過大評価するか過小評価するかのどちらかになる。
これを判り易く言えば、10回だけコインを投げ、表が8回、裏が2回出ただけで”このコインは表が出易い”と誤解する様なものだ。
これは、一時の成功や失敗だけで彼らの過去や仕事ぶりを過大(過小)評価するのと同じ過ちを犯してる事になる。
そこで、フォーチュン誌載の上位500社のCEOに例を取る。各CEOは各年ある成功確率を有すると仮定し、成功年が60%の確率で起きるとすると、ある5年間に1人のCEOが正確に”合計3年間は成功する”事を意味するのか?
答えから言えば、意味しない。
”パスカルの原理”の例で見た様に、全CEOが60%の成功率を有するとしても、ある5年間でその潜在的比率を反映する確率は僅か1/3である。つまり、過去5年間に333人のCEOの仕事ぶりは彼らの真の能力を反映しない。更に、偶然だけで5年連続で成功したり失敗したりするCEOが1/10の50人はいる事になる。
これは、スコア(結果)よりも能力を分析して人を判断した方がよリ信頼できる事を意味する。或いは、ベルヌーイが言った”結果だけで賞賛すべきではない”とは格言である。
つまり、結果論ならバカでも言えるが、人間の真の能力を評価するには、自信・思慮・的確な判断に加え、気概が必要となるのだ。
こうした「小数の法則」による誤解を説明する言葉に”ギャンブラーの誤謬”があるが、これは、ある出来事の見込み率はその出来事の最近の発生率によリ上下するとの考え方だ。
例えば、”運が尽きた”とか”もうそろそろだろう”という言葉にはこうした誤謬が潜んでいる。つまり、上り調子が悪運をもたらす訳でもないし、悪運続きだから幸運が控えてる訳でもない。
確かに、多くの人は無意識の内に”悪い事があればいい事もある”と期待し、”いい事があれば悪い事もある”と不安を抱く。事実、我々の日常は偶然が支配し、スロットマシンもAIが完全な乱数を発生させる。が故に、”ギャンブラーの誤謬”は大衆にとっても救い難い幻想と言える。
因みに、ヤコブ・ベルヌーイが著した「推測法」には”黄金定理”に関する内容が記されている。彼以前のガリレオ、パスカル、ホイヘンス、ニュートンなどの研究では、確率論のアイデアは僅かに触れるに過ぎず、ヤコブの研究は徹底的に確率論を取り扱った初めてのものだ。
この書物は4編から成り、第1編ではホイヘンスにより提起された問題を再述し、第2編には確率を算定するのに用いた順列と組合せに関する広汎な論議を、第3編には賭け事やゲームにその確率論を使った場合を書いた。そして、第4編は微積分の理論を使って確率論を応用しようと試みた最も大切な部分だったが、未完に終わる。
実は、ヤコブが50歳で他界する前に、弟のヨハンに原稿の完成を頼んだが、忙しい事を理由に断った。そう、このヨハンこそ実在した数学者の中で最も不愉快な男とされ、兄ヨハンだけでなく息子のダニエルとも卑しく争ってたのだ。そこで、ヤコブの甥である若きニコラウスが原稿を引継ぎ、ライプニッツの反対を受けながらも、彼の死後8年が経った1713年に「推測法」との題名で出版された。
かなり長くなったので、今日はここまでにします。次回は、第6章の「ベイズ理論」を中心に述べたいと思います。
確率は母体の99.9%を調べる必要があるし
その精度を±5%にまで広げれば、母体の3.9%だけを調べればいいとなる。
これは±5%の精度、つまり95%前後の的中率を指すんだけど、正しい結果からのズレが±2%内に収まる確率が90%になる事を統計学的有意性と呼ぶ所に、奇妙な当選確実のトリックがある。
精度の誤差でした。
普段は聞き慣れない言葉ですが、理論上の仮説と実際の観察結果の差が(偶然による誤差ではなく)何か意味が有る事で、仮説からのズレが統計学的に有意であると言います。
これは、統計で弾き出したデータが”偶然によるものではない可能性が高い”事を指しますから、その精度の誤差が±5%以内であれば、その仮説は信頼に値する事を意味します。
故に、理論による仮説が信頼できるのか(根拠があるのか)を判断する重要な指標とも言えますね。
選挙当確のカラクリについては、別途記事にしたいと思います。