
前回「その3」では、パスカルの”勝ち点問題”を中心に述べました。
そこで、前回までのおさらいを大まかにしますが、今日の統計学には欠かせない”標本空間”の考え方は、生まれつき根っからのギャンブラーであり、現役の医者で天才数学者でもあるカルダーノによってもたらされた。また、ガリレオは「サイコロゲームの考察」で”確率の事象”を詳細に分析したが、ランダムネスの研究には届かなかった。
その後、パスカルとフェルマーはサイコロ賭博をテーマに書簡をやりとりし、確率論の基礎となる”期待値・推定・検定・標本理論”などが発展していく。
特にパスカルは、そのランダムネスの確率の計算について、そのアイデアとなる”パスカルの原理”と期待値の概念である”勝ち点問題”の2つに、39歳という短い生涯の多くを捧げた。
例えば、ワールドシリーズの7試合制での勝敗の不公平さや、少人数での閣議決定による誤謬と矛盾は、期待値(=勝ち点問題)で説明できる。それだけでもパスカルの先見の明の偉大さを理解出来よう。
そこで今日は、パスカルからベルヌーイに受け継がれた、ランダムさの確率の研究について述べたいと思います。
期待値と”パスカルの賭け”
「パスカルの賭け」とは、パスカルがトランス状態に入った晩年の時に記した言葉で、”理性により神の実在を信じないとしても、神が実在する事に賭けても失うものは何もないし、むしろ生きる事の意味が増す”という考え方だ。
つまり、神が存在して神を信じれば、敬虔な人は無限の幸福が約束される。一方、神が存在しなくとも(敬虔という)損失はたかが知れてるし、また、神が存在しても神を信じなければ、その利益もたかが知れてる。つまり、利益で言えばたかだか”有限”となる
パスカルは”これら可能な利益と損失を評価するには、期待される報酬(=期待値)を弾き出す事にある”と諭した。
事実、神が存在する確率をpとし、神が存在する時の利益を敬虔な人が∞で、そうでない人がE1、一方で神が存在しない時の利益を同様にE2,E3とすれば、期待値の比較では、p×E1+(1−p)×E3<p×∞+(1−p)×E2=∞と、神を信じる事の期待値は無限となる(上図参照)。故に、”合理的人間は神の法則に従うべきだ”と、パスカル結論づけた(「眠れぬ夜の確率論」より)。
因みに、”信仰の期待値はその価値と無限に小さい確率の積なのでパスカルの議論は成立しない”と、1世紀を隔ててラプラスは批判したが、これは信仰と信仰を信じる事を混同した結果であり、パスカルも”理性では何も判断できない”と語っている。つまり、「パスカルの賭け」の重要性は”神を信じるか否か”という信仰上の問題を確率と期待値に置き換えた事にある。
一方で、人生の悩ましさは選択の困難さにある。だが、確率と期待値というレンズを用いる事で、あらゆる選択肢(可能性)を1つの状態(像)と見る事が出来るかもしれない。それこそがパスカルの着眼点だったのだ。
こうした期待値は、ギャンブルだけでなく、あらゆる意思決定にて重要な概念である。事実”パスカルの賭け”は、しばしゲーム理論、つまり”ゲームにおける最適な決定戦略の定量的研究”という数学分野の基盤とみなされている。
確かに、1回200円のパーキングメーターも20回に1度は遅く戻ってきて、400円の切符が貼られたりもする。つまり、1/20の確率で400円に跳ね上がるから、期待値で言えばだが、実際の費用は220円になる。
更に、我が家の前の私道は無料だが、5年ほど住んでて、車庫入れする時に3回は車をぶつけている。修理代を1度に4万円とすれば、2400回程は私道を利用するから、料金所をおき、車庫入れの際には50円を入れ、保険代わりにすればいい。
期待値と宝くじの関係で言えば、興味深い事が判る。ある”掛け金無料”の宝くじでは”勝者酢取り”で500万ドルという高額賞金を提示した。申し込み回数に制限はなかったが、別々に手紙を出す必要があった。
スポンサーは2億通ほどの申込みを期待してたが、勝つ確率(=1/2億)に500万ドルを掛けると、各申込みの期待値は1/40ドルで2.5セントに過ぎないし、手紙の送料に比べても遥かに安い。事実、この無料の宝くじで大儲けしたのは、8000万ドルを稼いだ郵便局だと言うから、笑いが止まらない。
もう1つの例は、宝くじが殺人ゲームになるという話題だ。例えば、1人は大金を手にし、1人は暴力的方法で死刑になる。こんなゲームが存在するのだろうか?実は”州の宝くじ”と呼ばれるのがそれである。
事実、1人の幸運な人間が大金を当てる一方、数百万という他の競合者が宝くじを買う為に州の各地に散在する発券所に向かう途中で事故で死んでるのだ。こうした不慮の事故の確率は1回の宝くじで凡そ1人が死ぬという計算らしい。つまり、”死のゲーム”は実在する。
宝くじを買い集め、利益を上げる
州政府が運営する宝くじだが、彼らは数学的期待値に精通している。事実、購入される宝くじ券1枚辺りの期待値(賞金総額/券の総枚数)は、その券1枚の価格よりも低く設定されてるが、これこそが州の金庫が潤う仕組みである。
だが投資家の中に、その仕組みを破るキレ者が現れた。それは、1〜44の中から6つの数字を任意に選ぶ宝くじだが、パスカルの三角形を使えば、44の数字から6つの数を選ぶ方法は全部で(₄₄C₆=)7059052通りある事が判る。
因みに、この宝くじの賞金総額は2791万8561ドルで、投資家らは、もし7059052通りの組合せの数字を持つ宝くじを全て買えば”それらの価値は賞金総額に等しくなる”と考えた。この場合、宝くじ1枚当りの価値は賞金総額を組合せの総数で割り、約3.95ドルになる。
一方、ヴァージニア州はこの事を知ってか知らぬか、宝くじを1枚1ドルで売ってたのだ。これに対し、オーストラリアの投資家らは2500人の個人投資家が1人当り平均3000ドルを出す意志がある事を確認し、計画が上手く行けば、この投資による利益は約1万800ドルと計算した。
但し、この計画に幾つかのリスクがある。1つには2人以上の当選者が出た場合、賞金を分ける必要がある。これまで、この宝くじは170回行われ、(1等=2700万ドルに間しては)未当選が120回、当選者1人が40回、当選者が2人は僅かに10回だった。
つまり、彼らが1等賞金を独り占めにする確率は120/170で、賞金が半々になる確率は40/170で、賞金が1/3になる確率は10/170だ。そこで彼らは”パスカルの原理”を使い、期待される儲け(期待値)を以下の様に再計算した。
求める期待値は、(120/170)×$2700万+(40/170)×$1350万+(10/170)×$900万=$2277万となる。これを7059052枚で割れば、宝くじ1枚当り3.22ドルとなり、1ドルの出費で3倍以上の利益が出る事になる。但し、賞金総額となると、3,31ドルと計算でき、少しは大きくなる。
但し、別のリスクもあった。それは、必要な全ての宝くじを買い終える事が出来るのか?つまり、購入に際しての兵站上の悪夢がよぎる。投資家らは慎重に事を進め、あらゆる手を尽くし、その計画は販売締切り72時間前に動き出した。が結局、彼らが購入できたのは、7059052枚のうち500万枚に過ぎなかった。
その後、当選番号が発表され、投資家グループは目出度く1等に当選したが、当りくじを見つけ出すのに時間が掛かり、しばらくは名乗りを挙げなかった。その間に、州の宝くじ担当者らは投資家が行った計画を知り、賞金の支払いを躊躇ったが、1ヶ月の法定論争の後、賞金は無事に支払われた。
結局、500万枚の宝くじで、1等の2700万ドルを手にした訳だが、そこまでの労力や経費(裁判費含む)を考えても、最低でも500万ドルの元手が掛かった。つまり、2700万ドルの大成功を収めるには、500万ドルの資金とパスカルの原理と期待値の計算が必要だった事も理解できる。勿論、これを1人で行うと思えば、天文学的な労力が必要であろう。
「大数の法則」とベルヌーイ
パスカルは、ランダムネスの研究に、その計算についてのアイデア(パスカルの原理)と期待値(勝ち点問題)の2つの概念を捧げた。僅か39歳という短い生涯だったが、パスカルが生み出した確率論は未だに生き続け、今や大きな花を咲かせようとしている。
前回「その3」でも述べた様に、パスカルとフェルマーの往復書簡により、未来・将来の事が数学の対象となっていく。手紙には他にも、農民が収穫した穀物の価格変動リスクを避ける方法についても述べられ、これがきっかけとなり、100年後のヨーロッパの金融界では正確な生命票が算出される様になる。
また、パスカルの確率論を元に、英国の商人は遠洋航海用の船に保険をかけ、お陰で彼らはリスクを取る事なく、新しい世界と土地を求めて、大きな旅をする事を可能にした。この事は、ロンドンが世界で最も繁栄する都市になった理由の1つにもなった事は記憶すべきであろう。
この様に、確率論は趣味や稼ぎの為のギャンブルの理論ではなくなり、将来起こる事を高い確率で予測できる学問として発展していく。これにより、人々は毎日の生活や仕事で、より高い確実性を持って色々な判断が下せる様になったのは言うまでもない。
一方、パスカルの研究を更に発展させたのが、18世紀初頭の数学者ベルヌーイ(スイス)で、彼は今で言う「大数の法則」を発見し、確率論の上でも大きな業績を残した。「大数の法則」とは”計算可能な確率論においては試行回数を増やせば増やすほど結果は予め計算された確率に近づく”との法則だ。
つまり、”トライする回数を増やす程に理論上の確率に近づく”事を意味する。例えば、コインやサイコロを投げれば投げるほど、1/2や1/6に近く。故に、コインを10回投げて表が出る確率を70%にする事は出来るかもだが、逆に、コインを1万回投げて70%にする事は事実上不可能である。
こうした「大数の法則」は現代の様々なアルゴリズムに取り入れられ、株式トレードでは目標の勝率に近づける為に短期間の間に何千回も取引を行う。また、プロ野球では選手の打率や防御率を分析するのにも大数の法則を使うが、短期的な好不調に囚われない為である。
一方で、医師は(積み重ねた経験や知識ではなく)確率論に基づき、平均的な事例をベースに診察を行う。これも単純な誤診や初歩的なミスを防ぐ為である。例えば、”70%は効果的だが、1%の確率で深刻な副作用を及ぼす事がある”と言う時は”30%は注意をする必要がある”と思った方がいい。
こうした一見単純でシンプルな「大数の法則」の理論は、一見ランダムで複雑に見える事象の中から本質を見つけ出す為に、様々なアルゴリズムと活用する事で、大いなる飛躍が期待されている。
一方、カルダーノもガリレオもパスカルも、問題を関係する確率は”既視”と仮定した。
例えば、彼らがサイコロを何度も何度も投げ、出る目の頻度をベルヌーイの様に詳しく分析してれば、僅かな分布差がある事に気づいたかもしれない。つまり、ランダムさの初期の研究を現実の世界で適用するには、潜在的確率と観察結果との関係を説明する必要があった。
”1/6の確率で2が出る”という時、実際にはどういう事だろうか?仮に、何度も好きなだけサイコロを振れば6度に1度は必ず2が出るという意味でないとすれば、確率が1/6とは何を根拠に言えるのか?
先の”70%は効果的だが、1%の確率で深刻な副作用を及ぼす事がある”とは、具体的にはどんな意味なのか?”有権者の36%の支持を得ている”とは何を意味するのか?
これこそが、ランダムネスという数学者が好む概念へ向かう難解な問いなのである。
「ベンフォードの法則」と対数の規則性
宗教に凝り固まった某統計学者は”真の乱数など存在しないし、ランダムさを存在させられるのは神しかいない”と、ランダムネスの科学を否定する。
”サイコロ投げも所詮は人為的な行為だから、必ず欠陥がある。なぜなら人間には完全へ至る道はないからだ”と・・・
多分そうかも知れない。だが真にランダムな出来事は、量子論の様に原子レベルで起きている。つまり、自然界にはランダムな世界が存在するのだ。
今日、最先端のジェネレーターを使えば、完全な量子サイコロから”真の乱数”を作り出す事が可能だが、昔は完全な乱数を作り出す事は実態のない目標でもあった。
しかし、1920年、NYの犯罪シンジケートで最も創造的な乱数マシンが誕生する。というのも、財務省は違法な宝くじの為に毎日5桁の乱数を作る事が必要だった事から、ギャングたちはその対抗策として連邦政府の財政収支の最後の5桁を使って裏を搔いた。
但し、財務省が操る宝くじは刑法だけでなく、科学的法則にも違反していた。というのも「ベンフォードの法則」によれば、自然界に蓄積され得る数字はランダムではなく低い数字に偏るからだ。
実は、この法則は(ベンフォードではなく)天文学者のサイモン・ニューカム(米)が1881年に発見したものだ。当時彼は天文学の計算をする為の対数表に、1で始まる数値を記する最初の方のページが他のページよりもずっと擦り切れてる事に気付き、3,4,5,…と数字が大きくなるにつれ、汚れや掠れが少なくなり、最終的に9から始まる数字に関する頁はまっ更に近い事に気付いた。
つまり、こうした観測結果により、対数表の汚れや掠れがそのまま数字の出現頻度を表す事を発見し、ニューカムは最初の桁の数値をNとし、その出現確率をlog(N+1)−log(N)=log(1+1/N)とする法則を提案する。
因みに、この法則は物理学者フランク・ベンフォードにより、1938年に再発見されたが、その証明は1996年に、数学者のテッド・ヒルの研究からこの法則が証明された。
この法則によれば、1〜9は等しい頻度で現れるではなく、最初の桁が1である確率は約30%にも達し、2は約18%、3は約13%、…となり、大きな数ほど最初に現れる確率は小さく、9になると最初の桁に現れる確率は5%に満たなくなる。
この直感に反する様な法則だが、自然界での測定結果はしばし対数的に分布し、対数的な測定結果はあらゆる場所に存在する事が判っている。特に、財務データはこの法則に従い、詐欺の捜査でも大量の金銭データを調べる際にも大きな威力を発揮する。
その有名なケースでは、K・ローレンス事件がある。若い起業家であった彼は投資家から9100万ドルを奪い、その大半を贅沢品に使った。一方で新規ビジネスに必要な経費を水増しする為に、多数の口座を作り、複雑多岐に渡るペーパーカンパニーを潜らせ、資金洗浄を促し、急成長ビジネスを装った。
しかし、D・ドレルという数学に強い会計士が、7万件以上に及ぶ様々な種類の小切手や電信送金の番号の一覧を作り、それらの数字の分布をベンフォードの法則と比較した所、多くの不一致が見られ、ザギ行為がバレてしまう。また、国税局も税の誤魔化しを防ぐ為の方法としてベンフォードの法則を研究していたから、捜査はすんなりと運んだのだろう。
最後に
因みに、数字の最初の3桁が"314"で始まる確率は、log₁₀(1+1/314)となるが、同様にして数値中のある特定の桁にある数値が現れる確率を求める事ができる。例えば、最初から2桁目に2が出てくる確率は、log₁₀(1+1/12)+log₁₀(1+1/22)+⋯+log10(1+1/92)≈0.109となる。
従って、n番目の桁の数値分布は、nが増加するにつれ、急速にどの数値に対しても10%へと近づくのが判る。実際に、不正発見目的における利用では、普通は2桁目以降も用いられるという。
確かに、不正を行う為にデータを作為的に作る人は、できるだけランダムに数値を分布させようとするが、理論的には不可能で、逆に不自然な結果をもたらす事になる。故に、対数による規則性を用いれば、イカサマも意外と簡単に見抜ける事も分かる。
今日ではベンフォードの法則は、電気・ガス・水道等の公共料金の請求書、株価、物理・数学定数、川の面積、スポーツの成績、更には人口や新聞記事等にも適用できるという。
世の中には、思わぬ所に思わぬ法則が隠れていて、それが社会にも役立つ事となる。自然界に現わる事象は多様性があり、ランダムに行われてる様で、実は何らかのルールに基づいてるケースも多い。
つまりランダムネスの科学とは、偶然の神秘を可視化するものであり、未来を予見する重要な道標となっているのだ。
以上、「ドランカーズ・ウォーク」の第5章(大数の法則の小数の法則)から興味深い部分を抜粋し、その他サイト群も参考に纏めました。
次回は、ベルヌーイの生涯と「大数の法則」と「小数の法則」との比較を中心に纏めたいと思います。
※コメント投稿者のブログIDはブログ作成者のみに通知されます