ケスケラの読書と旅の日記

主に哲学・思想関係の本について要約紹介します。書き方のスタイルごとにカテゴリーを変えています。

『経済数学の直観的方法 確率・統計編』(その1) 長沼伸一郎著

2016年11月19日 | 読書(科学)
一昔前に社会人入学により大学院でファイナンスを勉強したことがあったが、修士は簡単に取得できたものの、さすがに博士ともなると歯が立たなかった。ゼミ仲間の大半は修士課程で修了したのだが賢明だと思う。
博士号取得の要件として「論説」扱いの査読論文を何本か書く必要があるのだが、1本はすんなり雑誌に掲載してもらったものの後が続かなかった。同じゼミの若者が米国で受賞したとか掲示板に貼られているのを目にすると、自分には到底およばないと思った。やはりルべーグ積分とか空手踊りの定理は難しい。たかが投資理論なのに、なんでそんなに難しくする必要があるの?と言いたくなる。
というわけで、なんだか恨みのあるファイナンスだが、著者によるとこの本は文系・理系を問わず、あくまで確率・統計を理解することを主眼としており、ファイナンスはその題材として位置付けられているようなので、いつもながら本質的な誤解を晴らしてくれるかもしれないと期待しつつ勉強し直すことにした。
「初級編」
この本は最初から類書と異なり意表を突く。
多くの確率統計の本はサイコロ・場合の数の説明から始めるのだが、著者によるとそもそも確率統計の体系化を行ったガウスの頭の中にどんなイメージがあったかの説明が抜けているということである。
つまり著者は確率統計に一体どんな理論的魅力があるかを最初に説明するのである。
人間の無知を小綺麗に処理するツールに過ぎないのか、それとも現象に潜む「神の指紋」を読み取るものか。
著者によるとガウスが研究していたのは「確率論」ではなく「誤差論」であるという。
ガウスの抱いていたイメージで重要なのは次の二つであると著者は指摘している。
①誤差の分布をみると一方に偏った誤差は何らかの理論で修正できるが、プラスマイナス均等に生じる誤差は理論によって修正することができない。
②この世の誤差は±1の誤差が生じる単位が連続することで多段式に生まれている。
この①と②を組み合わせると、この世のすべての誤差が最終的にどのような形になるのかが予測できることになる。
著者はこのメカニズムを、個体差を生み出す「造物主のベルトコンベヤー」としている。
多くの確率統計の本はラプラス流の場合分けから始まり公理化へと進むのだが、それだとやはり真の原因が分からないので例えばサイコロの目が出る確率が場合分けにより1/6の均等とみなして数学的に処理するというイメージになる。
ガウスの発想は逆である。世の中の誤差に偏りがあればそれは何らかの理論で修正できる。しかし偏りのないバラツキは理論では修正できない。ではそのバラツキはどのような形状になるかという発想であり、それが正規分布曲線である。
著者によると多くの確率統計の本は「この世界にある物事のばらつきは、正規分布に従うことが多い」と書いてあるだけで、「どうして物事は正規分布に従うのか?」という問いについて説明がないと指摘している。著者はその問いに真っ正面から応えている。
著者は正規分布のイメージとしてパチンコの釘が均等に打たれた台の上から無数の球を落とすと、釘によって左右に分かれ、台の下に積もった球の形状が正規分布になると説明している。この一段一段が先程のガウスの②に相当する。数学的にはパチンコの釘が十数段の場合が二項分布、釘を無限に増やしたものがその極限としての正規分布であるという。どれほど小さな確率でも常に右か左に分かれ続ける球が存在しうるので、正規分布がX軸に接しない(0にならない)ことがイメージできる。
著者によると高校生は二項分布までは理解できるが、その極限をとるとe^(-ax^2)という関数になるので高校数学で扱えないため正規分布を天下りに丸暗記させられることがトラウマになるのではないかとしている。もっともである。
こうなると無知を棚上げしているというイメージではない。なぜ個体差が生じるのかということが数学的に説明できている。もちろん各段階で左右に均等に分かれる理由は不明だが、それはいかなる理論でも不明なのである。
(私の感想。例えば観測結果のバラツキが正規分布に従うという場合、その観測結果が生じるプロセスを分解した最小単位の誤差がプラスマイナス偏りなく生じているということが前提となる。天体望遠鏡の例でいうと、対物レンズ、鏡筒内部の空気のゆれ、接眼レンズなどの各点での光の進行方向のズレが左右どちらにも均等に生じうるという前提がある。どちらかに偏ってズレが生じるなら正規分布にはならない。だが多くの観測結果が概ね正規分布に従うということは、プロセスを分解していくと理由なく均等に枝分かれするということだろうか。例えば学力が正規分布に従うのは、人生には無数の選択肢があり、個々の選択肢は左右均等に選択されるが、頭に悪い選択を続けた人と、頭に良い選択を続けた人と、それらを組合せた人の学力が正規分布という結果になるのだろうか。パチンコ玉ではそういうイメージになるのだが、いくらなんでもそう都合良く各分岐点が左右均等に分かれるだろうか。この疑問に対する答えは次の中心極限定理で明らかになる)

「中級編」
この編では最小2乗法、中心極限定理、確率過程とランダム・ウォークが説明されている。
最小2乗法の本質とは、「データの背後に隠されている正規分布曲線の中心線の位置を推理すること」である。
数学ではフラットランドなど、理解困難な高次元の世界を低次元の世界に置き換えてイメージすることが多い。著者もまた、分布のバラツキが正規分布ではなく三角形に従うパラレル・ワールドを想定して直観的に説明している。真の値をxとして観測結果からのズレ|x-a|を足して、それが最小になるxを求めれば、xが三角形分布の中心の座標になる。
なぜならxが三角形の中心ならば最小になるからである。最小2乗法も同様に類推できるというわけである。
中心極限定理の説明も素晴らしい。
これは先程の初級編に対する私の疑問に応えるものだが、一般的に誤差のバラツキというものは①「偏りがあって理論で修正できる部分」と②「左右均等に生じて確率的に扱うしかない部分」の二つに分かれるが、その中間に規則的な偏りが生じる部分もある。正規分布は②の連続過程の結果として現れることになる。これに対し①についてはトレンドとして外部変数とし、中間の偏りに規則性がある部分はそれを導入することで何通りもの確率分布をつくることができる。
(統計ソフトを使って時系列データを入力して予測式を出力するとトレンド項+確率項になり、この確率項が正規分布やt分布などに分かれる。これは上の説明により、ローカルセオリーで説明できるのがトレンド項、規則的な偏りがある場合が正規分布以外の分布になると理解できる)
著者は、まず中心極限定理とはこれら様々な確率分布をすべて合成するとその結果が正規分布になるというものであると簡潔に説明し、なぜそうなるのかを直観的に説明している。
例えば雲の水滴の動きはランダムに上下するのだが、大気温度により下向きにバイアスがかかると中心線が左よりの分布Aになり、太陽光により上向きにバイアスがかかると右よりの分布Bになる。この二つの分布を合成すると偏りの大きさが左右同じであれば正規分布になるというのである。これはガウスの多段式構造をイメージすれば容易に理解できるのだが、二つの分布にいたったプロセスをそれぞれa1a2a3a4・・・、b1b2b3b4・・・とすると、両者を結合してa1a2a3a4・・・b1b2b13b14をつくり、さらにa1b1a2b2・・・と交互に組み直して(組み直しても結果が変わらないことは直観的に分かる)a1b1の1単位をみると左右の偏りが同じ大きさであれば相殺されて正規分布の1単位と等しいことになるからである。この定理を題名とする本があるぐらい、かなり高度な数学を必要とする難解な定理なのだが、本質的な部分は直観的に理解できる。
以上の説明は偏りが同じ大きさであるという単純な仮定があるが、確率分布の種類が多くなると偏りの大きさが異なっていても均されて、例えばA分布B分布C分布・・・がそれぞれ異なる確率分布であっても同様に結合して組み直して1単位a1b1c1d1e1f1・・・についてみると、合成する分布が多ければ多いほどプラスマイナスのバイアスが相殺されて1単位が±1で均等になり、正規分布を生成する1単位に近づくことも直観的に予想できる。要は分布の結果ではなく、その分布を生成したプロセスの最小単位に着目すれば中心極限定理の理解は容易である。
すると学力が正規分布に従うのは、人生には様々な種類の選択肢があり、それらは均等に選択されず大きさの異なる偏りがあるかもしれないが、すべての確率分布を合成して均した結果だと言えるかもしれない。多くの観測結果が正規分布に従うのも、単純に二項分布の極限としてではなく、様々な確率分布が合成されて中心極限定理に従う結果であろう。
この定理がありがたいのは、経済予測に使えるということである。
株式市場などは多数の社会的経済的影響に起因する確率分布があり、それらは異なった確率分布なのだが、すべてを合成すると中心極限定理によって正規分布になるとみなしうるからである。
(私の感想。著者は「最後に笑うものは正規分布」といい、「正規分布よりもっと進んだものをベースにすれば優れた理論ができるのか」と疑問を呈しておられる。しかし「べき分布」のように合成しても正規分布に収束しない特殊な分布もある。だがそれは中心極限定理に従わないのではなく、収束する分布が正規分布ではなく安定分布になるという違いにすぎない。著者の明快な説明によって株価変動に正規分布が仮定される数学的理由については理解できた。しかしLTCMなどにみられる金融工学の破綻はベキ分布を正規分布と取り違えていたからであるとする説もある。このことは著者への反論ではなく、むしろ著者自身の説明を延長すれば、べき分布が正規分布に収束しないのは裾がべき乗で減衰するから他の分布と合成してもプロセスの最小単位が±1に相殺されないからだろうと直観的に理解できるのである。この本には書いてないのだが、この本を読むことで安定分布がなぜ数学的に扱いが困難であるかも類推でき、ぼんやりとした安定分布のイメージがクリアになる。中心極限定理も驚異的だが、ここまで短時間で本質を理解させる著者の力量も驚異的であると思う)
ブラウン運動とブラック・ショールズ理論。
著者はブラウン運動が正規分布現象を2次元平面上に拡張したものだと説明する。どういうことか。著者の説明は0度(水平)と10度の二つの方向で説明しているのだが、これは0度と10度に分岐するというのではなく、0度方向への二項分岐と10度方向の二項分岐がともに正規分布であるから重ね合わせても正規分布になるということであろう。したがってこれを360度に拡張しても同様に中心極限定理によりその合計が正規分布になり、ブラウン運動自体が正規分布のバリエーションということになる。
次に著者はプロセスの分岐点を増やすことと時間が増えることとを混同してはならないという。
これもまたパチンコ玉のイメージで分かり易く説明されている。時間が増えるというのは、釘の数を一定にして、その前に長く座っている状態である。この場合は球がどんどん増えて台の下に積もる形状はあらかじめ想定された正規分布に限りなく近づいていく。しかし、分岐点が増えるということは釘の段数が増えていくというイメージであり、この場合は、台の下に積もる形状はシグマの幅が大きくなって分布の形状がなだらかになる。だから分布曲線の広がりは時間に比例するのではなく、分岐点の増加に比例するのである。
次に原点から出発してランダムウォークを繰り返すと、分岐点が多いほど最終結果が拡散するのはなぜかという疑問も直観的に説明されている。
常識で考えると分岐点毎に±1方向へ等しく分岐するのであれば、数多く繰り返すことによって大数の法則によりプラスマイナスが相殺されて原点に戻るのではないかと思われるのだが、逆に拡散するのである。
著者はこれを360度シンメトリーに二項分岐しながら拡散していくベクトルによって説明している。このベクトルを単純合計すれば確かにプラスマイナスが相殺されて0になり原点に戻る。だが各ベクトルの原点からの距離を絶対値として合計すると分岐点の増加とともに距離の合計は逆に増加するのである。
水面に垂らしたインクが均等に円形に広がるのは、原点からの距離が増加しているからである。それは左右上下シンメトリーであるから距離である絶対値をはずしてみれば、プラスマイナスがきれいに相殺されてゼロになることが分かる。時間と共に何が拡散し何がゼロになるかがが直観的にイメージできる。
(かつて似たような図を何度も描いたことがあるが、それでも曖昧だった。著者の説明でようやくクリアになった。この本は面白すぎる。ゆっくり賞味したいので、今日のところはこれまでとし、また続きとする)
『本』 ジャンルのランキング
コメント (1)   この記事についてブログを書く
この記事をはてなブックマークに追加
« 『第六回ライン州議会の議事... | トップ | 『経済数学の直観的方法 確... »
最近の画像もっと見る

1 コメント

コメント日が  古い順  |   新しい順
感想 (一読者)
2016-11-20 18:34:17
ベキ分布などの場合でも、線形性の階層構造を導入すればモデル化可能というビジョンが著者にあるようですね。
筆者の物理数学・・・の中に、非線形微分方程式をそうしたモデルで考えるという記述がありました。
本記事を読んで、その内容を思い出し、新刊中の疑問部分がややクリアになりました。
ありがとうございます。


コメントを投稿


コメント利用規約に同意の上コメント投稿を行ってください。

数字4桁を入力し、投稿ボタンを押してください。

あわせて読む

トラックバック

この記事のトラックバック  Ping-URL