米国の大統領選挙の結果予測を的中させたことで有名な(という説明が必ずつく)ネイト・シルバー氏の著書。何だか怪しそうだし、後づけの自慢話ばかりかと思って読んだら全然そんなことはなかった。むしろ、予測の難しさに関する、きわめて真面目な議論が行われている。
シルバーは選挙予測の前はプロ野球の予測で成功している。そこには、同じルールのもとで毎年100試合以上、イニングでいえば約1,000回は繰り返されるデータがある。したがって、統計的な分析に最も適しているといえる。では、政治や経済、天気や地震はどうなのか?
彼が次に選んだのは、選挙である。米国の大統領選挙は予備選挙も含めて何度も各地で行われ、世論調査もひんぱんに繰り返されている。二大政党制が維持され、イデオロギーの分布も安定していそうだ。だから予測しやすい・・・といってもシルバー以外は必ずしも成功していない。
なぜなのか。彼が挙げる予測が失敗する要因の一つは、特定の理論・モデルへのこだわりだ。学者の場合、それはやむをえない。しかし、予測の実務家は、なるべく多くの、異なる考え方に立つモデルを用いてさまざまな予測を行い、それらを比較・総合して判断すべきだという。
また、シルバーはベイズ統計学の考え方を強く支持する。「適切な事前分布」を用いることで予測は改善される。また、新たな情報が加わったとき、予測の更新が系統的に行える。予測の実務家にとって、複数のモデルによる予測を統合するのにもベイズは使えるのかもしれない。
本書では、選挙や野球以外にも、天気、地震、感染症、ギャンブル、チェス、ポーカー、経済・金融、地球温暖化、テロなどの話題を次々に取り上げる。著者は、各分野の予測の専門家を訪ね、そこでの予測のやり方や難しさを取材していく。意外な話が多くて、大変興味深い。
自分の関心でいえば、感染症の予測の章が面白かった。最初は単純な SIR モデルが使われていたが予測精度が低いので、最近ではエージェントベース・モデルが構築されているという。もちろんそれでも予測精度がそう高いわけではない。ただし、予測以外の知見が重要だという。
予測の成功で名声を得たネイト・シルバーは、それに伴う富と時間を予測の成功に関する取材と思索に費やした。それは彼に新たな名声を与え、完璧な予測は不可能だが、努力により的中確率をある程度改善できるという、ある意味で平凡な主張にも輝かしさを与えることになった。
シルバーは選挙予測の前はプロ野球の予測で成功している。そこには、同じルールのもとで毎年100試合以上、イニングでいえば約1,000回は繰り返されるデータがある。したがって、統計的な分析に最も適しているといえる。では、政治や経済、天気や地震はどうなのか?
シグナル&ノイズ 天才データアナリストの「予測学」 | |
ネイト・シルバー | |
日経BP社 |
彼が次に選んだのは、選挙である。米国の大統領選挙は予備選挙も含めて何度も各地で行われ、世論調査もひんぱんに繰り返されている。二大政党制が維持され、イデオロギーの分布も安定していそうだ。だから予測しやすい・・・といってもシルバー以外は必ずしも成功していない。
なぜなのか。彼が挙げる予測が失敗する要因の一つは、特定の理論・モデルへのこだわりだ。学者の場合、それはやむをえない。しかし、予測の実務家は、なるべく多くの、異なる考え方に立つモデルを用いてさまざまな予測を行い、それらを比較・総合して判断すべきだという。
また、シルバーはベイズ統計学の考え方を強く支持する。「適切な事前分布」を用いることで予測は改善される。また、新たな情報が加わったとき、予測の更新が系統的に行える。予測の実務家にとって、複数のモデルによる予測を統合するのにもベイズは使えるのかもしれない。
本書では、選挙や野球以外にも、天気、地震、感染症、ギャンブル、チェス、ポーカー、経済・金融、地球温暖化、テロなどの話題を次々に取り上げる。著者は、各分野の予測の専門家を訪ね、そこでの予測のやり方や難しさを取材していく。意外な話が多くて、大変興味深い。
自分の関心でいえば、感染症の予測の章が面白かった。最初は単純な SIR モデルが使われていたが予測精度が低いので、最近ではエージェントベース・モデルが構築されているという。もちろんそれでも予測精度がそう高いわけではない。ただし、予測以外の知見が重要だという。
予測の成功で名声を得たネイト・シルバーは、それに伴う富と時間を予測の成功に関する取材と思索に費やした。それは彼に新たな名声を与え、完璧な予測は不可能だが、努力により的中確率をある程度改善できるという、ある意味で平凡な主張にも輝かしさを与えることになった。