現代は「大量データ」の時代だとよくいわれる。世のなかの森羅万象について完全無欠なデータがあるのなら,あとはそれをいかに分析して,ビジネスや行政に役立てるかを考えればいいわけだ。しかし,一見膨大に見えるデータも,実は穴だらけ,欠測だらけで,かつさまざまな歪みを持っている。だから,データが大量にあっても,それだけでは正しい分析にはつながらない。
献本いただいた星野さんの新著では,欠測データをどうするか,選択バイアスをどうするか,といった現代社会でデータを扱う者なら誰でも直面する問題が扱われている。この分野の研究をリードしてきた著者だけあって,類書にはない最先端の話題が盛られている。しかも,マーケティングの実務データを分析してきた経験が示すように,根底には強い現実感覚が伺える。
最後の章は「データ融合」(データフュージョン)に当てられている。オーソドックスな統計学者なら躊躇するかもしれないテーマだが,そこにあえて挑む現実感覚がある。偶然といっていいのかどうか,この本を手にした数時間後にご本人にお会いした。ぼく自身が抱える問題(相互作用する消費者行動データの分析)について話すうちに,問題解決の方向が見えてきた気がした。
といっても,それはテクニカルな解決方法ではない。星野さんの問題意識は,欠測値の処理とか複数データの融合とかいったレベルを超えて,ミクロとマクロの融合へと広がる。それは,統計学におけるミクロ-マクロ・ループといってもよい。そうした問題の捉え方が刺激になった。これは,いま一部で研究されているエージェントモデルと集計モデルの架橋にも結びつく話だ。
ミクロとマクロは,一方が他方に還元されるわけではなく,それぞれが固有の情報を持つ。そのことを正しく理解すれば,さまざまな問題を解決する糸口が見えてくるのでは・・・。このあたりは,ぼく個人が勝手に舞い上がっているだけかもしれないが,いろいろ思い悩んでいるプロジェクトを,とにもかくにも前に進めなくてはという元気が出た。もう,7月も終わろうとしているが・・・。
献本いただいた星野さんの新著では,欠測データをどうするか,選択バイアスをどうするか,といった現代社会でデータを扱う者なら誰でも直面する問題が扱われている。この分野の研究をリードしてきた著者だけあって,類書にはない最先端の話題が盛られている。しかも,マーケティングの実務データを分析してきた経験が示すように,根底には強い現実感覚が伺える。
調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)星野 崇宏岩波書店このアイテムの詳細を見る |
最後の章は「データ融合」(データフュージョン)に当てられている。オーソドックスな統計学者なら躊躇するかもしれないテーマだが,そこにあえて挑む現実感覚がある。偶然といっていいのかどうか,この本を手にした数時間後にご本人にお会いした。ぼく自身が抱える問題(相互作用する消費者行動データの分析)について話すうちに,問題解決の方向が見えてきた気がした。
といっても,それはテクニカルな解決方法ではない。星野さんの問題意識は,欠測値の処理とか複数データの融合とかいったレベルを超えて,ミクロとマクロの融合へと広がる。それは,統計学におけるミクロ-マクロ・ループといってもよい。そうした問題の捉え方が刺激になった。これは,いま一部で研究されているエージェントモデルと集計モデルの架橋にも結びつく話だ。
ミクロとマクロは,一方が他方に還元されるわけではなく,それぞれが固有の情報を持つ。そのことを正しく理解すれば,さまざまな問題を解決する糸口が見えてくるのでは・・・。このあたりは,ぼく個人が勝手に舞い上がっているだけかもしれないが,いろいろ思い悩んでいるプロジェクトを,とにもかくにも前に進めなくてはという元気が出た。もう,7月も終わろうとしているが・・・。