Mizuno on Marketing

あるマーケティング研究者の思考と行動

大規模データのマイニング

2006-12-02 19:24:11 | Weblog
「大規模データの分類と解析技法」なるセミナーを聴きに行く。主催は横幹連合という団体。いろいろ刺激的な話が聞けた。マーケティングの立場から感心したのは「動的へテロデータからのマイニング」の報告だ。ウェブ上のテキストマイニングで人々の関心の流れを知る試みは多々あるが,用いられている個々の技術がさすがに山西さんという印象。この領域では,もう他にやることはないんじゃないかと思わせるほどだ。個人的には,動的な有限混合モデルに興味を引かれた。

統数研の樋口教授による「データ同化」(Data Assimilation)の話はけっこう衝撃的だった。これは大規模なシミュレーションモデルとデータの接合を図ることで,地球科学では前からある概念だという。それにしても,スパコンをばんばん回す世界はスケールが違いすぎる。だが,社会シミュレーションも大規模にすればいいとは必ずしも思えない…というか,想像を絶することをやってはいけない,という感じ。

マーケティングの世界でも数値データからテキストデータまで,データは大規模化する一方である。植野さんの膨大な数のノードを持つベイジアンネットや,鷲尾さんのグラフマイニングなど,組み合わせ爆発を避けるさまざまな取り組みも興味深い。その一方で,事前知識を使ってデータ自体に構造を持たせるような,人間の「恣意的な」介入は避けられないと感じる。

…ということで,そろそろ,採点という「主観的に大規模な」データの「人的」処理作業に移ろう。