日曜日(2/25)にニコニコ動画データ分析研究発表会なるものに参加してきました。これはいわゆる学会じゃなくてあくまで有志の集まりとということで、趣はずいぶん違います。
まず、発表者の名前は基本がニックネームというかハンドルネームです。本名なのは我々ぐらい :-) 基本、好きなことをしゃべります。研究発表の基本構成なんて気にしません。
でも発表自体は意外なほどまじめで価値のあるものでした。スタイルこそ型破りだけど、中身はきちんと分析しています(まあところどころ、えっ、そこはいじっちゃいけないじゃない、なんてところもありましたが)。
基本はタグ分析ですね。やっぱりタグは扱いやすいし、わかりやすいですしね。とくに「グニャラくん」さんのタグの相関関係分析はとても立派なもので、このまま国際学会に行けそうです。
我々の研究(「はまさき」氏とちょっとひらがなにしてみました)は結構受けたようです(ほっ)。他がタグの分析がメインなので、引用分析は異色の部類ですね。作成カテゴリの話もとくに変な反応はなかった(ほんとに受け入れられたのかは不明)。コミュニティの切り出しは結構、なるほどなるほどきれいにでてるよね、といった感想がありました。でもやっぱり受けたのは橋本氏作成のs.o.c.i.a.r.i.u.mによる時系列のコミュニティ生成の可視化でした。やっぱり視覚インパクト勝負ですね :-) あのデモには「みっくばん」なる愛称までついてしまいました。はやく、リクエストに応えて、あの動画をニコニコにUpせねば。一応評価してもらったので、研究を生業として我々としてはほっとしています。
この会で感じた最大のことは、もはや(IT)研究は研究者だけがするものではないということです。ここで発表した多くの人は研究を本業としない人たちです。でなんでこういう分析やらをしているかというと、ただ単にこれを知りたいというモチベーションからな訳です。昔はそう思っても普通の人にはできませんでした。でも今はほどほどのプログラミング能力があればできる環境にあります。分析アルゴリズムやツールがネットで結構手に入りますし(我々だってすべては自作しないですね)、最近のPCなら処理も結構できる。データもちょっとしたクローリングで手に入ると。
それからもう一つの特徴は、みんななんかに特化していることです。私はデータ収集が好きなので分析はしませんとか、逆にデータは○○さんからもらってますとか。
まさに「研究2.0」はすでにあるわけです。誰でもみんな知りたいことを調べる、それがトータルとして閉じた研究集団よりパフォーマンスがよくなる。そんなことが可能な社会になっているじゃないかと。
じゃあ研究の専門家(我々!)はどうしたらよいか。一つはそういった人たちに負けないoutstandingな研究をやることです(戦う研究者:-))。これはまあそうですね。もうひとつは、そういった人たちの成果を評価したり結びつけたりして研究としてのパフォーマンスとしてまとめ上げることでしょう。集めて評価する(「研究版Google」というか「研究版Amazon」)、さらには結びつける(「研究マッシュアップ」)といったあたりでしょうか。
そんなことできるのか?と自問自答してしまいますが、でもやらなきゃ遠からず研究者として生きていけないでしょうね。
まず、発表者の名前は基本がニックネームというかハンドルネームです。本名なのは我々ぐらい :-) 基本、好きなことをしゃべります。研究発表の基本構成なんて気にしません。
でも発表自体は意外なほどまじめで価値のあるものでした。スタイルこそ型破りだけど、中身はきちんと分析しています(まあところどころ、えっ、そこはいじっちゃいけないじゃない、なんてところもありましたが)。
基本はタグ分析ですね。やっぱりタグは扱いやすいし、わかりやすいですしね。とくに「グニャラくん」さんのタグの相関関係分析はとても立派なもので、このまま国際学会に行けそうです。
我々の研究(「はまさき」氏とちょっとひらがなにしてみました)は結構受けたようです(ほっ)。他がタグの分析がメインなので、引用分析は異色の部類ですね。作成カテゴリの話もとくに変な反応はなかった(ほんとに受け入れられたのかは不明)。コミュニティの切り出しは結構、なるほどなるほどきれいにでてるよね、といった感想がありました。でもやっぱり受けたのは橋本氏作成のs.o.c.i.a.r.i.u.mによる時系列のコミュニティ生成の可視化でした。やっぱり視覚インパクト勝負ですね :-) あのデモには「みっくばん」なる愛称までついてしまいました。はやく、リクエストに応えて、あの動画をニコニコにUpせねば。一応評価してもらったので、研究を生業として我々としてはほっとしています。
この会で感じた最大のことは、もはや(IT)研究は研究者だけがするものではないということです。ここで発表した多くの人は研究を本業としない人たちです。でなんでこういう分析やらをしているかというと、ただ単にこれを知りたいというモチベーションからな訳です。昔はそう思っても普通の人にはできませんでした。でも今はほどほどのプログラミング能力があればできる環境にあります。分析アルゴリズムやツールがネットで結構手に入りますし(我々だってすべては自作しないですね)、最近のPCなら処理も結構できる。データもちょっとしたクローリングで手に入ると。
それからもう一つの特徴は、みんななんかに特化していることです。私はデータ収集が好きなので分析はしませんとか、逆にデータは○○さんからもらってますとか。
まさに「研究2.0」はすでにあるわけです。誰でもみんな知りたいことを調べる、それがトータルとして閉じた研究集団よりパフォーマンスがよくなる。そんなことが可能な社会になっているじゃないかと。
じゃあ研究の専門家(我々!)はどうしたらよいか。一つはそういった人たちに負けないoutstandingな研究をやることです(戦う研究者:-))。これはまあそうですね。もうひとつは、そういった人たちの成果を評価したり結びつけたりして研究としてのパフォーマンスとしてまとめ上げることでしょう。集めて評価する(「研究版Google」というか「研究版Amazon」)、さらには結びつける(「研究マッシュアップ」)といったあたりでしょうか。
そんなことできるのか?と自問自答してしまいますが、でもやらなきゃ遠からず研究者として生きていけないでしょうね。