Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

SDOW2009参加記

2009年11月06日 | 会議参加記
順序が逆ですが、ISWC2009の付設のワークショップSDOW2009 Social Data on the Webの報告をさくっとしておきます。写真の一部はこちら

ProceedingsはCEUR online proceedings No.520として公開されています。

Invited TalkはUnderstanding and Exploiting Social Data What, Why and How
people write on Social Mediaというタイトルで Meena Nagarajan,
Kno.e.sis Center, Wright State Universityの人。
- Network, People, Content
- Effects of Networked Publics
- Mapping User-Generated content to content
- Dimnsions of Analysis - WHAT , WHY , HOW
- Social Mediaではコンテキストが不足している。それを補わないといけない。NLPとかオントロジーとか。
- Named Entity Recognition: Movie nameとか。
- User Intention Mapping: 意図の推定。/
- 例:
-- BBC SoundIndex
-- Twitris: Know.e.sis. USC: Realtime user perceptions as the fulcrum for browing the Web
彼女の研究グループはSemantic Web Challengeにもでていましたし、ISWC2009で発表がありました。
この紹介のあったTwitrisですが、まさにtwitterのtweetsのコンテキスト推定をして、他のソース(Newsやwikipedia)と連動させるというものです。地域を指定して、用意されたトピックスをクリックするとそれに関するtwitterのつぶやきやnews記事、wikipediaが表示されます。tweet検索にはキーワード集合のようなものを自動生成して付加してるようです。まあうまく動いているようですが、トピック追加は一晩またないといけないようです(index更新?)

一般発表:The NoTube Beancounter: Aggregating User Data for Television Programme Recommendation
- EUプロジェクト。Notube: semantic televison project
- テレビ視聴とWebを融合するとどうなるか、といったプロジェクトらしい。例えばBBCのデータとDBpediaのデータをつなげあわせる。語彙が必要.
- Trend Analysis:コンセプト、シリーズ、場所/文脈等々。個人ごとのパネル表示。
- 推薦: 私の好きなシリーズとか友人が好きなシリーズとか。推薦の説明をつける。
うちでも視聴行動に基づく番組推薦とかをやっているので参考になります。まあそんなに驚くような結果は見せてくれませんでした。

一般発表:Continuous Queries and Real-time Analysis of Social Semantic Data with C-SPARQL by Emanuele Della Valle
- いくつかのmicroblog + Semantics -> SMOB, Smesher, Semantic Tweet
- streamとしてのsemnatic Data -> RDF stream :タイムスタンプ付きのtripleの列。それをqueryがC-SPARQL

一般発表:Mapping between Digital Identity Ontologies through SISM by Matthew Rowe / Social Identity Schmea Mapping (SISM)
- Problem: Monitoring Personal Information Online
- Finder all web resources (Google / Sindice, Waton)
- User meta models to present knowledge
- しかしRDFmodelはオントロジーがわからなかったりす。それでsocial Inditity schema mappingが必要。
- Mapping beween FOAF, Ontology for Vcards, XFN Ontology, Perosnal information model ontology and Neopmuk contact ontology

一般発表:Multiple Personalities on the Web: A Study of Shared Mboxes in FOAF by Jennifer Golbeck,
- 個人プロファイルの統合問題
- DataはblogやSNSサービスから ex. LiveJournal 3M
- FOAF Identifierのunique性で統合。
- 982,912 unique mbox
- 47,563が複数アカウント。
- 83.6%は同じネットワーク内。
- 複数(2 or 5)のaccountのあるmboxを集めて、なぜわけているかを調べる。
- 16のものは30 account / 350 account -> 空白 / 118 account -> たぶんテスト / 108 -> 19歳の女性。中身はない。
- 92のもの -> セレブリティの名前多数(写真も)。17歳の学生。fan fiction sexual role playng gameの作者。
- accountの40個を調査:同じ人物が多数。4つだけが別人のよう。なぜ分けるか? 21歳制限のために分ける
- 性的指向が隠すか見せるかの違い。Fake mail addressの使用。 123@hotmail.com (14回), none@none.com (13)
- Sybil-type attacks (many accounts for vote casting)
- Compartmentalizing / Errors / Groups
- Privacy implications: このデータセットでは明確なことは導けなかった。今回はfoafのみ。Facebook, LinkedINとかをいれうともっと変るかも。 (以上)
- 質問ではprivacy問題があった。Semantic Webは強力な装置なりうる。個人的感想:まあいたちごっこで、もし技術がここまで統合できるとなったら、また人はそれを避けるように行動するのでは。もちろん逃げられないデータもあるんでそこは問題なわけですが。

一般発表 FOAF on Air - Context-aware User Profiles for the Social Web by Sebastian Boehm (Docomo Euro-lab)
- IYOUIT projectの一部。
- IYOUITは去年のISWC2008でも賞をとったもので、携帯のデータを含めた個人行動のアグリゲーションをするもので、システムが結構クールだった。
- そういえばたぶん技術的には関係なそうだけど、こんな記事がでてましたね。
- Data miningの方法で context retrievalをして抽象化、関連づけをして、さらにruleで推論する。 data mining toolであるWEKAを使って推論をする。
- FOAFを使って表現。 MeNow, RELATIONSHIP, VISIT の追加。(以上)

発表者のよるパネル
- トピック1:microblogのsearchはどうする? linkの性質がちがう。むしろフロー。Golback: social networkの利用。qualifyingが重要。commentからtrust networkをつくるとか。Meena: Evaluation of social applications, 国によってプラバシーの基準が違う、データ利用はどうするか。Q: social dataとしてなぜuser profileだけなの?ほかのユーザデータは?
social dataって定義は? FOAFデータだけ OR Web上のユーザの行動データすべて。(午前はおしまい)

午後再開。The Mobile Wine Agent: Pairing Wine with the Social Semantic Web by Evan Patton
- Sematic Webの古典問題:-) Wine agentの話

一般発表 Semantic History: Towards Modeling and Publishing Changes of Online Semantic Data by Jie Bao
- Webの変更履歴の意味化
- changeの種類、内容、参照
- Semantic history -> reusuable, linkable, fine-grained, app-friendly
- Use of SMW
- application -> query, Stastics, visualization, inference

発表 SiocLog: Providing IRC discussion logs as Linked Data by John Breslin
- IRC dataのセマンティック化。 SIOC, Web IDの利用。


発表 Freemix: Social Networking Meets Data by David Wood
- Speedsheetスタイルのデータを共有してリンクする新しい仕組みfreemixの提案

発表 Social Networks of an Emergent Massively Collaborative Creation Community - Case Study of Hatune Miku Movie on Nico Nico Douga
- hamasaki氏の発表。質問は司会からのみ。Youtubeではそういうことは起こっていないの? 発表内容は悪くなかったと思うけど、喋り内容が未整理な感じ。内容が内容だけに伝わったかねえ、というところ。
- TBLは在室していたけど、携帯をみていて聞いて聞いていなかったよう。

午後のパネル。hamasaki氏もパネリスト。
- Drupal 7でRDFaのサポート。cf. SearchMonky, Google Snippet
- Hamasaki氏出番無し。

全体的な感想
- 多くの発表ではSocial Dataといってもかなりスコープが狭い。基本的にschemaがある(metadataとして明示的に記述されている)ことが前提で、しかもuser profileのみを対象としているものの多数。
- まあここはSemantic Webの会議なのだからしょうがないといけばしょうがないが、もっと広がりがあってもよいのでは。
- その点で我々の研究は前提からして違っていたのでかなり浮いた感じだった。