Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

ISWC2009参加記

2009年11月05日 | 会議参加記
ISWC2009 (8th International Semantic Web Conference)がアメリカ、ワシント
ンDCで開かれました。場所は空港近くのWestfields Conference Centerというところで、でなんというか陸の孤島です。まあ籠もって議論しようということでしょう。写真の一部はこちら

登録者は500人強。去年より微減とのこと。参加者の半数はアメリカから。あとイギリス、ドイツ。この3国で3/4。日本は上位9位にはいっていませんでした。研究論文は250件中の43件で相変わらず高倍率です。日本からはたぶんNICTの兼岩さんだけ。
オープニングでおもしろかったのは、応募論文をテキストマイニングした結果を報告したことです。いくつか紹介すると、Ontologyは確率1...つまり必ず入っている?(ほんと?)、Serviceは採択論文の方が顕著に高い(次はここへ狙えと?)、Resultも高い(まあそうかな)。逆に不採択論文で一番高かったのがCreation (ええ?、まあ最近のISWCではそっち方面はないもんなあ)でした。

全体の傾向としてはやはりLinked Dataが潮流ですが、もはや巨大Linked Dataがあるのが前提で、そこになにを貢献できるかという研究発表が多かったと思います(まあそういう傾向のセッションにでているせいもありますが)。Linked Dataの世界はいまのところ順調に拡大しているので、まあそこにひっぱられるのはしょうがないところです。しかし問題はいろいろあります。Linked Dataの生成問題として、現行の構造データのRDF化だけでいいのか、それともMitchellのような機械学習と統合するのか、あるいはT2のようなユーザ参加型も統合されるかは興味深いところです。また、Linked Data自身の抱える問題、信頼性、統合、更新ということにどう研究が貢献できるか(Cris Bizerの研究はそこを突いているので興味深い)ということがあります。


最初Invited TalkはPat Hayes. blog(web logic)の提唱というか問題提起とその解決の一つとして surfaceという概念を持ち込んだ RDF semanticsの提唱。Hayesのトークは楽しいし、内容には価値がある。しかし、それが本当に言語やシステムに活かされるかというとそれは疑問。司会の紹介であったようにいみじくも「議論の人」ですよね。

2人目のKeynoteはT. Mitchell. Populating the Semantic Web byMacro-Reading Internet Text. / 機械学習の大御所。/ SWの普及の3つの方法。人が構造データ書く。DB公開。計算機が読む。3番目の選択を説明。Webの冗長性の利用。初期オントロジーを発展させる。セミ教師付学習(学習のカップリングで問題を容易化)。繰り返しでインスタンスを増やしていく。多くのルールを学習。実際の学習結果を沢山出していてインパクトがありました。これはいけるかもしれないという印象をうけました。

3人目のkeynote: Present, Personalized and Precise: Defining Search for Web 3.0 by Nova Spivak (Radar Networks) / Vetureの人。Twineを開発した人。Twineの成功と失敗。次のWebは? / Web 3.0 = SW / 次の検索の方向: Semantic,Sharing, Personalized, Tracking, Real-time, KM, Social, Reasoning / SWの問題 / 消費者はSメタデータは足さない / Webmasterもそんな暇はない / 人間はそんなにいいメタデータがかけない。/ 結局、機械がやるべき / T2 (Twine 2) / Web-scale Semantic Search / 例えばレシピサーチ / 材料や状況別に集約してfacet 検索可能 / site mapping toolの提供 /
Focus area: lifestyle (FOOD, health, travel, people) / Etntainment (GAME, ...) /Shopping / Find - Share - Follow / まだT2はfindだけ / Webからの構造データの取り出しは何度となくTryされているけど、まだ特定用途じゃなくてweb-scaleでうまくいった例はないだよね。 今度は成功するか。


Semantic Web Challenge: これはSWアプリを作って競争しよういうものです。もうすっかりISWCの恒例。Open Track (何でもOK), Billion Triple challenge(10億RDFを使うアプリ)の2種類。今回はOpen Trackに16件と過去最大(BTCは3件のみ)。僕はいつからこの審査に参加しています。16件をまず審査委員で6件に絞り込みます。これはPoster&Demoセッションでの説明を聞いた後、審査委員で投票と議論をします。今回は結構白熱しました。以下のものが残りました。
1. Collobrative Creeation of Point-of-Interest: 地図にみんなでポイントをいれ、それにカテゴリをつける。カテゴリは各自でつけれる。まあSWアプリとしてはよくできているけど、Google mapアプリと比較するとどうかな、というところ。
2.LinkedGeoData: OpenStreetMapのデータをRDF化。3億RDF文。Wikipediaと連携も。巨大データを処理した努力はすばらしい。他のアプリの土台としては評価が高いか?
3.Sig.ma: Semantic Search Engineの結果をきれいに統合。ソースごとに信頼OR削除を指示できる。その状態を外部からURLで参照できる(だから編集状態の保存ということはしない)。クールなインタフェース。イイ。
4.Information WorkBench: DbpediaなどのLinked Dataを整理して表示。その場で編集可能。セマンティックな検索も可能。機能的はてんこ盛り。よく作り込まれている。でもSig.maのほうがシンプルで使えるツールかな。
5.TrialX: 治験を受けるために個人記録をマッチさせるしくみの提案。病名などはUMLSなどから。
6.VisiNav: linked dataをfacet検索。検索がとても高速なのとインタフェー
スがとってもCool。
BTC 1: eRDF: 進化アルゴリズムでRDFを検索。意外な結果もだす。スケーラブル。おもしろいが、何に使うの?
BTC2: Scalable Reduction: パラレル処理。3,712 CPU。

結果は1.TrialX、2.VisiNav 3. Sig.ma, BTCはScalable Reduction
審査だと真剣に論文を読んだり説明を求めたりしておもしろいんだけど、疲れました。とくに今回は19件もあったので。もう来年以降はしないかな。



あとは聞いた論文のメモ。

Session for Social Semantic Webの1件目。Analysis of a Real Online Social Network Using Semantic Web Frameworks. SWの世界にsocial networkのレイヤーを追加という話。で、それで?という研究なのだが、これが標準になったりするのだろうか。

Session for Social Semantic Webの2件目。Policy Aware Content Reuse on the Web by Oshani Seneviratne, Lalana Kagal, Tim Berners-Lee。FlickrでのCC Policyの現状と利用調査。70%が違反がある。違反をチェックするvalidationツール作成。Semantic Clipboard: browserでコピーするときにpolicy情報提示。

Session for Social Semantic Webの3件目。Social Trust Based Web Service Composition- by U.Kuter, J.Golbeck - Webサービスのtrustを他のユーザの評価を使って計算。複合サービスのtrustは信頼伝搬(注意深い/楽観的伝搬)。これがBest Paper Award。うーんシミュレーションになぜか映画のトラストデータをつかっている。

In use-track: Vocabulary Matching for Book Indexing Suggestion in Linked Libraries ? A Prototype Implementation & Evaluation / オランダの図書館での語彙統合の話。STITCH Project (Dutch Cultural Heritage )の一環。indexerのためのツール作成。レキシカルだけではなく確信度も。推薦の精度 p:72%, r:47% 実験実施。

In-use Track2 : Live Social Semantics by Harith Alani / RFIDでのリアル出会いを検知する装置とWeb social dataを結合。ESWC2009会議で運用。(うーん、どっかで聞いたような話だが :-) )

Enrichment and Ranking of the YouTube Tag Space and Integration with the Linked Data Cloud by S. Choudhury from DERI Youtubeのタグを処理。時間、場所のタグ分離、関連動画のタグの利用してタグ追加。共起で関係づけ。活性伝搬でタグの重要度計算。WordNetも使いつつタグをLODの語にマップ。実験。追加タグの評価。ランキングの評価。

Produce and Consume Linked Data with Drupal! by S. Corlosquet from DERI / CMSであるDrupalでLinked Dataを扱えるようにする。自動語彙生成。オントロジーマッピング。他. Drupalはそんなに人気なのか? 20万サイトある? Drupal 7からRDFaをnaiveでサポートするそうだ。

Using Naming Authority to Rank Data and Ontologies for Web Search / LDのネットワークのPageRank + ソースのネットワークのRageRank / 単純だとけどいいかも。要読論文

Executing SPARQL Queries over the Web of Linked Data by Christian Bizer /
linked dataのsameAs関係を発見するための各種の関数を用意。それを組み合わせて発見する。WoD-LMP: Linked Dataが変ったときに通知するプロトコルの提案。

Context and Domain Knowledge Enhanced Entity Spotting in Informal Text / UGCでentity spotting 。music いろいろ制限を変えて結果をみる


おまけ。

JWS(J. of Web Semantics)のboard meetingに出席しました。. Elsevierの人がまず社の戦略を語る。Paperを超えたサービスへの試み。化学組成IDとかパテントとかにリンク。Paper以外のデータの載せる実験的取り組み。うーんちゃんとやっているなあ。
JWSのboard meetingとしてはやはりImpact factorで議論。またJournalの立ち位置でも議論。CSではJournalの立場が微妙なのは共通認識。Confでの発表をおまけにつけるとかいくつかアイデアがでるが、とくに結論はでませんでした。

ワシントンは秋の気配で紅葉がきれいでした。足がないので、ホテルから会場まで30分以上歩いて通って、紅葉を担当しました :-)

最新の画像もっと見る