Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

ヨーロッパ3カ国周遊(?)その2(ESWC2007)

2007年09月13日 | 会議参加記
過去の記録の続きです.

****
さて,DFKI訪問が終わって,フランクフルト経由でインスブルックに向かいました.フランクフルトからインスブルックはプロペラ機で小一時間,あっという間につきます.インスブルックの空港は市内から非常に近い,市電でいけるぐらいの距離です.
インスブルックはとっても風光明媚なところで安らぐところです.治安もいい.バルセロナでの緊張感とはうってかわってリラックス状態です.そのせいか,M氏はPCのはいったバックをレストランにおいていってしまったり(数時間後ちゃんとあった),僕はホテルの部屋をロックアウトされてしまったりと逆に危なかったですね.

さてESWC(European Semantic Web Conference)はこれで3回連続の参加です.だいぶ慣れてきました.

以下はほとんど会議中のメモそのままですが,ご参考までにだらだらと載せておきます.

本会議のInvited Talkは4件あったが、どれもかなり実際的な話で、研究系の人には不満があったようだが、私はそれなりに楽しめた。
Stefano CeriはWebMLと呼ばれるモデルに基づくWebのauthoring/managementをproduct (WebRatio)として展開しているそうだ。
Ning Zhong (鍾 寧)氏はWeb Intelligence+Brain Informaticsの話であったが、よくわからなかった。
Georg Gottlobは自らのLixtoというソフトの説明。WebページをLogicalにつくり管理する仕組みで、Productとしては結構使えそうな雰囲気。しかし、Talkはほとんどその使い方の説明であった。

最後のYahoo!のRon Brachmanの話(Emerging Sciences of the Internet: Some New Opportunities)は面白かった。まず古いcomputer scienceから今必要とされるものとして
- ”finding” science and systems
- Community Science and systems
- Algorithmic advertising
- Computational micro-economics
- Media experiences
- Data science
が必要といった。まずfinding scienceとしては
- More than just classical IR
- - Structure
- - intent
- - context
- Moving to an information supply model form query-based retrieval
- Social Search
が必要である。Search Engineでいえば、第1世代は単語レベル、第2世代はリンク、そして第3世代は意味解析と複数ソースの統合などになると。ユーザのニーズも情報提示(informational)、誘導(navigational)では済まなく、何かをしたい(transactional)になっている。たとえば、サービスアクセス、ダウンロード、ショッピング。
Community Scienceでは、いわゆるWeb 2.0的Social MediaとDistributed/Collaborative systemsがキーになる。彼はCommunityを4つに分けている。Social networks (communication & Expression, e.g., facebook MySpace), Knowledge Collectives (find answers & acquire knowledge, e.g., Wikipedia, Flicker), Enthusiasts/Affinity (Hobbies & Interests, e.g., Fancy Sports, Custom Autos), Marketplaces (trusted transactions, e.g. eBay, Craigslist)。新しいSearchとしてこういったcommunityを探すsearchであろう。例:DBLife Portal。
広告に関しては名せりふ「Don’t forget advertising: it fuels the machine」。
大きな目標としては Towards a science of aggregated organic knowledgeであって、具体的には
- ExtractionからIntegration/rationalizationへ
- Wrapper induction
- Reuse/adaptation of ontologies
- Meaning in an inconsistent world
- Learn from projects like Cyc
- Rule of background knowledge – how to avoid “AI-complete” problem?
であると。よいInsightがあるTalkで、現状と金未来がよくまとまっていると思う。

Workshop1つ目はScripting Semantic Web。これは普通の研究ワークショップとぜんぜん雰囲気が違って、hackerの集まりのような感じ。若い人ばかりで、プレゼンもコードをみせてみんなフムフムとうなづくというような進行だった。私の頭ではちょっとついていけないかなと。以下は気になった点のメモ。
****
Gregory Williams
Extensible SPARQL Functions With embedded JavaScript

SPARQLの中に実行可能なScriptを埋め込む
例:距離の計算とか
そのかわり,signatureをつけてmaluseを防ぐ

*****
Michael Hausenblas, Wolfgang Slany, Danny Ayers
A Performance and Scalability Metric for Virtual RDF Graphs

RDF処理がScalableかどうかの議論.
RDFの使い方:
model-compliant (memory/store): ...
model-compliant (standalone):RDF/XML, N3, triple
model-compliant (embedded):semantic wiki, RDFa, eRDF
non-compliant: XML, microformats, Web APIs (Google map...), RDBS

*****
Christian Bizer, Richard Cyganiak, Tobias Gauss
The RDF Book Mashup: From Web APIs to a Web of Data

Linked dataアプローチ
→APIをRDFとしてアクセスできるようにする.

AmazonのAPIをRDF化
Semantic Web browser
OpenLink RDF Browserの利用

DBpediaでも利用

Semantic Web crawlers
- SWSE
- Aitgist
- Swoogle

メタ情報流通のいくつかの方法
・データを作る
-- Linked data
-- APIのRDF化(ダイナミック)
-- SIOCでRDF記述
・データを集める
-- PDF radar(ユーザがみたものをbrowserがPing Serverに教える)
-- PTSW (Ping The Semantic Web)
-- indexつくり
・データを使う
-- ActiveRDF (Desktopでプログラミング)

メタデータのMushUp
-- メタデータは標準もなく孤島になっている.

*****

Workshop 2つ目はBridging the Gap between Semantic Web and Web 2.0

*****
myOntology: The Marriage of Ontology Engineering and Collective
Intelligence
Katharina Siorpaes and Martin Hepp
http://www.kde.cs.uni-kassel.de/ws/eswc2007/proc/TheMarriage.pdf

Wiki-based light-weight ontology mananagement
easy-to-use, media-rich, collaborative, community-driven ontology
building
MyOnology project was just started October 2006.
http://www.myontology.org/
The system is attractive but probably still under construction
Wikiを使った共同的オントロジー

*****
Towards Scientific Collaboration in a Semantic Wiki (Pos)
Christoph Lange

科学におけるwikiの利用.科学における仮説とか理論もタグ化する.野望的:-).いまはまだNGでは将来はここまでいくんでしょうね.

*****
Organizing Resources on Tagging Systems using T-ORG
Rabeeh Ayaz Abbasi, Steffen Staab and Philipp Cimiano

tagの構造化
Googleのsnippetから言語パターンで抽出 ex. such as,
コンテクストの利用(resource context, tag context, group context)

ダヌシカくんのweb miningとMikaの3部グラフの合体みたいなものか.
それほど包括的ではない.まあやってみましたという感じ.

*****
Folksonomies, the Semantic Web, and Movie Recommendation
Martin Szomszor, Ciro Cattuto, Harith Alani, Andrea Baldassarri, Vittorio Loreto, Vito D. P. Servedio and Kieron O'Hara

recommendation systemはそのシステムでモデル化したものだけを利用している.
もっと外の情報をつかう。
IMDB (Internet Movie Database)
social tag
NetFlix (online DVD rental service in the US)
rating from 1 to 5
この会社はこの会社のデータの推薦を向上したらお金をくれるそう
オントロジー化
Tag-cloudのrating化
結果は重み付けをしない方法が一番良かった(なぜかは不明).
Future Work
- demographic-based Rec. (age, gender ...) もやりたいそう

*****
Revision and Co-revision in Wikipedia
Ulrik Brandes and Juergen Lerner

Revisionに注目
- Co-revision similarity
- co-author similarity
Wikipedia: 23GB 1.5 Million pages
similarity computation for 2,000 edits (-> 1,241 pages)
editを週ごとにグラフ化
- G W. Bushが最高 :-)
- いろいろBurstのパターンがみられる
Bushはだんだん上がって,急に低レベルに
Hurricane Katrinaは急に上がる
Co-revisionをcovarianceで計算する
- normalizeする
- 特定のパターンがあると意味がある
- 普通(全体のパタンと同じような)だと意味がない
Co-author similarity of pages
- すこし関連性がみられる

*****
FolksOntology: An Integrated Approach for Turning Folksonomies into
Ontologies
Celine Van Damme, Martin Hepp and Katharina Siorpaes
いろいろなonline resourceを組み合わせて,オントロジーを作る
Wikipedia, WorldNet, Loe directoraries
かなり大きな風呂敷
tag->concept (Wikipedia)
tag->synonym (Wikipedia disambigous page, WorldNet)
...

まだはじめたばかりのよう.実際にはまでデータを使ってやっているわけでない
実際にどうclean upしていくかの方法論がないので,このままで難しいそう.
それぞれのごみデータや違いをどこで吸収するのか.

先のMyOntology projectのうち

*****
Bridging the Gap Between Folksonomies and the Semantic Web: An Experience Report
Sofia Angeletou, Marta Sabou, Lucia Specia and Enrico Motta

tagをSemantic Webのオントロジーで構造化する.
そういったことを小さなスケールで実験した.

*****
Computing Word-of-Mouth Trust Relationships in Social Networks from
Semantic Web and Web2.0 Data Sources
Tom Heath, Enrico Motta and Marian Petre

FOaf-based social network
revyu.com delicio.us
tag=topics
Significant factors
- Expertise
- Experience
- affinity
Proxy metrics
- credibility (expertise)
- Usage (experience)
Expertise Algorithm
Person -> topic

Usage (Experience) Algorithm
Person -> topic
何回レヴューをしたか.高い評価のタグがあるか

Affinity Algorithm
Person -> Person
両方がレビューしたアイテムをカウントして使う

Usage (Experience) Score form del.icio.us data
Revyu.comから得られなかった関係だけを追加.スコアを少し上げる.

Q:ユーザのIDの統合は?
A:今ところ,ユーザに聞いている(はあ?)

*****
Making the Semantic Web a Reality through Active Semantic Spaces (Pos)
Yihong Ding, ying ding, David Embley, Omair Shafiq and Martin Hepp

Active Smanci Space (Aspace)
- Publication blog
- Request Blog
- Aspace Agent

ユーザが探し物とか質問をReblogに書く
オントロジーでアノテートされる.
ASpace Agentが探し回る?
ユーザが気に入ったらPublogにかく

これもアイデアだけ,実装はない.
これもMyOntology Projectのプランみたいなものか.

こういうクローズの世界を考えるのはWeb2.0じゃないでしょうが!

*****
Searching Community-built Semantic Web Resources to Support Personal Media Annotation
Annett Mitschick, Ronny Winkler and Klaus Meisner

personal multimedia のコレクションをいかに管理するかという話.

*****
Combining Social and Semantic Metadata for Search in a Document Repository (Pos)
Christoph Herzog, Michael Luger and Marcus Herzog

semantic annotationつきのdocument repository

*****
議論でおもしろかったこと
・XSSLT+XMLでは複数のXMLを一緒に処理するのが大変.でもRDF+SPARQLならそんなことは気にしなくいいからすばらしい

*****
もうかなり忘れています...