Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

ヨーロッパ3カ国周遊(?)その2(ESWC2007)

2007年09月13日 | 会議参加記
過去の記録の続きです.

****
さて,DFKI訪問が終わって,フランクフルト経由でインスブルックに向かいました.フランクフルトからインスブルックはプロペラ機で小一時間,あっという間につきます.インスブルックの空港は市内から非常に近い,市電でいけるぐらいの距離です.
インスブルックはとっても風光明媚なところで安らぐところです.治安もいい.バルセロナでの緊張感とはうってかわってリラックス状態です.そのせいか,M氏はPCのはいったバックをレストランにおいていってしまったり(数時間後ちゃんとあった),僕はホテルの部屋をロックアウトされてしまったりと逆に危なかったですね.

さてESWC(European Semantic Web Conference)はこれで3回連続の参加です.だいぶ慣れてきました.

以下はほとんど会議中のメモそのままですが,ご参考までにだらだらと載せておきます.

本会議のInvited Talkは4件あったが、どれもかなり実際的な話で、研究系の人には不満があったようだが、私はそれなりに楽しめた。
Stefano CeriはWebMLと呼ばれるモデルに基づくWebのauthoring/managementをproduct (WebRatio)として展開しているそうだ。
Ning Zhong (鍾 寧)氏はWeb Intelligence+Brain Informaticsの話であったが、よくわからなかった。
Georg Gottlobは自らのLixtoというソフトの説明。WebページをLogicalにつくり管理する仕組みで、Productとしては結構使えそうな雰囲気。しかし、Talkはほとんどその使い方の説明であった。

最後のYahoo!のRon Brachmanの話(Emerging Sciences of the Internet: Some New Opportunities)は面白かった。まず古いcomputer scienceから今必要とされるものとして
- ”finding” science and systems
- Community Science and systems
- Algorithmic advertising
- Computational micro-economics
- Media experiences
- Data science
が必要といった。まずfinding scienceとしては
- More than just classical IR
- - Structure
- - intent
- - context
- Moving to an information supply model form query-based retrieval
- Social Search
が必要である。Search Engineでいえば、第1世代は単語レベル、第2世代はリンク、そして第3世代は意味解析と複数ソースの統合などになると。ユーザのニーズも情報提示(informational)、誘導(navigational)では済まなく、何かをしたい(transactional)になっている。たとえば、サービスアクセス、ダウンロード、ショッピング。
Community Scienceでは、いわゆるWeb 2.0的Social MediaとDistributed/Collaborative systemsがキーになる。彼はCommunityを4つに分けている。Social networks (communication & Expression, e.g., facebook MySpace), Knowledge Collectives (find answers & acquire knowledge, e.g., Wikipedia, Flicker), Enthusiasts/Affinity (Hobbies & Interests, e.g., Fancy Sports, Custom Autos), Marketplaces (trusted transactions, e.g. eBay, Craigslist)。新しいSearchとしてこういったcommunityを探すsearchであろう。例:DBLife Portal。
広告に関しては名せりふ「Don’t forget advertising: it fuels the machine」。
大きな目標としては Towards a science of aggregated organic knowledgeであって、具体的には
- ExtractionからIntegration/rationalizationへ
- Wrapper induction
- Reuse/adaptation of ontologies
- Meaning in an inconsistent world
- Learn from projects like Cyc
- Rule of background knowledge – how to avoid “AI-complete” problem?
であると。よいInsightがあるTalkで、現状と金未来がよくまとまっていると思う。

Workshop1つ目はScripting Semantic Web。これは普通の研究ワークショップとぜんぜん雰囲気が違って、hackerの集まりのような感じ。若い人ばかりで、プレゼンもコードをみせてみんなフムフムとうなづくというような進行だった。私の頭ではちょっとついていけないかなと。以下は気になった点のメモ。
****
Gregory Williams
Extensible SPARQL Functions With embedded JavaScript

SPARQLの中に実行可能なScriptを埋め込む
例:距離の計算とか
そのかわり,signatureをつけてmaluseを防ぐ

*****
Michael Hausenblas, Wolfgang Slany, Danny Ayers
A Performance and Scalability Metric for Virtual RDF Graphs

RDF処理がScalableかどうかの議論.
RDFの使い方:
model-compliant (memory/store): ...
model-compliant (standalone):RDF/XML, N3, triple
model-compliant (embedded):semantic wiki, RDFa, eRDF
non-compliant: XML, microformats, Web APIs (Google map...), RDBS

*****
Christian Bizer, Richard Cyganiak, Tobias Gauss
The RDF Book Mashup: From Web APIs to a Web of Data

Linked dataアプローチ
→APIをRDFとしてアクセスできるようにする.

AmazonのAPIをRDF化
Semantic Web browser
OpenLink RDF Browserの利用

DBpediaでも利用

Semantic Web crawlers
- SWSE
- Aitgist
- Swoogle

メタ情報流通のいくつかの方法
・データを作る
-- Linked data
-- APIのRDF化(ダイナミック)
-- SIOCでRDF記述
・データを集める
-- PDF radar(ユーザがみたものをbrowserがPing Serverに教える)
-- PTSW (Ping The Semantic Web)
-- indexつくり
・データを使う
-- ActiveRDF (Desktopでプログラミング)

メタデータのMushUp
-- メタデータは標準もなく孤島になっている.

*****

Workshop 2つ目はBridging the Gap between Semantic Web and Web 2.0

*****
myOntology: The Marriage of Ontology Engineering and Collective
Intelligence
Katharina Siorpaes and Martin Hepp
http://www.kde.cs.uni-kassel.de/ws/eswc2007/proc/TheMarriage.pdf

Wiki-based light-weight ontology mananagement
easy-to-use, media-rich, collaborative, community-driven ontology
building
MyOnology project was just started October 2006.
http://www.myontology.org/
The system is attractive but probably still under construction
Wikiを使った共同的オントロジー

*****
Towards Scientific Collaboration in a Semantic Wiki (Pos)
Christoph Lange

科学におけるwikiの利用.科学における仮説とか理論もタグ化する.野望的:-).いまはまだNGでは将来はここまでいくんでしょうね.

*****
Organizing Resources on Tagging Systems using T-ORG
Rabeeh Ayaz Abbasi, Steffen Staab and Philipp Cimiano

tagの構造化
Googleのsnippetから言語パターンで抽出 ex. such as,
コンテクストの利用(resource context, tag context, group context)

ダヌシカくんのweb miningとMikaの3部グラフの合体みたいなものか.
それほど包括的ではない.まあやってみましたという感じ.

*****
Folksonomies, the Semantic Web, and Movie Recommendation
Martin Szomszor, Ciro Cattuto, Harith Alani, Andrea Baldassarri, Vittorio Loreto, Vito D. P. Servedio and Kieron O'Hara

recommendation systemはそのシステムでモデル化したものだけを利用している.
もっと外の情報をつかう。
IMDB (Internet Movie Database)
social tag
NetFlix (online DVD rental service in the US)
rating from 1 to 5
この会社はこの会社のデータの推薦を向上したらお金をくれるそう
オントロジー化
Tag-cloudのrating化
結果は重み付けをしない方法が一番良かった(なぜかは不明).
Future Work
- demographic-based Rec. (age, gender ...) もやりたいそう

*****
Revision and Co-revision in Wikipedia
Ulrik Brandes and Juergen Lerner

Revisionに注目
- Co-revision similarity
- co-author similarity
Wikipedia: 23GB 1.5 Million pages
similarity computation for 2,000 edits (-> 1,241 pages)
editを週ごとにグラフ化
- G W. Bushが最高 :-)
- いろいろBurstのパターンがみられる
Bushはだんだん上がって,急に低レベルに
Hurricane Katrinaは急に上がる
Co-revisionをcovarianceで計算する
- normalizeする
- 特定のパターンがあると意味がある
- 普通(全体のパタンと同じような)だと意味がない
Co-author similarity of pages
- すこし関連性がみられる

*****
FolksOntology: An Integrated Approach for Turning Folksonomies into
Ontologies
Celine Van Damme, Martin Hepp and Katharina Siorpaes
いろいろなonline resourceを組み合わせて,オントロジーを作る
Wikipedia, WorldNet, Loe directoraries
かなり大きな風呂敷
tag->concept (Wikipedia)
tag->synonym (Wikipedia disambigous page, WorldNet)
...

まだはじめたばかりのよう.実際にはまでデータを使ってやっているわけでない
実際にどうclean upしていくかの方法論がないので,このままで難しいそう.
それぞれのごみデータや違いをどこで吸収するのか.

先のMyOntology projectのうち

*****
Bridging the Gap Between Folksonomies and the Semantic Web: An Experience Report
Sofia Angeletou, Marta Sabou, Lucia Specia and Enrico Motta

tagをSemantic Webのオントロジーで構造化する.
そういったことを小さなスケールで実験した.

*****
Computing Word-of-Mouth Trust Relationships in Social Networks from
Semantic Web and Web2.0 Data Sources
Tom Heath, Enrico Motta and Marian Petre

FOaf-based social network
revyu.com delicio.us
tag=topics
Significant factors
- Expertise
- Experience
- affinity
Proxy metrics
- credibility (expertise)
- Usage (experience)
Expertise Algorithm
Person -> topic

Usage (Experience) Algorithm
Person -> topic
何回レヴューをしたか.高い評価のタグがあるか

Affinity Algorithm
Person -> Person
両方がレビューしたアイテムをカウントして使う

Usage (Experience) Score form del.icio.us data
Revyu.comから得られなかった関係だけを追加.スコアを少し上げる.

Q:ユーザのIDの統合は?
A:今ところ,ユーザに聞いている(はあ?)

*****
Making the Semantic Web a Reality through Active Semantic Spaces (Pos)
Yihong Ding, ying ding, David Embley, Omair Shafiq and Martin Hepp

Active Smanci Space (Aspace)
- Publication blog
- Request Blog
- Aspace Agent

ユーザが探し物とか質問をReblogに書く
オントロジーでアノテートされる.
ASpace Agentが探し回る?
ユーザが気に入ったらPublogにかく

これもアイデアだけ,実装はない.
これもMyOntology Projectのプランみたいなものか.

こういうクローズの世界を考えるのはWeb2.0じゃないでしょうが!

*****
Searching Community-built Semantic Web Resources to Support Personal Media Annotation
Annett Mitschick, Ronny Winkler and Klaus Meisner

personal multimedia のコレクションをいかに管理するかという話.

*****
Combining Social and Semantic Metadata for Search in a Document Repository (Pos)
Christoph Herzog, Michael Luger and Marcus Herzog

semantic annotationつきのdocument repository

*****
議論でおもしろかったこと
・XSSLT+XMLでは複数のXMLを一緒に処理するのが大変.でもRDF+SPARQLならそんなことは気にしなくいいからすばらしい

*****
もうかなり忘れています...

ヨーロッパ3カ国周遊(?)その1(Yahoo!, AIFB, DFKI)

2007年09月04日 | 会議参加記
6月にスペイン、ドイツ、オーストリアを2週間ほどで回りました。発端はオーストリアでの会議参加でしたが、せっかくならというのでいくつかの研究所を回りました。
以下はそのときの記録です。研究所では出張が終わると出張報告を書かないといけないのですが、それが元です。書いているうちに報告書に書かない(書けない?ってほどの話はないけど)こともでてきたいので、こちらに書いておきます。

*****

今回は(というか今回も)、産総研のM氏と研究所訪問+国際会議ツアーにいきました。いつもと違うのは、同じく産総研のN氏とN氏(なんだかわかりませんね、これじゃ)、それから現在DFKI滞在中のM君が一緒の大部隊だということです。

まずバルセロナにあるYahoo! Research Europeにいきました。ここにはVUでDをとったばっかりの友人がいるので、そのつてできました。こちらか1時間程度のプレゼンテーションを行いました。その後、いくつかの研究をみせてもらい、議論を行った。この研究所は比較的新しく、ここ1年ぐらいで研究スタッフが整備されたということであった。まあこういう研究所なので全貌はよくわからない(教えてくれない?)のですが、これからさらに拡張して、ヨーロッパでの拠点として機能するそうです。

ちなみにYahoo! Research Bercelonaは実は駅舎の中にありました。とまっていたPark Hotelのすぐ近くだったんですが、迷いました。まさか、駅舎の中にあるとは思わなかったので。

スペインは昨年のサンセバスチャンに次いで2回目です。さすが大都市で、さっそくM君がトリックプレイにひっかったそうです。鳥の糞をくっつけられました。でもそのまま逃走?したので、なにもなかったそうでよかった。
スペインの居酒屋のつまみは日本人にあって大変おいしい。沢山並べてあって一皿一皿勝手にとって食べる。回転しない回転寿司といったところでしょうか。で、会計時にちゃんと覚えているのがえらい。


次にAIFB(Institute of Applied Informatics and Formal Description Methods)を訪問した。AIFBはカールスルーエ大学の物理的にも組織的にも内部にあり、研究スタッフや学生も大学も兼ねているようであるが、資金的には別で基本的に外部資金を元に運営されている。ここではProf., Dr. Rudi Studerのグループの研究内容、研究体制を研究員のDr. Pascal Hitzlerから聞き、議論を行った。StuderのグループはAIFBの研究チームとFZI Research Center for Information Technologiesという別の研究グループ、さらには ontoprise GmbHという会社の3つのグループを率いて、各種のプロジェクト資金をえて運営している。RudiのグループはESWCの準備とプロジェクトの発表会を来週に控え、超忙しい状態だったよう(これはあとのDFKIも同様)。面白かったのが、研究遂行体制で、多数のプロジェクトをもっていて、人員は基本的にプロジェクトごとに割り振られているわけだが、それとは別に研究トピックスごとにリーダーとグループのようなものがあって、共通のトピックスの推進はそこでしているらしい。たとえば推論技術は推論技術に関係するプロジェクト横断型で進めるといったぐあい。これはよく会社のマネージメントで言う縦糸と横糸によるマネージメントと同じですが、これを研究組織できちんとやっているのはすばらしい。

夜はなぜかカールスルーエでDFKIのProf. Anthony Jamesonと夕食。彼は忙しくて明日DFKIで会えないということで、わざわざここで会ってくれた。季節柄ドイツ人が大好きという白アスパラガスを食べる。確かにおいしいのだが、これを10本近く食べるとさすがに飽きる。


次にDFKI(The German Research Center for Artificial Intelligence)を訪問。ここでは所長のProf. Wahlsterが直々に対応してくれた。M君によるとこれは異例のこと。しかも昼を一緒に食べる予定だった。にもかかわらずM君の手違いにより、なんとすっぽかし。M君と一緒に学生食堂で食べている間、所長はじっと待っていたそう。これはやばい。しかし、彼はとても丁重にもてなしてくれました。感謝。

彼はNIIのInternational Advisory Boardのメンバーでもある。ちゃんと彼のWWWページに書いてある。以前は産総研のサイバーアシストセンターのそれでもあった。なので、メンバーはみな関係している。ということもあって、我々のTalkの前ではちゃんとNIIとDFKIの関係を説明してくれたりした。我々はまた1時間ぐらい話をした。このときは30人ぐらいきていて、結構まじめに聞いてくれて、質問もあった。

あとはひたらすらデモのオンパレード。最初は画像処理と地理情報の組み合わせのデモ。技術的にはたいしたことないが、これをBMWのバイクの載せるという。これは見てみたかったが、プロジェクトの発表会が来週あるというので、そっちへもっていったそう。残念。
それから次々デモ。M君もはいっているSharedLifeのデモ。SharedLifeプロジェクトではリアル世界をセンサで検知して、それをうまく組み合わせて人のサポートをするというプロジェクトらしい。CDを好みに合わせてリアルに注目させてくれるとか、キッチンでの作業をセンスしたりシーンごとに自動録画したりして、キッチンでの作業をサイバー世界に取り込んでくれ、かつサジェストしてくれたりする。
同様のコンセプトで、RFID、赤外線をセンサーとしてPDAを端末にしてルートのサジェストをしてくれるシステムとかもあった。

あとで述べるようにプロジェクトベースでおこなっているせいか、画期的なシステムというよりは既存の技術で確実な進捗をするシステム作りといった印象。実用システムと研究システムの中間ぐらいで、確かに実用システムとしては効果が未知数で投資しずらい、研究システムとしては研究者自身がつくるには面白みがないあたりを堅実につくると。でもそれも研究と実用を結びつけるリンクとして重要だなと思いました。この辺の研究開発のコントロールも日本の研究組織ではあまりできていないので参考になると思いました。

DFKIは先のAIFBと同様で基本的に外部資金で運営されている研究所だそうです。なので、多数のプロジェクトに参画している。Wahlster氏はそうとうやり手でいまどんどん研究所を拡張しているらしい。つい先日はリコーとの共同の研究所を新たに立ち上げたとか、宇宙関係の研究を新たにはじめたとか、相当の勢いである。

これで研究所訪問はおしまい。

また再開します

2007年09月04日 | もろもろ
6,7月と出張とかがあってついついこのブログを更新しわすれていました。いつも出張期間中に書いたりしていたのですが、それすら怠っていました。また少しづつ近況を書くことにします。