WWW2009でMadridに来ています。
思った以上に寒い。
まずLinked Data on the Web Workshop 2009 (LDOW2009)なるものに出ています。
http://events.linkeddata.org/ldow2009/
それを聞きながらちょっとした感想を書きます。
いつもあとでメモを整理して書こうと思うと遅くなってしまうので、メモをオンラインでみせることにします(ああ怠け者)。
こういうのはtwitterでやったほうがいいだろうけど、ちょっとまだなれてないもので、ブログでやっています。
***********
WWW2009 workshop:Linked Data on the Web (LDOW2009)
机上には、Nodalities -The Magazine of the Semantic Web-なるものがおかれ
る。
http://www.talis.com/nodalities
BBCがデータを公開したという話やlinked library dataなる記事が並ぶ。これ
は面白そう。
イントロではTBLがちょっと挨拶。
オバマのアドミニストレーションに期待する云々
*** Representing Linked Data as Virtual File Systems (Bernhard Schandl)
Linked dataをfile systemのようにみせる。subclassがdirectoryとかね。
アイデアが面白い。
でもメリットはなんだろう?
SemanticMediaWikiとも共通性がある。どっちがいい?
Session 1: Linked Data Application Architectures
*** Explorator: A tool for exploring RDF data through direct
manipulation (Samur Araujo, Daniel Schwabe)
いろいろなRDFデータベースをロードして操作できるシステム。
*** Faceted Views over Large-Scale Linked Data (Orri Erling, Ivan
Mikhailov)
Web
- Web 1.0: publishing for All
- web 2.0: Commentary for All
- web 3.0: analysis of All
The challenge:
- scale of instance data 10^9-10^11 triples
- scale of ontology 100,000's classes
- faceted browsing, text and structure
- deployment of provisioning
Virtuoso 6
Runtime taxonomy and identity
Entity Ranking
Entity Name Service
salabilityがいいらしい。
*** Linked Data Authoring for Non-Experts (Markus Luczak-Roesch, Ralf
Heese)
素人に書けるLDauthoring
loomp.org
RAP -REF2RDFa - One click annotator (XHTML+RDFa)
ほんとに使えれば役立ちそう。
*** Linking and Navigating Data in a P2P File-Sharing Network (Alan Davoust, Babak Esfandiari)
P2Pスタイルでtrippleが書けてpublishできるツール
Session 2: Applying Linked Data in different Domains
*** Interlinking Distributed Social Graphs (Matthew Rowe)
異なるsocial graphのつなぎ方の考察と実験
*** Publishing XBRL as Linked Open Data (Roberto Garcia, Rosa Gil)
金融データのXBRLをLODとしてpublishするという話。
*** Bringing the "Thesaurus for Economics" on to the Web of Linked Data
(Joachim Neubert)
経済の図書館のシソーラスの話。
Gernam National Library of Economics(ZBW)がSTWを制定
The “Thesaurus for Economics“ (“Standard Thesaurus Wirtschaft“, STW)
SKOSに変換。それをRDFとして公開して、リンクのハブに。
さすがによくわからない。さすがドイツは体系化に真剣であることが伝わってく
る。
*** Adding eScience Assets to the Data Web (Herbert Van de Sompel, Carl Lagoze, Michael Nelson, Simeon Warner, Robert Sanderson, Pete Johnston)
sochalry communicationはPaper単位ではもはや駄目。
OAI: Open Archives Initiative
ORE: Object reuse and exchange:
- authoritative resource maps
- expressing non-protocal-based URIs
- Aggregated resources is itself an aggregation
- Proxy:aggregated resource in context of an aggregation
Adoption
- OREchem
- NSF dataset
- Eu funded DRIVER 2, Europeans, EDLnet
http://driver2.dans.knaw.nl/demonstrator.html
- Oxford Univ.
- ORE Word Plug-in (MS)
- Research output Repository Platform (MS research)
http://research.microsoft.com/en-us/projects/zentity/
- JSTOR to bring resource map for its entire journal collection in
production
Aggregationをちゃんと扱えるようにしようとする実践的報告。
Formatの進化としてはたいしたことはないのだけど、実際に使われるようになっ
ているということが重要。
*** Enabling Tailored Therapeutics with Linked Data (Anja Jentzsch,
Oktie Hassanzadeh, Chris Bizer, Bo Andersson, Susie Stephens)
薬データ drung dataの話。LODD (Linked Open Drug Data)
Link type
- identity
- link discovery
-- string matching
-- smeantic matching
--- Many drungs and diseases have multiple names
Business Use Cases
- http://esw.w3.org/topic/HCLSIG/LODD/Business
これも実践的報告。
実際にmultiple sourceのデータがリンクされて使われているようになっている
という話。
うーん、すごい。
Session 3: Data Linking and Fusion
*** Managing Co-reference on the Semantic Web (Hugh Glaser, Afraz Jaffri,
Ian Millard)
co-referenceをマネージするシステムCRSの提案。
Problem
- Significant overlap of people, publication, etc
Co-reference Resolution Service
- Manage co-reference knowledge as first class entity
- When new co-reference detected, merge bundle together
- Deprecation of old URIs
- Republishing of co-rerefence / equivalence data
Ex: language of the World
CRS "global closure
話としてはCRSはわかるが、universalに実現できるのか。
*** Linked Movie Data Base (Oktie Hassanzadeh, Mariano Consens)
映画データの統合の話。内容的には映画を例にとってLinkage問題を議論してい
る。
LinkMDB in LOD cloud
Linkage Challenges
- Different names for the same movie
-- alternative titles
-- different style
-- Non-English title
- same titles
Linkage metadata
- MD about the source of the links
-- where do they come form
-- how we can trust
-- what technique is used for linkage
-- if the linkage is based on record linkage, what is the similarity /
confidence score
Linkageメタデータをどう定義するかは面白い話。
*** Silk - A Link Discovery Framework for the Web of Data (Julius Volz, Christian Bizer, Martin Gaedke, Georgi Kobilarov)
challenge
リンケージのためのフレームワークの提案。
- a general-purpose link discovery framework is needed
The Silk Link discovery framework
*** A Data Mashup Language for the Data Web (Mustafa Jarrar, Marios Dikaiakos)
Yahoo! Pipesのように簡単なデータ操作がしたい。
解決法:queryをtreeとみなしinteractiveに構造を指定していく
problem
- how to allow end-users formulae queries over structured data assuming
that
-- ther user does not know the schema
-- there no offline or inline schema
-- multiple resources
-- expressive
-- intuitive
MashQL: a general structured-data retrieval solution
*** Towards Data Fusion in a Multi-ontology Environment (Andriy Nikolov, Victoria Uren, Enrico Motta)
Challenge:
- Instance matching
- Schema heterogeneity
- employ automatic schema matching
Schema matching
- many existing tools (OAEI)
- Lily
- Falcon-AO
- CIDER
KnoFuss: Designed for the corporate knowledge management scenario
Session 4: Describing Data on the Web
*** A Query-Driven Characterization of Linked Data (Harry Halpin)
linked dataの統計的分析
大多数はwikipedia由来
3/4は303 redirect
blank nodeはほとんどない
言語はrdf 45%, rdfs 41%, owl 14%
*** Interlinking Multimedia: How to Apply Linked Data Principles to Multimedia Fragments (Michael Hausenblas, Raphael Troncy, Tobias Buerger, Yves Raimond)
Multimediaの部分をどうlinked data化するか
これは規格として重要ですが、まあどれだけ採用されるかですよね。
*** Provenance Information in the Web of Data (Olaf Hartig)
データの由来情報をどう扱うか
Web data provenance -> data creation + data access
provenance model: Actor, Execution, Artifact, Specialization, Universal
Attribute
*** An Ontology of Resources for Linked Data (Harry Halpin, Valentina Presutti)
linked dataの基本的が概念を定義するオントロジーの提案
a simple hub OWL ontology
Identity and Reference on the Web (IRW)
Identification and Reference
Resource type: IR and nIR(non-IR)
Access and Redirection: redirectTo, Accesses
Halpinなどのcoolな提案になっているが、どう利用するのだろうか。
*** Describing Linked Datasets (Keith Alexander, Richard Cyganiak, Michael Hausenblas, Jun Zhao)
巨大化するLODをどう記述するか
proposal: voiD a formal description for LOD
- what a dataset is about
- how and under which conditions to access it
- how the dataset is interlinked
- how to discover the metadata
dataset and linkset
*** DING! Dataset Ranking using Formal Descriptions (Nickolai Toupikov,
Juergen Umbrich, Renaud Delbru, Michael Hausenblas, Giovanni Tummarello)
LODのランキング
General idea: Web Ranking algorithm + dataset ranking
****まとめ*****
最大で70人以上はいたでしょうか。大変盛況です。
最初のセッションでは具体的なツールの話、次のセッションでは各分野でのLinked Dataの現在の浸透状況が報告された。TBLも冒頭でいっていたがLinked dataは今のところWebのほんの一部でしかない。しかし、各分野での試みからWebからLinked Data化されたときのメリットというのがみえるようになったと思う。
異なるサイトのlinked dataが結合されることでlinked dataのありがたみが発揮される。mashedupでもこれは不可能ではなかった。しかし、それはどれかの発表であったように、いったん塀を登っておりるような作業を通じて可能になる(WebAPIを使いこなすことが必要)。Linked Dataはこ塀を低く向こうがみえるようにするよ
うなものである(生け垣か)。
つまり、その肝はリンケージである。それをどうするかが3番目のセッションであった。メタデータ化、自動化やフレームワーク提案などがあったが、ただ、ここはエレガントな解が現状あるわけではない。そこはlinked dataの弱いところで逆に研究テーマである。
最後のセッションはLOD記述のまだ足らないところの議論である。LODのメタデータである。LOD自体がだいたいがメタデータなので、メタメタデータともいえるが、やぱりデータを活用するには必要となるのだろう。
思った以上に寒い。
まずLinked Data on the Web Workshop 2009 (LDOW2009)なるものに出ています。
http://events.linkeddata.org/ldow2009/
それを聞きながらちょっとした感想を書きます。
いつもあとでメモを整理して書こうと思うと遅くなってしまうので、メモをオンラインでみせることにします(ああ怠け者)。
こういうのはtwitterでやったほうがいいだろうけど、ちょっとまだなれてないもので、ブログでやっています。
***********
WWW2009 workshop:Linked Data on the Web (LDOW2009)
机上には、Nodalities -The Magazine of the Semantic Web-なるものがおかれ
る。
http://www.talis.com/nodalities
BBCがデータを公開したという話やlinked library dataなる記事が並ぶ。これ
は面白そう。
イントロではTBLがちょっと挨拶。
オバマのアドミニストレーションに期待する云々
*** Representing Linked Data as Virtual File Systems (Bernhard Schandl)
Linked dataをfile systemのようにみせる。subclassがdirectoryとかね。
アイデアが面白い。
でもメリットはなんだろう?
SemanticMediaWikiとも共通性がある。どっちがいい?
Session 1: Linked Data Application Architectures
*** Explorator: A tool for exploring RDF data through direct
manipulation (Samur Araujo, Daniel Schwabe)
いろいろなRDFデータベースをロードして操作できるシステム。
*** Faceted Views over Large-Scale Linked Data (Orri Erling, Ivan
Mikhailov)
Web
- Web 1.0: publishing for All
- web 2.0: Commentary for All
- web 3.0: analysis of All
The challenge:
- scale of instance data 10^9-10^11 triples
- scale of ontology 100,000's classes
- faceted browsing, text and structure
- deployment of provisioning
Virtuoso 6
Runtime taxonomy and identity
Entity Ranking
Entity Name Service
salabilityがいいらしい。
*** Linked Data Authoring for Non-Experts (Markus Luczak-Roesch, Ralf
Heese)
素人に書けるLDauthoring
loomp.org
RAP -REF2RDFa - One click annotator (XHTML+RDFa)
ほんとに使えれば役立ちそう。
*** Linking and Navigating Data in a P2P File-Sharing Network (Alan Davoust, Babak Esfandiari)
P2Pスタイルでtrippleが書けてpublishできるツール
Session 2: Applying Linked Data in different Domains
*** Interlinking Distributed Social Graphs (Matthew Rowe)
異なるsocial graphのつなぎ方の考察と実験
*** Publishing XBRL as Linked Open Data (Roberto Garcia, Rosa Gil)
金融データのXBRLをLODとしてpublishするという話。
*** Bringing the "Thesaurus for Economics" on to the Web of Linked Data
(Joachim Neubert)
経済の図書館のシソーラスの話。
Gernam National Library of Economics(ZBW)がSTWを制定
The “Thesaurus for Economics“ (“Standard Thesaurus Wirtschaft“, STW)
SKOSに変換。それをRDFとして公開して、リンクのハブに。
さすがによくわからない。さすがドイツは体系化に真剣であることが伝わってく
る。
*** Adding eScience Assets to the Data Web (Herbert Van de Sompel, Carl Lagoze, Michael Nelson, Simeon Warner, Robert Sanderson, Pete Johnston)
sochalry communicationはPaper単位ではもはや駄目。
OAI: Open Archives Initiative
ORE: Object reuse and exchange:
- authoritative resource maps
- expressing non-protocal-based URIs
- Aggregated resources is itself an aggregation
- Proxy:aggregated resource in context of an aggregation
Adoption
- OREchem
- NSF dataset
- Eu funded DRIVER 2, Europeans, EDLnet
http://driver2.dans.knaw.nl/demonstrator.html
- Oxford Univ.
- ORE Word Plug-in (MS)
- Research output Repository Platform (MS research)
http://research.microsoft.com/en-us/projects/zentity/
- JSTOR to bring resource map for its entire journal collection in
production
Aggregationをちゃんと扱えるようにしようとする実践的報告。
Formatの進化としてはたいしたことはないのだけど、実際に使われるようになっ
ているということが重要。
*** Enabling Tailored Therapeutics with Linked Data (Anja Jentzsch,
Oktie Hassanzadeh, Chris Bizer, Bo Andersson, Susie Stephens)
薬データ drung dataの話。LODD (Linked Open Drug Data)
Link type
- identity
- link discovery
-- string matching
-- smeantic matching
--- Many drungs and diseases have multiple names
Business Use Cases
- http://esw.w3.org/topic/HCLSIG/LODD/Business
これも実践的報告。
実際にmultiple sourceのデータがリンクされて使われているようになっている
という話。
うーん、すごい。
Session 3: Data Linking and Fusion
*** Managing Co-reference on the Semantic Web (Hugh Glaser, Afraz Jaffri,
Ian Millard)
co-referenceをマネージするシステムCRSの提案。
Problem
- Significant overlap of people, publication, etc
Co-reference Resolution Service
- Manage co-reference knowledge as first class entity
- When new co-reference detected, merge bundle together
- Deprecation of old URIs
- Republishing of co-rerefence / equivalence data
Ex: language of the World
CRS "global closure
話としてはCRSはわかるが、universalに実現できるのか。
*** Linked Movie Data Base (Oktie Hassanzadeh, Mariano Consens)
映画データの統合の話。内容的には映画を例にとってLinkage問題を議論してい
る。
LinkMDB in LOD cloud
Linkage Challenges
- Different names for the same movie
-- alternative titles
-- different style
-- Non-English title
- same titles
Linkage metadata
- MD about the source of the links
-- where do they come form
-- how we can trust
-- what technique is used for linkage
-- if the linkage is based on record linkage, what is the similarity /
confidence score
Linkageメタデータをどう定義するかは面白い話。
*** Silk - A Link Discovery Framework for the Web of Data (Julius Volz, Christian Bizer, Martin Gaedke, Georgi Kobilarov)
challenge
リンケージのためのフレームワークの提案。
- a general-purpose link discovery framework is needed
The Silk Link discovery framework
*** A Data Mashup Language for the Data Web (Mustafa Jarrar, Marios Dikaiakos)
Yahoo! Pipesのように簡単なデータ操作がしたい。
解決法:queryをtreeとみなしinteractiveに構造を指定していく
problem
- how to allow end-users formulae queries over structured data assuming
that
-- ther user does not know the schema
-- there no offline or inline schema
-- multiple resources
-- expressive
-- intuitive
MashQL: a general structured-data retrieval solution
*** Towards Data Fusion in a Multi-ontology Environment (Andriy Nikolov, Victoria Uren, Enrico Motta)
Challenge:
- Instance matching
- Schema heterogeneity
- employ automatic schema matching
Schema matching
- many existing tools (OAEI)
- Lily
- Falcon-AO
- CIDER
KnoFuss: Designed for the corporate knowledge management scenario
Session 4: Describing Data on the Web
*** A Query-Driven Characterization of Linked Data (Harry Halpin)
linked dataの統計的分析
大多数はwikipedia由来
3/4は303 redirect
blank nodeはほとんどない
言語はrdf 45%, rdfs 41%, owl 14%
*** Interlinking Multimedia: How to Apply Linked Data Principles to Multimedia Fragments (Michael Hausenblas, Raphael Troncy, Tobias Buerger, Yves Raimond)
Multimediaの部分をどうlinked data化するか
これは規格として重要ですが、まあどれだけ採用されるかですよね。
*** Provenance Information in the Web of Data (Olaf Hartig)
データの由来情報をどう扱うか
Web data provenance -> data creation + data access
provenance model: Actor, Execution, Artifact, Specialization, Universal
Attribute
*** An Ontology of Resources for Linked Data (Harry Halpin, Valentina Presutti)
linked dataの基本的が概念を定義するオントロジーの提案
a simple hub OWL ontology
Identity and Reference on the Web (IRW)
Identification and Reference
Resource type: IR and nIR(non-IR)
Access and Redirection: redirectTo, Accesses
Halpinなどのcoolな提案になっているが、どう利用するのだろうか。
*** Describing Linked Datasets (Keith Alexander, Richard Cyganiak, Michael Hausenblas, Jun Zhao)
巨大化するLODをどう記述するか
proposal: voiD a formal description for LOD
- what a dataset is about
- how and under which conditions to access it
- how the dataset is interlinked
- how to discover the metadata
dataset and linkset
*** DING! Dataset Ranking using Formal Descriptions (Nickolai Toupikov,
Juergen Umbrich, Renaud Delbru, Michael Hausenblas, Giovanni Tummarello)
LODのランキング
General idea: Web Ranking algorithm + dataset ranking
****まとめ*****
最大で70人以上はいたでしょうか。大変盛況です。
最初のセッションでは具体的なツールの話、次のセッションでは各分野でのLinked Dataの現在の浸透状況が報告された。TBLも冒頭でいっていたがLinked dataは今のところWebのほんの一部でしかない。しかし、各分野での試みからWebからLinked Data化されたときのメリットというのがみえるようになったと思う。
異なるサイトのlinked dataが結合されることでlinked dataのありがたみが発揮される。mashedupでもこれは不可能ではなかった。しかし、それはどれかの発表であったように、いったん塀を登っておりるような作業を通じて可能になる(WebAPIを使いこなすことが必要)。Linked Dataはこ塀を低く向こうがみえるようにするよ
うなものである(生け垣か)。
つまり、その肝はリンケージである。それをどうするかが3番目のセッションであった。メタデータ化、自動化やフレームワーク提案などがあったが、ただ、ここはエレガントな解が現状あるわけではない。そこはlinked dataの弱いところで逆に研究テーマである。
最後のセッションはLOD記述のまだ足らないところの議論である。LODのメタデータである。LOD自体がだいたいがメタデータなので、メタメタデータともいえるが、やぱりデータを活用するには必要となるのだろう。