Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

DC2009参加記

2009年11月08日 | 会議参加記
すでにずいぶん前の話になってしまいましたが、DC2009 (In'tl conf on Dublicon and Metada data applications)に出席してきました。場所はソウルの国立図書館。挨拶は国立図書館のChief Executive。

僕はこの会議には実質的に初めてです。最初のアナウンスにあったようにこの会議は研究者とprofessonalの会議。単に研究会議じゃないですね。

追記:DC2009 Proceedingsはこちら
なお、日本から筑波大学から杉本重雄氏、永森 光晴氏他、国会図書館から2名などが出席していた。日本からは発表で杉本氏のグループ、ポスターでNII(大向、武田)、立命館大学の木村 文則氏らのグループ。

今回はサブタイトルが"Semantic Interoperability of Linked Data"です。Semantic Web研究者としてはこれは興味があります。図書館でどうLinked Dataが使われるのか、どうなんでしょうか。

全体の感想としては、DCMIの活動と図書館系の人のSemantic Webへの取り組みがよくわかったと思います。DCMIとは図書館の情報、人とファシリティをいわばWeb化する活動といっていいのかもしれません。図書館にある情報をWeb化する、それはある意味、至極当然でまあ異論のないところでしょう。一方、図書館員や図書館がWebをメタデータ化するという活動もあるわけです。これは一見無関係のようにみえますが、本や論文が電子化される時代においては、本・論文とWeb上の情報に明確な境界線はありません。その点では同じです。ただ誰がやるかというところで違いが出てきます。機関リポジトリがよい例でしょう。機関リポジトリは大学における情報蓄積、情報公開が目的ではありますが、一方図書館員や図書館というファシリティの活動によるWeb情報公開でもあるわけです。この意味でDCMIの活動は理解できます(ってDCMIを持ち上げすぎ?)
そう考えるとSemantic Web、とくにLinked Dataを次の目標にするのは素直に理解できます。Dublin Coreに基づくWeb化は道筋はついた、次はなにかといえば、もっとメタデータの活用を考えないといけない。Semantic Webはどちらかというと複雑なより構造化されたメタデータをターゲットにしてきた。しかし、Linked Dataで逆にシンプルだけど大量という方向に変ってきています。これならば図書館的世界と近いと考えたのでしょう。確かにあたっていると思います。
実際、Semantic Webに関して強い興味と理解があるのがわかりました。Keynoteの韓国図書館協会会長も半分ぐらいはSemantic Webの紹介に時間をあてていました(ちなみにこの講演は韓国語。同時通訳つき)。多分に国内の人へのPRもはいっていたと思いますが、それでもこのような立場の人の講演でSemantic Webが協調されるというのは驚くべきことです。
もちろん、Linked Dataと図書館的情報には共通点もありますが、相違点も多いです。構造が均質で(比較的)静的な大量データという点は共通点です。しかし、ソースが多様で信頼度が多様であるというのは大きな違いです(でもこれは機関リポジトリ由来のデータにも当てはまるかもしれない)。これをどう克服していくか、そこまではこの会議ではわかりませんでした。


Address。Makx Dekkers (Managing Director & CEO /DCMI)

keynote. Michael Crandall (U. of Washington) Anchoring the Semantic Web
- The Evolution of Dublin Core
- Dublin Coreの復習。Semantic Webへの対応。RDFをベースに。さてDubli Coreとは何だろうか。標準?フレームワーク?オーガニゼーション?人?
- DCの階層。1:語彙の共有(NLでの語彙共有)。2:フォーマルな意味の総合運用性(形式意味論)。3.記述集合の形式の相互運用性(交換可能なレコードの共有)。4:記述集合のプロファイルの相互運用性。
- この会議での主なトピック:レコード中心型のモデルはデータ中心型のモデルにフィットするか?(Tom Baker) / 他の分野とうまくやっていけるのか?
- DCMIの挑戦。スポンサーベースから会員制度の組織へ。創設よりずっと複雑かつ多様な問題を抱える。いまや実装レベルのなっている。それゆえ実装の多様性。創設時よりずっと広いコミュニティになっている。
- DCMIの未来。単に語彙だけじゃない、Linked dataで世界を記述する仕方である。レガシーユーザを未来の方向へ導く。ツールをつくる。教育。
- Dublin Coreとは。15要素。メタデータ標準。抽象モデル。フレームワーク。組織。Greekyaフリークや人々。

Keynote2件目は Eunchul Lee (President of Korea Library Association).
- Semantic Web / Linked dataをきれいにおさらいして図書館における課題へもっていく。
- 図書館におけるLinked Data適用の問題:データの変換(Marc21, DC)、図書館員のIT能力、著作権、アイデンティフィケーション、長期の永続性。
- 名前の同定。FOAFとISNI (International Standard Name Identifier). うん?ISNIは初めて聞いた。ISO標準らしい。これはどのくらい使われているのだろう
か?http://www.isni.org/
- こういう偉い立場にある人がSemnatic WebとLinked Dataとかまで語るのはすごいなあ。日本では長尾先生ぐらいかな。自分の言葉で語る偉い人は。

以下はまた私のtwitter memoの羅列です。
*********************

一般発表:Modeling classification in SKOS by M Panzer (OCLC)
- DDCをSKOSに変換する。Dewey Decimal Classification (DDC)
- 課題。Special types of concepts, inex term, class-topic relationship, internal structure, alternative classifcation, Order in classication

一般発表: using metadata for query refinement and Recommendation by Miao Chen at Syracuse Univ.
- 実際のアプリでいかにmetadataをメリットを出せるか
- ユーザクエリからトピックグループの自動生成

DCMI, Communities and Task Groups by Makx Dekkers
- DCMIの活動の紹介
- DCMIのmission Provide smple standards to facilitate the finding, sharing and managment of information
- DCMI Principles: Open consensus building, Internationl scope, Neutrality of purposes and business models, Neutrality of technology, Cross-disciplinary focus
- What is Dublin Core? / "Legacy" usate: 15要素、ISO15836標準, HTML, XMLSchme表現

午後のセッションはWorkshop: Linking Formal Data
- パラレルでもう一方はよりカジュルアルなデータぽい。こっちはよりフォーマルか。

発表:Dutch gov. metadata OWMS by has Overbeek
- Dutch -> 1200+ org 1600 + website 16M+ citizens
- metadata: Dutch Goverment Core / dcterms: identifyer, tilte, type, creator, moditied
- オランダ政府の各種情報にメタデータをつけるという話。OWMS (Overheid.nil Web metadata standard) Overheid(蘭)=政府。実際どのくらい実践されているだろうか。興味深い。

発表:Linking data Europeana
- EU 2010 information scoeity initiative
- Connecting europan culture
- 課題:多様なメタデータ(生まれ、とか)の利用。メタデータをつかった推論につかえるか。複数のメタデータ間のアライメント
- 現在公開中のEuropeanaのサイト http://www.europeana.eu/portal/  / 実験サイト http://bit.ly/nwKmE

発表: Linking data through Dryad and HIVE project
- Dryad Goal: one-stop deopostion and shopping of data obejct supprrting published
- DRYAD application profile and Singapore Framework: Functional requiremnts documented (Dube et al 2007) / Domain model (Carrier 2007)

発表:Helping Vocabuulary Enginening: SILS metadata Research cnter NESCent, Library of Congress, US Geo. Survy, Getty, LCSH, NBII, TGN
- HIVE (helping interdisciplinary Vocabulary Engineering) HIVE technogical Infrastructure to sotre metadata of concepts from different vocaburary and
avaibale by HTTP
- Dryad: http://datadryad.org/ / HIVE: http://ils.unc.edu/mrc/hive

結局のこのセッションは全部バーチャル発表(プレゼンの再生)3件だった。これではdiscussionどころではないが。。。それぞれのプロジェクトの紹介は興味深
かったが。

次のセッションの発表。

発表:How data is collected and integrated by FAO -- The AGRIS project a portal for resources discovery in agriculture
- AGRIS metadata: 3 M argicultural resources by 150 institutions since 1975. http://www.fao.org/agris/
- Problems: classic bib metadata is too simple. Solutions: metadata is used to link other resources via Web

発表:Semantic Annotation of Scientific Articles by Sudenshna Das at MIND, Mass. General Hospital, Harverd Medical School.
- Science Collabration Framework (SCF): Replicate Alzforum like community / Based on Drupal /Integrated communication tool / Semantic Web
- Enabling semntic annotation. semi-automatic text-mining. currently mining for Gene names and Gene ontology terms, Tissue, organ, cell types

発表:DCMI Information Services by Makx Dekkers at DCMI. DCMIという組織における情報サービスの現状。Web site, RSS, Wiki, twitter, Facebook (まあ
DCMIの活動の宣伝ですね)

DC2009 二日目。

Keynoteは Eunchul Lee (President of Korea Library Association).

ポスターは8件。それをおのおの2分で紹介するmadness session. CiNii紹介のプレゼンあり(by i2k)

DC2009 一般発表。A unified approach for Representing Metadata by Kai Echkert at U. Mannheim.
- Subject headingをつけるときにRDF Reificationをする仕組みを検討。

DC2009 一般発表。 Is Tagging Effective? -- Overlapping Ratio wiht Other Metadata Fields by Wooseob Jeong at U of Wisconsin
- tag語は意味があるのか?
- Youtube videoにつけられたキーワードを分析。
- Title, description, tagで語の重複度。25%でtitle-desc, desc-tagで重複。つまりtagはそんなにキーワードづけに貢献していない。

DC2009 午後のセッション Special session: technical aspects of Linked Data DCMI metadata terms, linked data, and modern syntax standards

発表 "DCMI Metadata Terms, Linked Data, and modern syntax standards" by Tom Baker
- DCMIの4層: 1 Shared (natural-language) definition 2. Shared formal-semantic model 3. shared model for "records" 4. Shared contraints in record
- この辺のDCMIの技術詳細は杉本先生の原稿が参考になります。http://bit.ly/sbnBP
- 1 Shared (natural-language) definition closed systems proprietary system, Web of API, DC-XML/2003
- 2. Shared formal-semantic model Linked data. RDF data extracted from non-RDF formats. DC-RDF, DC-HTML RDFa
- 3. shared model for "records" DCMI abstract model. DC-DS-XML, SPARQL Named Graphs.
- 4. Shared contraints in record DCMI Description Set Profile, SPARQL Query Patterns

三日目。

DC2009 一般発表。Multilayered paper protyping for user concept modeling by Emma Tnkin at UKOLN.
- user modelingは理解するのは大変。例やuser scenarioがあれば。調べ方:ethnographic method & contexual enquiry / Free-listing / Card Sorting

DC2009 一般発表:Metadata framwork for Manga - A mult-paradigm metadata description Framewor for Dgital content by Sugimoto at Tsutuba

DC2009 一般発表:Archiving and Management of digital images based on en embedded metadata framework by Cjien-Cheng Liu,
- 本では紙とデジタルの壁は厚いねえ。日本だと正論では勝てないので、こういうのが五月雨式に始って、なし崩し的になるかな。http://bit.ly/k8Jtf 国会図
書館の図書ネット配信は可能なのか。

- DC2009 TBLのTEDのTalkの再生。http://bit.ly/PmwsA
- TBL語録 "Linked data is extremely simple ...", "Data is relationship.", "Raw Data Now!",

DC2009 発表。 Collorative Curation of Linked Data by Eric Miller
- 名前付けとは:Twitterのハッシュタグ競合
- Power of People, Human Computation
- Raw Data Now -> It takes the big step of fundametally rethinking applications and thier integration. Not app. on the web, but of the web
- A practical use case : The Library of Congress. Digital Preservation http://bit.ly/LfKkq 
- raw dataがあればそれを地図に表示したり、いろんなことができる。
- Linkeda Data Communities: / Enhancing access / Connecting islands of information / Creating and preserving the community
- Eric Miller "Open data opens the door"

DC2009 発表: Scholarly Works Application Profile (SWAP) by Talat Chaudhri from UKOLN SWAP http://bit.ly/3olNHV

最新の画像もっと見る