Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

A Linked Data-related System

2008年06月30日 | 研究
旧聞になりますが,うちの博士課程の学生が研究上でつくっているシステムがある会社のコンペティションで優勝しました.

And the winner is: The vision of a future where ordinary people publish structured data

このシステムはfreebaseよりfreeでlinked data共有を目指したものです.
StYLiD application

興味のある人がアクセスしてください.
このコンペティションはLinked Data Planet Conferenceというものに合わせて開催されたもので,せっかくなので本人にこの会議に参加してもらいました.

こんな会議が開かれているように(しかも年内にもう1回ある!),Linked Dataはいまビジネスにおいても非常に興味を持たれているようです.研究面ではWWW2008やESWC2008でもセッションやチュートリアルがあり,盛り上がっていました.

その会議参加報告を次回のセマンティックWebとオントロジー研究会でしてもらいます.ということで研究会の宣伝もちょっとだけ :-)


データは誰のもの?

2008年06月11日 | 研究
しばらく前に研究所のサービスの試行版を公開しました.今回は最近のWeb流に開発しようということで,α版およびβ版という形で公開しました.とくに研究者リゾルバーについてはまだアイデアが固まっていないので,どういう方向にもっていくがいいのか思案中です.なのでこれは永遠にα版かも.

この開発,公開プロセスにおいていろいろ勉強しました.バックグラウンドの違いからくるセンスの違いというものでしょうか.NIIはWeb以前から学術情報サービスを行ってきました.成り立ちからして大学図書館と密接な関係があり,図書館系の考え方が色濃くあります.そこからくる「確実なサービスを責任をもって提供する」というポリシーは尊敬に値します.

しかし,Web時代になり,情報サービスの在り方が大きく変わってきてます.一番の違いはサービス提供者とサービス利用者の関係の変化です.Web以前には両者はサービス提供者からみれば「我々はサービスを提供する」「あなたたちはサービスを利用する」といった明らかな役割分担があり,提供者から利用者への一方的関係でした.利用者は選択の余地もなくただ提供されるサービスを利用しざるをえませんでしたし,一方,サービス提供者は自分たちの裁量があると同時にその分責任をおっていました.

Web時代はこの関係が変わり,相互依存的な関係になっています.利用者はサービスをただ受け入れるのではなく,もっと積極的な役割を果たすようになっています.サービスを選択し,組み合わせて,自分のしたいことをする.サービス提供者は利用者のほしい情報をほしい形で提供することが求められるようになったわけです.

その結果はサービス開発においては2点大きな変化があると考えています.ひとつは変化の速さです.これはNIIとしてははじめて先に述べたようにα版,β版方式でやってみました.これも理解してもらうのは結構大変でした.公開前にNII内部や関係各所にPreviewという形でみせたのですが,妙なすれ違いがありました.でもこれはまあいいのです.

もっと深刻なのはもう一つの点,すなわちデータに関するコントロールという点です.Web以前はデータをどうようにユーザに使わせるかは基本的にサービス提供者が一方的に決めることができました.我々の提供するデータはこういう風に使っていいよ,こういう風につかってはいけないよと.またデータを”正しく”コントロールすることはサービス提供者の責務でありました.

Web時代は技術的にこのようなコントロールが難しくなりました.やってやれないことはないのですが.実際,提供されるデータを再利用しづらくする仕組みが要所要所に組み込まれたサービスはNIIのサービスも含めよくみかけます.でもこういうサービスは使いづらいサービスなんですよね.

技術的なことよりむしろ問題なのは,そういうデータのコントロールはWebの文化に合わないのです.Webは共有の文化です.まずWebでは自由にリンクを張ることは当然です.これすら規約として禁止したり技術的にできなくするのはWebで文化に反します.Web文化に慣れた人からはそっぽを向かれてしまいます.またGoogleにクロールされればそもそもサービス提供者の手からデータが事実上離れてしまいます.それをコントロールするのは無理なことです.だからといってGoogleにクロールされなければWeb世界ではないも同然です(ちょっと言いすぎ :-)).

別にWebにあるデータは誰でも好きなように使っていいというわけではありません.そこにはもちろんある種のルールがあります.しかし,それはサービス提供者が一方的に決めるのではなく,提供者と利用者の間でコンセンサスとして作っていくものだと思います.

たとえば,Kakenには海外でKakenのコピーサイトなるものがあって我々としては頭を痛めています.このサイトの意図はい十分には理解できていませんが,広告付きのページとして再構成して提供しているようです.NIIとしては警告や法的な対応をしています.これは我々のサービスの規約に反しているのですが,それを別としても上記の意味でルールを破っている点のほうが私は重大だと思っています.

ただし,我々にも足らない点がありました.KakenはGoogleにクロールされていません.そういう設定にしていました.またサービス内のページには直接行けないなどサービスも多様な使い方に対応していなくて不便でした.Web的な発想であれば,じゃあ自分たちでつくってやろうと思っても仕方ないかと思います(だからといって丸々コピーサイトが許されるわけではありませんが).そこで新Kakenベータ版ではGoogleでクロールできるようにしていますし(まだクロールされていないようです),直接ページをリンクできるようになっています.

すると当然よりデータをコピーしやすくなるわけです.この点は研究所内でも議論になりました.現在のところ,これは運営しながら様子をみましょうということになりました.

私からすれば,データをどんどん使ってもらえばいいと思っています.データの価値はそれがどれだけ使ってもらえるかにあると思います.ユーザが面白いと思えば自分なりの使い方を考えるわけです.データ提供側がこう使いなさいと規定するのではなくて,みんなで発見しましょうというわけです.

先に述べた公開不可になったサービスは,誰でもできるような些細なデータ集約サービスだったのですが,関係部局からの「ここまでのサービスを提供する必要はない」という指摘から公開不可になりました.もちろんデータの出自からくる様々な懸念があることは理解できます.しかし,ここまでの議論でわかるように,データは公開されてしまえば,どう使うかはユーザが決めることです.それをコントロールしようというのはすべきではないし,実際Web的にはかなり困難です.たとえば,先のサービスなどその気になれば誰でも作れます.そのうちだれかが勝手につくるかもしれません.

データは誰のものか?
Web文化においては,データはデータ提供者とデータ利用者で共有されるものです.情報サービスもそういう前提で作るべきだと思っています.