Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

データは誰のもの?

2008年06月11日 | 研究
しばらく前に研究所のサービスの試行版を公開しました.今回は最近のWeb流に開発しようということで,α版およびβ版という形で公開しました.とくに研究者リゾルバーについてはまだアイデアが固まっていないので,どういう方向にもっていくがいいのか思案中です.なのでこれは永遠にα版かも.

この開発,公開プロセスにおいていろいろ勉強しました.バックグラウンドの違いからくるセンスの違いというものでしょうか.NIIはWeb以前から学術情報サービスを行ってきました.成り立ちからして大学図書館と密接な関係があり,図書館系の考え方が色濃くあります.そこからくる「確実なサービスを責任をもって提供する」というポリシーは尊敬に値します.

しかし,Web時代になり,情報サービスの在り方が大きく変わってきてます.一番の違いはサービス提供者とサービス利用者の関係の変化です.Web以前には両者はサービス提供者からみれば「我々はサービスを提供する」「あなたたちはサービスを利用する」といった明らかな役割分担があり,提供者から利用者への一方的関係でした.利用者は選択の余地もなくただ提供されるサービスを利用しざるをえませんでしたし,一方,サービス提供者は自分たちの裁量があると同時にその分責任をおっていました.

Web時代はこの関係が変わり,相互依存的な関係になっています.利用者はサービスをただ受け入れるのではなく,もっと積極的な役割を果たすようになっています.サービスを選択し,組み合わせて,自分のしたいことをする.サービス提供者は利用者のほしい情報をほしい形で提供することが求められるようになったわけです.

その結果はサービス開発においては2点大きな変化があると考えています.ひとつは変化の速さです.これはNIIとしてははじめて先に述べたようにα版,β版方式でやってみました.これも理解してもらうのは結構大変でした.公開前にNII内部や関係各所にPreviewという形でみせたのですが,妙なすれ違いがありました.でもこれはまあいいのです.

もっと深刻なのはもう一つの点,すなわちデータに関するコントロールという点です.Web以前はデータをどうようにユーザに使わせるかは基本的にサービス提供者が一方的に決めることができました.我々の提供するデータはこういう風に使っていいよ,こういう風につかってはいけないよと.またデータを”正しく”コントロールすることはサービス提供者の責務でありました.

Web時代は技術的にこのようなコントロールが難しくなりました.やってやれないことはないのですが.実際,提供されるデータを再利用しづらくする仕組みが要所要所に組み込まれたサービスはNIIのサービスも含めよくみかけます.でもこういうサービスは使いづらいサービスなんですよね.

技術的なことよりむしろ問題なのは,そういうデータのコントロールはWebの文化に合わないのです.Webは共有の文化です.まずWebでは自由にリンクを張ることは当然です.これすら規約として禁止したり技術的にできなくするのはWebで文化に反します.Web文化に慣れた人からはそっぽを向かれてしまいます.またGoogleにクロールされればそもそもサービス提供者の手からデータが事実上離れてしまいます.それをコントロールするのは無理なことです.だからといってGoogleにクロールされなければWeb世界ではないも同然です(ちょっと言いすぎ :-)).

別にWebにあるデータは誰でも好きなように使っていいというわけではありません.そこにはもちろんある種のルールがあります.しかし,それはサービス提供者が一方的に決めるのではなく,提供者と利用者の間でコンセンサスとして作っていくものだと思います.

たとえば,Kakenには海外でKakenのコピーサイトなるものがあって我々としては頭を痛めています.このサイトの意図はい十分には理解できていませんが,広告付きのページとして再構成して提供しているようです.NIIとしては警告や法的な対応をしています.これは我々のサービスの規約に反しているのですが,それを別としても上記の意味でルールを破っている点のほうが私は重大だと思っています.

ただし,我々にも足らない点がありました.KakenはGoogleにクロールされていません.そういう設定にしていました.またサービス内のページには直接行けないなどサービスも多様な使い方に対応していなくて不便でした.Web的な発想であれば,じゃあ自分たちでつくってやろうと思っても仕方ないかと思います(だからといって丸々コピーサイトが許されるわけではありませんが).そこで新Kakenベータ版ではGoogleでクロールできるようにしていますし(まだクロールされていないようです),直接ページをリンクできるようになっています.

すると当然よりデータをコピーしやすくなるわけです.この点は研究所内でも議論になりました.現在のところ,これは運営しながら様子をみましょうということになりました.

私からすれば,データをどんどん使ってもらえばいいと思っています.データの価値はそれがどれだけ使ってもらえるかにあると思います.ユーザが面白いと思えば自分なりの使い方を考えるわけです.データ提供側がこう使いなさいと規定するのではなくて,みんなで発見しましょうというわけです.

先に述べた公開不可になったサービスは,誰でもできるような些細なデータ集約サービスだったのですが,関係部局からの「ここまでのサービスを提供する必要はない」という指摘から公開不可になりました.もちろんデータの出自からくる様々な懸念があることは理解できます.しかし,ここまでの議論でわかるように,データは公開されてしまえば,どう使うかはユーザが決めることです.それをコントロールしようというのはすべきではないし,実際Web的にはかなり困難です.たとえば,先のサービスなどその気になれば誰でも作れます.そのうちだれかが勝手につくるかもしれません.

データは誰のものか?
Web文化においては,データはデータ提供者とデータ利用者で共有されるものです.情報サービスもそういう前提で作るべきだと思っています.

新Kakenサービス(β)と研究者リゾルバー(α)の公開

2008年05月13日 | 研究
この間の予告からずいぶん時間が経ってしまいましたが,やっと公開することができました.関係諸機関に対するプレビューで時間を取ってしまいました.

科学研究費成果公開サービス(Kaken)試行版および研究者リゾルバー試行版の公開について
というものを公開しました.

システム開発および公開に尽力していただいた皆様に感謝します.

科研費DBで何が新しいかというと科研費補助金の報告書における研究者名寄せと論文同定が入ったということです.ちゃんと同姓同名の研究者も別ページになっています.
また,CiNiiやCrossrefにある論文はそちらにリンクするようになっています.

もう一つ私が思う重要な機能があったのですが,諸般の事情で現在のところ公開できなくなりました.;-<

今回,研究者リゾルバー(Researcher Name Resolver)というへんてこな名前をつけたサービスはこの科研サービスの派生システムとして同時公開しています.せっかく研究者が同定できたのだから,それを外部のサービスとリンクさせてあげようというものです.現在のところリンク先は限定されていますが,今後増やしていく予定です.個人的には将来を期待しているサービスです.

ぜひ,使ってフィードバックを返していただけるとうれしいです.ともに試行版ですので,今後の改良に役立てていきたいと思っています.

リリースノート:http://www.nii.ac.jp/cscenter/kaken-rns.html
科学研究費成果公開サービス(Kaken)試行版サイト:http://seikaplus.nii.ac.jp/
研究者リゾルバー試行版サイト:http://rns.nii.ac.jp/

(予告)新サービス公開

2008年04月26日 | 研究
連休明けにNIIの情報サービスの改良版のβ版を公開します.
これは私が長である学術コンテンツサービスセンターは事実上の初プロダクトということになります.このセンターは2年前にNIIのいくつかの内部活動を統合する形で発足したものです.それから2年でやっとある種の軌道に乗ってきた感があります.
新しいサービスを公開するのはなかなか大変であることが今回よくわかりました.関係者に感謝.
それが何であるかは公開までは秘密:-)ですが,自分の研究にそれなりに関係にあるものです.研究コミュニティへの貢献はもちろんですが,研究ネタの提供として役立つものではないかと思っています.

ICカードの使い道

2007年11月26日 | 研究
この間,会議で韓国の釜山にいってきました.釜山には地下鉄が3系統はしっているのですが,この地下鉄とバスではICカードが使えます.まあ日本とICカードとおんなじようなものですが,一枚2000ウォンで買います(デポジットなのかは不明).まず買ったときはチャージは0です.そのあとチャージします.
僕は買うとき,そのところを理解しないで,適当に金額を打ち込んだら,チャージ0のカードを5枚をかってしまうことになってしまいました ;-<
面白いのは,カード式以外にもストラップ式?のものも売っています.こちらはひとつ8000ウォンと少々お高いです.
これを現地の人(ったてたぶん女性だけだろうなこのデザインでは)は携帯につけたりしています.改札を通るときは,このストラップをちょこっとつけるわけです.おお,なんと簡単にICタグつき携帯の実現 :-)
考えてみればICタグ自体は非常に小さいもので,カードである必要性はまったくないですよね.
きっとほかの国でもやっているでしょうね(日本ではやってない?)
こういうのを見ているとまだまだICタグの可能性はありそうです.腕時計付着タイプ(昔,生命保険会社のおばちゃんがくれた金属のカレンダーみたいなものとか),指輪タイプ,ミサンガタイプなどなど.
でもこうすると混信,誤信を避けることも考えないといけなわけですが.

LNCS JSAI2006 post-proceedings が発行されました

2007年01月27日 | 研究
昨年の人工知能学会全国大会の英語版Post-proceedingsがSpringerのLNCS(Lecture notes in Cumputer Science)の一冊として発行されました.

New Frontiers in Artificial Intelligence, Joint JSAI 2006 Workshop Post-Proceedings, LNCS, Vol. 4384, Washio, T.; Satoh, K.; Takeda, H.; Inokuchi, A. (Eds.), 2007, ISBN: 978-3-540-69901-9

この本には大会優秀論文賞の論文の英語版と併設ワークショップ論文の中から選ばれた論文が載っています.この大会は僕がプログラム委員長だったので,迅速に発行されてうれしいです.

この企画は2001年からあって,LNCSに何冊かでています.去年JSAI2005,2001年のJSAI2001があります.途中がない?,僕の論文も2つはいったものがあるのですが,それはどうやらそろそろでるようです(論文リストでずっとPendingになってました;-<).


NII学術コンテンツサービス研究開発センター

2007年01月25日 | 研究
NIIの学術コンテンツサービス研究開発センターのWebページが開設されました.本当はセンターとして面白いコンテンツをできてからと思っていたのですが,そうこうしていると年度がおわってしまうので,公開することにしました.このセンターは去年の4月に発足したので,僕はそのセンター長だったりします.センターといっても専任のスタッフは2名しかいない小さなセンターですが,ミッションは重いです ;-<

情報の価値化?

2006年08月29日 | 研究
情報の価値化・知識化技術ワークショップなるものにでています(単に聴講).
「情報の価値化」なんてテーマでパネルをしているわけですが...

さすが辻井先生はわかっていらっしゃる.何が重要かというと,とにかく情報が公開されたこと,さらにどんどんその粒度が細かくなっていること,だから頭の中のプロセスが共有されるようになれば,何十倍の効率的な研究ができるようになるなどと.

前の記事に書いたように,この10年は恐るべき変化だったわけです.どんどん情報が公開,共有されるようになったわけです.それはどんどん進むだろう.とくにセンサーからどんどん情報が提供されるようになって,さらに一段と情報が増えるでしょう.

我々はビットとアトムの両方の世界に住んでいる(MIT石井先生).それは次の5年,10年でより明らかになるでしょう.

だから「情報の価値化」というテーマはなんとなくピントをはずしている.我々はすでに情報の世界に住んでいる.すんでいる世界の価値を問うというのはよくわからないよね.

情報の世界の構造とは何か,を問うことが第一だろう.我々の周囲はどういう形をとるだろうか.社会はどんな構造となるのだろうか.

今はその構造は比較的簡単である.いわばGoogleがあれば事足りるぐらい簡単な構造なわけです.しかし,センサー情報などが流入されてくれば,そうは言っていられない.きっともっと複雑な世界になるでしょう.

あとで振り合えって見れば,2000年代はシンプルな世界でよかったなあ,と回顧するかもしれない :-)

セマンティックWebとWeb2.0

2006年04月21日 | 研究
なんと「セマンティックWebとWeb2.0」なんて題目の講演をすることになりました.Interop 2006のコンファレンスの「Web環境の進化で変わる情報検索アーキテクチャ」という中です.僕以外はNTTレゾナントの小澤さん,"Web2.0 Book"の小川浩さん,慶応の松村太郎さんという,大変なものです.一般技術者向けなのでわかりやすいテーマということで,コーディネータの奥さんらと話しているうちに,結局はやりのキーワードをいれることになりました.
しかし,一体,何を話せばいいのだろう.あわてて真剣に:-)Web2.0の情報収集を始めました.でも集めれば集めるほどわけわかんなくなりますね.

まあ,Web2.0に関する”評論”は巷にあふれているわけですが,僕はあくまで研究者(SW研究者?)としての立場として考えていこうと思っています.

現状でわかったこと.
まあO'Reillyの論文は結構分かるし,やっぱりいいポイントをついている.Webの世界がどんなものであるかを肌身でわかっている感じがあり,すごく同意できる.しかし,当たり前だが,この論文は表題の通り,ビジネスモデルやソフトウェアのデザインパターンの対象としてしかWebをみていない.そこが(研究者としては)不満が残るところです.翻って,セマンティックWebはどうなんだ,とみると,これもやっぱりAI技術,情報技術の対象してしかWebをみていない.もっとWebの世界自体を語るべきなんじゃないかと思いました.それが鍵かな.
じゃあ,それはなんのか.そういえば,僕はこんな解説を2002年に書いているわけですが,ここで言いたかったのは今あるWebコンテンツをみていても駄目でその背後にある日常世界をみなければならない,すなわち日常世界としてのWebを考えよう,ということでした.まさにそれがWebとは何かの答えなんじゃないな.
じゃあ,そのようなWebはどんな性質をもち,我々にどんなことをもたらすのか.
それはまた,もうちょっとまとまってから.

ご意見があればどうぞ.
#Web2.0を語るにはWeb2.0的に”参加型”でなければ :-)

モノの圧力

2006年04月20日 | 研究
3月に故あって国立民族学博物館を訪問しました.オントロジーで民博研究者を
支援できないかという話を考えるためです.僕は関西にいたこともありますが,
実は民博は初めてでした.
民博とのからみがどうなるかはまったくわかりませんが,とりあえず博物館で感
じたこと.それは大量のモノからくる圧力です.民博では開館時よりのポリシー
で説明を最少にして,モノ自体を大量に展示するという方式をとってきたそうで
す(最近は展示方法はかわりつつあるそう).太鼓なら太鼓が,さまざまなバリ
エーションで大量に置かれているわけですね.これは圧巻です.僕にはそれは人
間としての本能的な部分に触れるものがあるのではないかと思いました.
人類は古来よりひたすら道具を作ってきたわけです.ホモ・ファーベルとしての
人間の本能というわけです.モノをつくることで生存してきた人類にとってモノ
は不可分な存在なんじゃないでしょうか.本能といっても,もちろん動物として
の本能(media equationで示されたようなもの)のレベルよりは表層的なものだ
とは思いますが.
古来からモノをあつめるという行為は洋の東西を問わず存在してきたわけです
(博物趣味).また,我々も日々コンビニやキオスクの大量のモノでほっとする
ことがあるわけです.あるいはかつての共産圏のモノにはバリエーションなんて
いらないという世界にロジカルでない納得のできない気持ち,さらには旧共産圏
のデパートのわびしさ(僕はソ連から分離してしばらくのエストニアのデパート
にいきましたが,そんな感じでした)もなんかの由来があるのではないでしょう
か(そもそも共産圏の崩壊はこのモノに対する執着心も貢献したのではないのか
な.コカコーラやマルボロ,ベンツといった存在は壁崩壊の内なるモチベーショ
ンか).
このモノに対する特別な関係はかなり深いところにあるのではないかと思う.人
工物工学的にはモノの本質は機能であり,機能が同値であれば物質的な存在の有
無を問わない,だからサービス化が可能という.これはサービス工学の道筋なの
だけど,もし上のようなモノへの執着がかなり深いところにあるのなら,機能と
は別の側面,モノの存在としての意味,も考慮しないといけないじゃないだろう
か.

10日で5回

2006年01月17日 | 研究
なんか忙しい.資料を書いても書いても次々にあるな,と思ったら,明日から10日間で5回発表しなきゃいけないことに,今となって気づいた.発表時間も5分(実はこれが一番難しい)から1時間,それでもテーマも内容も違うので,面倒なこと,この上ない.
ついつい泥縄的作業になって,周りの人に迷惑をかけっぱなし.みなさん,ごめんなさい.
一番のビッグイベントは明日の寄付部門の発表.東大総長をはじめとして学部長クラスが大勢いらっしゃるという.うーむどうしたらものか,といってどうなるものではないけど.:-)