lens, align.

Lang ist Die Zeit, es ereignet sich aber Das Wahre.

information: Life Science Networking System (RIKEN SciNes) on Semantic Web >> Press Release.

2009-04-01 14:28:43 | Science
Scines



理研のデータベース構築基盤の公開基準をセマンティックウェブに統一
 - ライフサイエンスネットワーキングシステム(理研サイネス)の運用を開始 -

 [2009/03/31]

>> http://www.riken.jp/r-world/info/release/press/2009/090331_2/detail.html


ここ数年の間、ずっとお世話になっている[bio-informatics]コミュニティの主宰で、ウェブ上における情報統合を常に先導してきた豊田哲郎氏(理研BASE 部門長)から、近年のデータベース統合研究の総括とも言えるべき成果がプレスリリースにて発信されましたので、ここに転送します。



◇ポイント◇

各分野で活躍する日本の研究者が中核となる国際連携を推進する情報基盤へ
大量データを扱うライフサイエンス分野の統合データベース事業でも有用性を発揮
個々のデータベースを丸ごと研究成果物として発表できる学術メディアとして期待



 独立行政法人理化学研究所(野依良治理事長)は、ライフサイエンスを主体にしたデータベースの構築基盤システムを理研内で一元化し、国際標準規格「セマンティックウェブ形式※1」に準拠したデータ公開を大規模に実施するための共通基盤「理研サイネス」を構築しました。これは、理研生命情報基盤研究部門(理研BASE、豊田哲郎部門長)による研究成果です。


 近年のライフサイエンスが、大量のデータを扱う科学に発展したことなどから、研究成果を論文形式にして発表するだけでなく、ウェブ上でアクセス可能なデータベースとして独自に発信していく機会が増えました。しかし、研究論文の発表では学術雑誌などの専用のメディアが発達しているのに対し、データベースの発信・発表では、個々の研究者が自らウェブサイトを立ち上げてサービスしなければならず、特に、発信・発表後も継続的にサービスを維持するための運用コストが、研究者にとって大きな負担となっていました。さらに、個々の研究者が立ち上げた独自サイトが、多数乱立するにつれ、公開方法がまちまちで国際基準規格に準拠していないサイトも多くなり、利用者から見ても分かりづらく、統合的な活用が妨げられていました。


 そこで理研BASEでは、研究者がウェブサーバーを維持する必要がなく、個々のデータベースを丸ごと研究成果物として発信・発表することができる共通基盤「理研サイネス」を開発しました。理研サイネスは、研究者自身が、サイバースペース上でバーチャルな研究プロジェクトを組織することを支援し、数万個以上の研究プロジェクト群の収容を想定しています。

この新たに開発したデータベースの構築基盤システムは、各研究プロジェクトを機密性高く区切り、未公開情報の管理や大規模なデータを介した研究業務フローを、プロジェクトごとに柔軟に設定することができることから、研究プロジェクト内のデータガバナンス※2を向上させ、新しいタイプの学術メディアとしても期待できます。この基盤で構築したデータベース群は、国際標準規格を採用し、公開が容易なため、「理研総合データベース(RIKEN Hub-Database)」として理研が集約的に維持管理を継続し、各分野の日本の研究者が国際連携研究の核として主導権を発揮するチャンスを提供します。


 本研究は、理研内の戦略的裁量研究費所内連携推進事業として行ったものです。理研サイネスは、閲覧機能に限り、Firefoxというウェブブラウザに対応した試用版で、理研総合データベースとともに、3月31日から公開しましたhttp://database.riken.jp/



以下、技術サイドからデータ運用に関する
利点で目についたものを抜粋します。


現在、大型研究所全体のセキュアなデータ連携と大規模なデータ公開の両方が行える情報基盤を、国際標準であるセマンティックウェブ技術によって構築しているのは理研以外にありません。このシステムはセマンティックウェブとファイルシステムの両方の長所を併せ持つ“Semantic Web Folders(SWF)”という理研BASEが独自に開発した情報技術を使って実装されており、数千個の異なるデータベース群を一つのシステム内に包含して同時に運用することを想定し、データベースの数が増えても安定した動作が可能なシステムとして設計しています。


理研サイネスのリポジトリ機能は、従来のリポジトリのようにファイルや画像など個々のデジタルコンテンツを格納する機能だけでなく、データベース自体を利用可能な状態のまま丸ごとひとつのコンテンツとして格納する「ライブデータベースリポジトリ機能【22】」という新しい特徴があります。



その他、数えきれない程の特徴が挙げられていますが、
機能に関するアウトラインとしては、

・データベースマネージメントの一元化
・人為的マイニングを介在
・グローバルID付与による外部利用手続きの簡易化
・コンピュータによるデータ・ドリヴンな解釈構築


あらゆる学術分野の中でも、突出して天文学的な情報量を扱うライフ・サイエンスですが、セマンティック・ウェブの概念がデータベース運用という、これだけ現実的かつ有用な形で実装される例もまだまだ数少なく、情報技術分野に置いても画期的な成果となるのではないでしょうか?