Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

セマンティックWebとWeb2.0 (概要)

2006年05月31日 | 書評
セマンティックWebとWeb2.0をつなぐコンセプトして「社会としてのWeb」を語ろうと思って書き始めたのですが,ちっと進まず,そのうちにInterop06は来週に迫ってしまいました.
かわりにに,とりあえず資料のテキスト版をつくってみました.

*******************************************************************
セマンティックWebとWeb2.0
  さまざまな喧騒
    Web2.0 ブーム?
      Web2.0 って何?
    Web2.0 とセマンティックWeb は同じ目的?
    Web2.0 はセマンティックWeb を殺す?
       ところでセマンティックWeb って何?
   本講演のねらい
     セマンティックWeb の立場からセマンティックWeb とWeb2.0 の関係,ひいてはWeb の将来の方向を考える

セマンティックWebとWeb2.0
  Web2.0:ビジネスモデル及びソフトウエア構築方法論
  セマンティックWeb:技術開発および標準化
  そもそも目的は異なるが,両者とも現在あるいは未来のWebをモデル化
  しかし,ともに部分的
    Web2.0:ビジネス
    セマンティックWeb:技術
  では,そもそもWebの全体像は?

社会としてのWeb
  2つの特徴を併せ持つ
    社会としての特徴
    計算機世界としての特徴
  我々の社会の“dead copy”ではない
  両者を併せ持った新しい構造をもった社会

社会としてのWeb
  社会として
     我々の社会がもつ要素全てが持ち込まれる
       人々,もの
       人と人の相互作用,人とものの相互作用
       社会的活動
   生活,教育,ビジネス
       組織,コミュニティ
       ルール,モラル
       法律,犯罪…
       政治
      …

    特徴
       大量
       共有,共存
       不変と可変
       集中と分散
       制御と不制御
      …

社会としてのWeb
  計算機世界として
     プロセスの特徴
       時間非依存
       場所非依存
       多重化可能
       並列化可能
      量非依存
     データの特徴
       複製可能
       再利用可能
      永続性

社会としてのWeb
  Webの社会化ははじまったばかり
  現在はそのほんの端緒でしかない
  現時点での到達点
    社会の広がりの実現
    人と人のインタラクションを可能とする最も原始的なインフラの実現
   技術的表現でいうなら
    大規模情報共有 /Massive Information Sharing

Massive Information Sharing
  大規模さ/Massiveness
    大量性:人,もの
    多様性:沢山あれば多様
    分散性:沢山あれば分散
    動的:どんどんと変わりいく
  情報共有/Information Sharing
    基盤構築:共有の基盤作り
    標準化:何かを定めなけば情報交換ができない

Web2.0
  戦略的な位置づけ: プラットフォームとしてのウェブ
  コアコンピテンス
    パッケージソフトウエアではなくてサービス
    参加のアーキテクチャ
    高い拡張性とコスト効率
    再構成可能なデータソースとデータの変換
    単一デバイスを超えたソフトウエア
    集合知の活用
  代表的なサービス
    Folksonomy (ex. del.icio.us, Flickr)
    Rich User Experience (ex. Gmail, Google Map, AJAX)
    User as Contributor (ex. PageRank, eBey, Amazon)
    Long tail (ex. AdSense)
    公開ではなくて参加(ex. Blogs)
    Radical Trust (ex. Wikipedia)
    Radical Decentralization (ex. BitTorrent)
  What Is Web 2.0 Design Patterns and Business Models for the Next Generation of Software by Tim O'Reilly http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html

社会としてのWebとWeb2.0
  User as Contributor (ex. PageRank, eBey, Amazon)
  公開ではなくて参加(ex. Blogs)
  Folksonomy (ex. del.icio.us, Flickr)
    “大規模 ”“情報共有 ”(人のいる社会)
  Long tail (ex. AdSense)
    “ 大量性,多様性 ” 情報共有(社会の大規模さ,多様さ)
  Rich User Experience (ex. Gmail, Google Map, AJAX)
    “ 動的 ” 情報共有基盤(動的な社会基盤)
  Radical Decentralization (ex. BitTorrent)
    “ 分散的 ” 情報共有基盤(分散的な社会)
  Radical Trust (ex. Wikipedia)
    “ 信頼型 ” 情報共有(社会における信頼)

社会としてのWebとセマンティックWeb
  情報共有に注目
  情報共有を知識共有によって解決する
    抽象化
    共有のレイヤーを一段上げる


セマンティックWebの目的
  "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation."
  セマンティックWeb は現在のWebの拡張であり,そこでは情報には定義された意味が用意され,人と計算機の共同作業がより容易にできるようになる.
The Semantic Web, Scientific American, May 2001, Tim Berners-Lee, James Hendler and Ora Lassila
  The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.
http://www.w3.org/2001/sw/


Next Generation Web?
  Webの進化
    HTML: 表示のためのWeb
    XML:シンタックスをもったWeb
    ?? :セマンティックスをもったWeb

   なぜセマンティックスをWeb のメカニズムの中に組み込なねばならないか
     人間のためのWeb
から
    人間と機械のためのWeb
  ヘ
cf. 機械ためだけのWeb

どうやって意味を記述するか
  情報に関する情報を記述する仕組みが必要
     メタデータ
       データに関するデータ
   共通に理解し合える仕組みが必要
     シンタックス(言語,スキーマ)
     語彙(オントロジー)

Semantic Webの階梯
  RDF (Resource Description Framework)
    最も原始的な意味記述の枠組みを提供ー>SVOモデル
      Entity-Relation Model(実体関連モデル)
      セマンティックネット
  RDF Schema
    RDFに最も原始的な概念記述の仕組みを追加
      class-subclass関係,制約
      弱いオントロジー記述言語
  OWL
    より一般的な概念記述の枠組みを提供
      多様なクラス表現,多様な制約
      十分なオントロジー記述言語
      3種
  OWL-Lite
  OWL-DL
  OWL-Full

OWL(Web Ontology Language)
  RDFSにより豊富なクラス表現と制約の方法を追加
  Description Logicに基づく
  Frame風
  特徴
    クラス
      クラス要素:必要条件,必要十分条件の区別が可能
      クラス表現:
  プロパティによる制約(クラスのスロット定義の相当)
    型制限(全称/限量),個数制限,型指定個数制限
  クラスの論理演算:和,積,否定
    プロパティ
      定義域,値域の複数指定(積)
      推移性の指定
    定義のインポート

オントロジーの定義
  Gruber
    概念化の明示的な仕様
  FIPA98
    特定のドメインの構造の明示的な仕様。
    対象領域を参照するための語彙(論理定数と述語記号)と領域に存在する制約の表現と語彙の解釈を制限する論理的言明。
    あるトピックに関する知識の表現と通信のための語彙とその語彙で示される実在物(entity)の関係と属性の集合である。
  ソフトウエア的発想でいえば
    語彙以上OOのオブジェクト未満
  もっとわかり易くいえば
    共通の概念の体系(“語彙”とその定義とそれら間の関係)

オントロジーの例
  SUMO(Suggested Upper Merged Ontology)
    Collection and organization of concepts used frequently
    Simple relationship between concepts

オントロジーの例
  DOLCE
    Concepts
      Endurant / Perdurant / Quality / Abstract
  Endurant:
    “Things”
    An existence over time
    May change its attribute
  Perdurant
    “process”
    No change over time
    May switch a part to the other
    Relations
      Parthood (abstract or perdurant)
      Temporally Parthood (endurant)
      Constitution (endurant or perdurant)
      Participation between perdurant and endurant

オントロジーの例
  “奈良観光オントロジー”

社会としてのWebとセマンティックWeb
  情報共有に注目
  情報共有を知識共有によって解決する
    抽象化
    共有のレイヤーを一段上げる

   しかし,他の大規模特性も同時に解決しないといけない
     多様性
     分散性
     動的
    …



セマンティックWebにおける大規模特性の解決
  多様性,分散性
     分散オントロジーとオントロジーアラインメント
      HICAL
     オントロジーの協同開発
      Semantic Wikis
    Web Mining によるオントロジーの構築
      Ontology としてのfolksonomy
       人間関係ネットワークの発見 (Polyphonet)

HICAL: インターネットディレクトリの関係付けの発見
  目的
    階層構造間の関係の発見
  問題設定
    インターネットディレクトリ
  方法
    インスタンスの共通性から統計的に推測

HICAL
  類似するカテゴリペアの判定
    インスタンスを共有をκ統計量で判定
    インスタンスとはURL
   概念の包含関係を利用
     上位概念は下位概念のインスタンスもインスタンスとして持つ
   カテゴリペアの探索
     木構造を上から探索
     発見したペアのみ詳細化

Semantic Wiki
  Wikiの仕組みを使ってメタデータおよびコンテンツを協同編集,公開
  沢山の実装
    Semantic MediaWiki
    Semantic MediaWiki (jp)
    IkeWiki
    …
Ontologies are us: A Unified Model of Social Networks and Semantics [Mika05]
   コミュニティを考慮に入れたオントロジーのモデル化
  Actor - Concept - Instance
    3 部 グラフから2 部グラフへの変換とネットワーク分析
    6 パターンのネットワーク

Social bookmarkingからのオントロジー抽出
  Del.icio.usからのコミュニティ・オントロジー抽出
    30,000 users(2004.12)
      Actor - ユーザ
      Concept - タグ
      Instance - ブックマークのURI

Social bookmarkingからのオントロジー抽出
  概念の上位下位判定
     出現頻度と共起,包含率からBroader - Narrower を 自動 決定

Polyphonet
  Webから人間関係を抽出するシステム
  技術分野
    Webマイニング
      Web上の情報に対して、パターンの抽出処理や解析処理を行うことで、明示的に書かれていない有用な知識を見つけ出す技術。
  特徴
    一般の検索エンジンを利用している。数万回~数十万回、Webの検索を行いながら、研究者の情報を抽出・整理する。
      検索エンジンでページを集める⇒一部のページの解析 ではなく、Web全体のページの解析を検索エンジンをうまく用いることで行っている。
    自然言語処理、機械学習と呼ばれる手法を組み合わせて用いている。
    名前と所属だけを入れれば、あとの情報はすべてWebから自動的に抽出する。

情報・コミュニケーション活動
Information and Communication Activities (ICA)
  2つの層による2つのサイクル

情報・コミュニケーション活動としてのブログ

情報・コミュニケーション活動としてのSNS
  人のつながりを中心としてコミュニケーションを支援

情報・コミュニケーション活動としてのwiki
  「創る」段階で情報活動とコミュニケーション活動を一体化

Web3.0?
  社会としてのWebはまだ途上
    Web1.0: 言葉が呪術の世界
      HTML を操れる者が特権階級
    Web2.0: 言葉を操る知識階級の世界
       ネットに積極的に関与する人々でつくられる世界
       まだ特別な階級による“ 善意 ” による “ 平和 ” な世界
       フラットな構造:擬似的な “ 民主主義 ”

Web3.0?
  社会としてのWebはまだ途上
    Web3.0?: ほとんどの人が参加する世界
      “ 声なき大衆” の参加
       混沌,混乱(cf. オンラインゲーム)
       構造化,囲い込み
   新しい秩序の形成
       革命??
       ほんとうの “ 民主主義 ” の実現????