Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

Blogの移動っす

2011年06月15日 | 書評
ちっともBlogを書かなくなった私ですが、とりあえずblog置き場をここから、ResearchMap上に移しました。
http://bit.ly/iM1oeQ
以降はそちらでお会いしましょう。移動1号目としてLOD-LAM Summit参加について書きました。

返答:「FIT2010 仮想社会と電子書籍:紙の本はなくなるのか?」コメント

2010年09月28日 | 書評
せっかく土屋先生がコメントしてくれたのに、自分のブログをみていなくて返答が遅くなってすいません。

編集コストが含めたとき、「同人誌」モデルは成り立つのか?
コストがかかり無料ならどうやっても成り立たないだろう。
もっともな疑問です。

私は「成り立つ」のではなく、「成り立つようになる」と思っています。マクロ的にみればこれから文化娯楽にまったくお金を費やさなくなるとは考えられません(考えたくないいうべきか:-))。きっと収入のなんらかの割合で文化娯楽に支出されるでしょう。もちろん文化娯楽といってもとても幅が広がってるので、レガシーメディアである文字メディアは相対的にウェイトが下がるでしょう(とっても携帯小説サイトとか見る限り、我々がおもったほど文字離れはないようです)。とするならば制作コストも物流コストもなくなってしまうなら、いま以上編集コストにお金が払われてようになってもおかしくはありません。というかもはや出版行為=編集行為なので当然でしょう。
でもお金を回収するビジネスモデルがないだろうと。

その点においては「同人誌」出版モデルにおいても出口を見据えてビジネスモデルを考えることが必要なります。土屋先生がいうような1万人の読者のための同人コミュニティなら1万人に耐えうるビジネスモデルが必要ということであり、もし同人がそれを目指すならそういう出口戦略をつくるということです。

そのようなビジネスモデルは今でもいろいろあるわけですし、これからはもっと新しいモデルができるでしょう。例えば、大手出版社(もう出版社と名乗らないかもしれませんが)がヒットしそうな作品や同人誌を拾い上げ、これまでと同じような販路で大量販売することもあり得ます。電子メディアを好まない人向けや電子メディアで表現しきれない部分を製本した本で販売するということあり得ます。あるいは関連商品販売というものよくやられています。ライブ系のイベントもありえます(音楽じゃなくても作者に会いたい、リアルに参加したいというのはある)。もちろん熱心な読者がいる世界なら少額での会員制度や販売も十分可能でしょう。もともと現在だって総出版コストに占める割合は小さいので今の1/10でも可能でしょう。

いいたいことは、お金を一定程度この世界に費やしてくれる人々がいるなら、なんらかのビジネスモデルが成り立って、やっていけるだろういうことです。とくに余計なコストが減った分可能であろうと。

私は楽観的に考えていて、短期的には混乱はあるかも知れませんが、長期的にはうまくいくだろうと思っています。むしろそういった変革に棹を差すような勢力があることのほうが未来に対する危
機なんだと思います。

産経記事:国費で作った研究報告書なのに読めない、コピーできない…年間2000億円の科研費

2010年08月20日 | 書評
8/20付け産経記事に表題のようなものがあった。
http://sankei.jp.msn.com/affairs/crime/100820/crm1008200131005-n1.htm
趣旨としては国の研究費の報告書がネットで読めないということ。
”国の科学研究費補助金(科研費)で作成された研究報告書47年分が、限定的な閲覧しかできないうえ、コピーも部分的にしかできない状態にあることが19日、分かった。”
って、そもそもそんなことが昨日「発見」されたのですか、と突っ込みたくなるほど、ピンぼけ記事。
あまりにピンぼけすぎる記事なんで、誤解を招かないためにちょっと説明をしたいと思う。

元来、科研費の報告書(一定規模以上の課題の種類)には冊子体の報告書の提出を義務づけていた。この記事でいう「報告書」とはこのことを指している。ちなみに報告書には他にも実績報告書とか別種のものがある。冊子体での報告書は国会図書館に納本されて、保存と閲覧が保証されるというのが旧来のやりかただった。これはインターネット時代以前ではまったく正しい(他の選択肢がない)方法だった。
ちなみに冊子体以外のほとんどの報告書(実績報告書など)はNIIのKakenサービスで過去分すべてにわかって閲覧可能である。(この遡及入力だって大変だったのだから)

さすがにこの時代、冊子体でもなかろうということで研究報告書の方法が改訂されたのが20年度で、ページを限定した上でPDFでの提出となった。まあ20年度というのは遅きに逸した感はいなめないけど。で、この年度以降は提出されたPDFをNIIのKakenサービスの中で閲覧できるようにしたわけです。この記事でいうところの3年間云々というのはそのことを指している。閲覧が3年分に限定されているのではなく制度がかわったからなに誤解を招く文章である。(そもそも今は22年度なので22年度の報告書なんてありえないですけどね :-))。
我々としては現行の報告書のフォーマットやフロー(機関からCDROMで提出なんて...)には不満があり、その結果公開まで時間がかかっていうのは事実です。

過去分にさかのぼってインターネットに公開することはシステムや予算の問題というよりは著者との関係で難しい。インターネットで公開することを前提に執筆した内容ではないので、権利面や倫理面での課題があるわけです。国会図書館が一般図書のルールと適用して答えているのは当然でしょう。むしろ、遡及分に関しては、国会図書館の電子化の公開の問題の中で解決すべきことでしょう。

事実誤認はもとより、この記事のネガティブなトーンには辟易します。

PS.この記者は若いですかね。インターネット非公開=公開されてない、的発想。ネットピープル的にはOKなんですが、高々十数年の常識で47年間を切るというのは新聞記者としては情けないですね。

blogtalk2009参加記

2009年09月24日 | 書評
blogtalk2009に行ってきました。
この会議はblogに関するresearcherとdeveloperが集う会議ということのようです。いわゆる技術発表としてはレベルは高いわけではありませんが、社会科学を含む広い研究者と実際に開発している人が話したりするので、普通の会議とはひと味違います。この会議はThomas Burgが2003年に立ち上げたもので、その頃はいわばblogバブルの時代。新しいメディアとして喧伝されてころ。毎年ヨーロッパのどこかで開催されていて、今回初めてアジアで開催とのこと。僕はThomas Burgには直接知己はなかったのですが、別の人の縁でPCになりました。それでブログでも宣伝しました。
発表者は韓国+日本+ヨーロッパ少々、参加者は発表者+韓国人、といったところです。発表の背後にある各国のblogやsocial mediaの状況が垣間見えて面白かったです。日本以外ではJournalismや政治という問題にblogはいろいろな関係性、影響力をもっているようです。一方、日本のblogはそういった問題以外のところでまず発展してきて、それが今となって政治とかに少しづつ関係をはじめているという違いがあるようです。その辺を自分のパネルで少し話をしました。主催のBurgさん、KISTIのHanmi Jungさん、ZentiumのLeeさん、SNUのKim先生などと話しました。
あとは会議の聴講メモ。
招待講演1:Isaac Mao, 中国で有名なブロガーだそうです。中国では階層的考え方が支配的でblogは新しい考え方だっった。私がはじめた頃、とても珍しかった。いまや200Mの人がbloggingしている。blogは汚職問題やら社会問題を解くのに使われている。中国では社会の世論の仕組みとなっている。伝統的なメディアもblogと連動するようになっている。それは希望だ。中国では人々は sensorship systemを回避しようと必死。中国国内だけでなくドイツやら海外でもsensorship. ブログの10のトレンド: 1. Microlization, 2. Macrolization, 3. Identifiable information, 4. Sematic 5. Bridging, 6. Machine talk (IoT)、7. Mobility 8. Life Archieve 9. Unification of blogs, 10. Emergent properties Q. Sensorshipは続くのか?A.シンジャン地区ならインターネット遮断までできる。しかし上海ならできない。高度に使われていれば不可能。それが我々の希望だ。
一般発表:Real-time Web Search The Road Ahead by Jonghun Park. twitterの流行でreal-time searchの需要が増えている。 Real-time infoの例。スポーツの結果。株価。芸能人動向。新製品。RT Searchの問題。1.Informatitveでない。2.Spam 3.迷子。彼のチームのプロダクト feedmil.com. pointはsocial mediaのqualityをつかって個々の情報をランキングしてあげるところ。
一般発表:筑波の宇津呂さんのグループの発表。blogとnewsとwikipediaを結びつける研究。news記事からキーワードを拾い、それをwikipediaで検索して関連ページを集めて、それからキーワードリストを再構築して(一種のキーワード拡張か)ユーザに選ばせ、それでblogをサーチする。
一般発表:A model for Open Smenatic Hyperwikis by Philop Boulain@U. Southampton. WIkiをsemantic Web (RDF)化する話。ポイントはlinkをノードして扱うところか。
一般発表:Generating Researchers Networks with Identified Person on a Smenatic Service platoform by Hanmi Jung@KISTI。いわゆる論文データベースから社会ネットワーク構築。Springerのメタデータを使って構築しているそうだ。ソフトウエアはよく作り込まれている。まだ誌用段階。Springerの関係ですぐに公開とはいかなないらしい。この研究の情報はontoframe2008  http://www.w3.org/2001/sw/sweo/public/UseCases/OntoFrame/ にあり。
一般発表:Splog検出の話 by Yoshinaka
一般発表:A study on user's voting tendacy in Scial news services by Kanghak kim@KAIST。投票型サービス(diggのようなもの)は報道的に価値のある記事をみつけられるのか? アルファ投票者をみつけ、その人の投票で価値ある記事が発見できればよいというストーリー。Ongoing project。
一般発表:A social network sysmte bsed on an ontology in the Korea Institute of Oriental Medicine by SangKyun Kim 研究所内でのSNSの利用。OWLとFOAFをつかったSNS 。ポイントはプロファイリングのためのオントロジー構築。関係の種類分けがちょっとユニークか(昔、松尾さんとやった関係のオントロジーそっくり)。
挨拶:Calling all bloggers by Laurent Haug, Founder of Lift Conference / Lift Conferenceはblogtalk2009が併設されているイベントです。彼は2001からのアルファbloggerらしい. bloggerの小さなチャレンジ。1.scaling openness? Obamaは103978個の質問に答えられるか?2.アマチュアvs. プロ / プロはうまくしてYoutubeの上位にはいってします。3.会話はどこ?blogはそうでなくなりつつある。なぜ?会話はSNSとかにいっちゃった?行動しよう。bloggerはロールモデルはなろう。変化を先導しよう。規制する人にはなるな。
招待講演2:Future of Citizen Journalism by Yeon-Ho Oh @CEO of OhMyNews / いわずとししれたOhMyNewsの人です。「市民一人一人が記者」コンセプト。価値あるUGCへの条件:Credibility, Responsiblity, Influence, sustanability。OhMyNewsはonlineもofflineも大事にしている。スクールを開催したりしている。Q.OhMyewsはなぜうまくいっているか?A. OhMyNewsには6万人?の記者がある。Siteの場所も限られていて競争があり、それで質が保たれている。
一般発表:Toward Socially-Responsible Managment of Personal Information in SOcial Networks by Jean-Henry Morin, U. of Geneva。Personally identifiable information のあり方の考察。忘れる権利。伝統的メディアでは時間が経てば忘れられる。ディジタルメディアでは自発的に行動しないといけない。匿名性とプラバシー。SNSではそれをだれがどうマネージするべきなのか。
一般発表:Digital Library Application of Social networking by Myungdae Cho / Libraryとsocial mediaの関わり方。とくにSocial networkingとどうか関わるか。how to lift existing metadata into a semantic wbe/ Mapping (Marc21 ->Marc) / Open Source, SungKyunKwan University Library / flickr and youtube とmush up。Library' role in SW / Translate MARC, Thesaurus / Authority data discoverty etc. OCLC SW project http://fictionfinder.oclc.org/
一般発表:Semantic Twitter analyzing tweets for real-time event notification by M. Okazaki / 松尾さんところ学生の発表です。twitterからイベントの情報をrealtimeにとって提示するシステム。地震情報を対象に。Mecabと使い、さらにSVMで正誤を学習。 Toretter 公式情報より早くメールできる。 Korean Web Session: 韓国のdeveloperからのTalkです。Textyle by Namu Lee from NHN. NHNはNaverを運営している会社ですね。Textyleはxpress Engineというものに基づく新しいblogging toolだそうで
korean web session 2: Daum View by Jongwook Kim from Daum. Daumは韓国で有数のポータルサイトですね。Daum ViewとはDaumが運営するblog hostingなのかな。15万人登録。8000投稿/1日 推薦機能。推薦機能に工夫。信頼性によるランクづけ。投票履歴によるOpen Editor選択(?) Recommed = Comment + Link / Flow of information across Services
Panel:武田とLee(Zentium)とBurgが話す。武田は日本のsocial mediaの現状と方向性を自分なりにまとめてみた。はじめてかな、自分の研究以外の話をした。プレゼンはこれ zentiumのLeeさんのトーク。韓国はインターネットの自由度は実は低い。国民番号?による認証や噂の流布による逮捕の可能性。 Thoms Burg. Companyに対するコンサルタント。企業は何をしたらよいか。「conversation mediaに対応するように準備を始めよ」方策。ルール:制御するな、等しい立場、実験、売るな。

WWW2009 参加メモ (その3) 4/23, 24 Panelとkeynote 

2009年04月28日 | 書評
4/24のkeynoteはDr. Alfred Z. Spector (VP Research and Special Initiatives, Google, Inc)で“The Continuing Metamorphosis of the Web”。
いま重要なのは
A. Totally Transparent Processing,
B. The Rule of Distributed Computing、
C. Hybrid, not Artificial, Intelligence
だそうだ。Aでは、Voice Searchに力点がおかれていたところがちょっと興味深い。英語圏ではそうなのかな。吉川さん@SVもそういうものを立ち上げていたし。日本だと音声インタラクションとははやらないそう(萌ゲームとはありかな)あと翻訳も強調していた。いま40前後の言語をサポートしているらしい。
Cは興味が近い。AIで効果のあった部分は知能拡張や専門問題解決。いま、巨大なユーザレスポンスがあるので、人の力を使って、多くのことができるようなった。hybrid intelligenceとはコンピュータだけでなく人を含むような系。
まあこれまでもいわれてきた話ですが、Googleのもつ巨大データがあると何か違うことができそうで、その意味では期待感有り。

そのあとはWeb Scienceとはなんぞやというパネル。これは正直言ってよくわからないパネルであった。Web ScienceはNetwork Scienceを含み、社会学や心理学を含む学際的領域。だから研究者も複数の分野を知っておくべきと。しかし、結局Web Scienceが何なのかはわからずじまい。

4/24のkeynoteはつまらなかったので割愛。

ICSD参加記

2007年03月20日 | 書評
だいぶ遅くなりましたまた会議報告です.
2月にInternational Conference on Semantic Web and Digital Libraries(ICSD)とい
う会議に出席してきました.とくにしがらみがあって参加したわけではなく,ふ
とWebをみていたら,ひかっかた会議です.私は今年度からNIIの学術コンテンツ
サービス研究開発センターの仕事をするようになりました.このセンターのミッ
ションはNIIの学術情報サービスの次世代を研究開発するというものです.私の
「野望」としてはぜひセマンティックWeb技術を次世代NIIサービスに活用したい
と思っていましたから,おおこのタイトルはまさにドンピシャ,ということで参
加しました.
さてどんな会議であったか.基本的にLibrarianの会議でした.つまり参加者も
発表者も図書館関係者で,図書館関係者がセマンティックWebを学んで使ってい
こうというような意味づけなんですね.招待講演者はセマンティックWebプロパー
の人が多く,ここは面白かったです.セマンティックWebの現状をコンパクトに
まとめて話してくれました.当たり前ですが,セマンティックWebプロパーの会
議にでていると,こういう話は聞けません.改めて知識がrefreshされました.
機になったはGRDDLで,前にも神崎さんの講演でもでてきましたが,今回ちゃん
と聞いて結構気に入りました.SKOSも強調していましたが,これはいまひとつぴ
んときませんでした.
図書館系の発表のメインは機関リポジトリでした.NIIは日本で機関リポジトリ
普及でがんばっているのですが,世界各国でも同様な状況であることがわかり,
安心すると同時になんだかなあという感じです.
会議とWorkshopでドイツ,イギリス,インドの機関リポジトリの報告がありまし
た.
- ドイツのDINI(Deutsche Initiative fuer Netzwerk Information)というところ
では大学でのオープンアクセスの基準作り(certificate)を行っている.その大
項目は 1. Visibility & Server Policy, 2. Authors Support, 3. Legal
Issues, 4. Authenticity and Data Integity, 5 Indexing (Subject Indexing,
Metadata, Interfaces), 6. Visibility / Impact / Access Stastivs,となって
いる.さすがドイツ人,ここでもがちがちと基準作りをしている!
因みにドイツには109機関リポジトリがあるようである.内容は20%がArticle,
40-50%が書籍と博士・修士論文,Proceedings等が25%だそうである.ソフトウ
エアはEprint, Dspaceなどであるが,OPUSというドイツ製のソフトが44件使われ
ているらしい.
- イギリスではJISCというところが機関リポジトリを推進しているらしい.因み
JISCは大学用のネットワーク運営もやっているようで,NIIとミッションがか
なり類似している.
- インドでは35個の機関リポジトリがあり,Eprints 7, Dspace 22, Greenstone
6だそうだ.しかし,コンテンツ量は多くは年100件以下でなかなか低調である.
因みにインドでは多言語処理が大変な問題であるわけですが(実際,そういうそ
ういうセッションがあった),機関リポジトリでは事実上英語コンテンツだけが
公開されている.
一般の発表は僕がみた範囲では図書館でdigital libraryをどう実施していくか
といった実践報告が多かったです.まあ図書館系の発表はこういうことをやりま
したという結果報告が多く,いわゆる情報系のような研究報告でないので,ちょっ
と肩透かしを食らった感があります.
残念ながらSemantic WebとDigital Libraryのすごい融合は発見できませんでし
た.ならば我々が...

セマンティックWebとWeb2.0 (概要)

2006年05月31日 | 書評
セマンティックWebとWeb2.0をつなぐコンセプトして「社会としてのWeb」を語ろうと思って書き始めたのですが,ちっと進まず,そのうちにInterop06は来週に迫ってしまいました.
かわりにに,とりあえず資料のテキスト版をつくってみました.

*******************************************************************
セマンティックWebとWeb2.0
  さまざまな喧騒
    Web2.0 ブーム?
      Web2.0 って何?
    Web2.0 とセマンティックWeb は同じ目的?
    Web2.0 はセマンティックWeb を殺す?
       ところでセマンティックWeb って何?
   本講演のねらい
     セマンティックWeb の立場からセマンティックWeb とWeb2.0 の関係,ひいてはWeb の将来の方向を考える

セマンティックWebとWeb2.0
  Web2.0:ビジネスモデル及びソフトウエア構築方法論
  セマンティックWeb:技術開発および標準化
  そもそも目的は異なるが,両者とも現在あるいは未来のWebをモデル化
  しかし,ともに部分的
    Web2.0:ビジネス
    セマンティックWeb:技術
  では,そもそもWebの全体像は?

社会としてのWeb
  2つの特徴を併せ持つ
    社会としての特徴
    計算機世界としての特徴
  我々の社会の“dead copy”ではない
  両者を併せ持った新しい構造をもった社会

社会としてのWeb
  社会として
     我々の社会がもつ要素全てが持ち込まれる
       人々,もの
       人と人の相互作用,人とものの相互作用
       社会的活動
   生活,教育,ビジネス
       組織,コミュニティ
       ルール,モラル
       法律,犯罪…
       政治
      …

    特徴
       大量
       共有,共存
       不変と可変
       集中と分散
       制御と不制御
      …

社会としてのWeb
  計算機世界として
     プロセスの特徴
       時間非依存
       場所非依存
       多重化可能
       並列化可能
      量非依存
     データの特徴
       複製可能
       再利用可能
      永続性

社会としてのWeb
  Webの社会化ははじまったばかり
  現在はそのほんの端緒でしかない
  現時点での到達点
    社会の広がりの実現
    人と人のインタラクションを可能とする最も原始的なインフラの実現
   技術的表現でいうなら
    大規模情報共有 /Massive Information Sharing

Massive Information Sharing
  大規模さ/Massiveness
    大量性:人,もの
    多様性:沢山あれば多様
    分散性:沢山あれば分散
    動的:どんどんと変わりいく
  情報共有/Information Sharing
    基盤構築:共有の基盤作り
    標準化:何かを定めなけば情報交換ができない

Web2.0
  戦略的な位置づけ: プラットフォームとしてのウェブ
  コアコンピテンス
    パッケージソフトウエアではなくてサービス
    参加のアーキテクチャ
    高い拡張性とコスト効率
    再構成可能なデータソースとデータの変換
    単一デバイスを超えたソフトウエア
    集合知の活用
  代表的なサービス
    Folksonomy (ex. del.icio.us, Flickr)
    Rich User Experience (ex. Gmail, Google Map, AJAX)
    User as Contributor (ex. PageRank, eBey, Amazon)
    Long tail (ex. AdSense)
    公開ではなくて参加(ex. Blogs)
    Radical Trust (ex. Wikipedia)
    Radical Decentralization (ex. BitTorrent)
  What Is Web 2.0 Design Patterns and Business Models for the Next Generation of Software by Tim O'Reilly http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html

社会としてのWebとWeb2.0
  User as Contributor (ex. PageRank, eBey, Amazon)
  公開ではなくて参加(ex. Blogs)
  Folksonomy (ex. del.icio.us, Flickr)
    “大規模 ”“情報共有 ”(人のいる社会)
  Long tail (ex. AdSense)
    “ 大量性,多様性 ” 情報共有(社会の大規模さ,多様さ)
  Rich User Experience (ex. Gmail, Google Map, AJAX)
    “ 動的 ” 情報共有基盤(動的な社会基盤)
  Radical Decentralization (ex. BitTorrent)
    “ 分散的 ” 情報共有基盤(分散的な社会)
  Radical Trust (ex. Wikipedia)
    “ 信頼型 ” 情報共有(社会における信頼)

社会としてのWebとセマンティックWeb
  情報共有に注目
  情報共有を知識共有によって解決する
    抽象化
    共有のレイヤーを一段上げる


セマンティックWebの目的
  "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation."
  セマンティックWeb は現在のWebの拡張であり,そこでは情報には定義された意味が用意され,人と計算機の共同作業がより容易にできるようになる.
The Semantic Web, Scientific American, May 2001, Tim Berners-Lee, James Hendler and Ora Lassila
  The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.
http://www.w3.org/2001/sw/


Next Generation Web?
  Webの進化
    HTML: 表示のためのWeb
    XML:シンタックスをもったWeb
    ?? :セマンティックスをもったWeb

   なぜセマンティックスをWeb のメカニズムの中に組み込なねばならないか
     人間のためのWeb
から
    人間と機械のためのWeb
  ヘ
cf. 機械ためだけのWeb

どうやって意味を記述するか
  情報に関する情報を記述する仕組みが必要
     メタデータ
       データに関するデータ
   共通に理解し合える仕組みが必要
     シンタックス(言語,スキーマ)
     語彙(オントロジー)

Semantic Webの階梯
  RDF (Resource Description Framework)
    最も原始的な意味記述の枠組みを提供ー>SVOモデル
      Entity-Relation Model(実体関連モデル)
      セマンティックネット
  RDF Schema
    RDFに最も原始的な概念記述の仕組みを追加
      class-subclass関係,制約
      弱いオントロジー記述言語
  OWL
    より一般的な概念記述の枠組みを提供
      多様なクラス表現,多様な制約
      十分なオントロジー記述言語
      3種
  OWL-Lite
  OWL-DL
  OWL-Full

OWL(Web Ontology Language)
  RDFSにより豊富なクラス表現と制約の方法を追加
  Description Logicに基づく
  Frame風
  特徴
    クラス
      クラス要素:必要条件,必要十分条件の区別が可能
      クラス表現:
  プロパティによる制約(クラスのスロット定義の相当)
    型制限(全称/限量),個数制限,型指定個数制限
  クラスの論理演算:和,積,否定
    プロパティ
      定義域,値域の複数指定(積)
      推移性の指定
    定義のインポート

オントロジーの定義
  Gruber
    概念化の明示的な仕様
  FIPA98
    特定のドメインの構造の明示的な仕様。
    対象領域を参照するための語彙(論理定数と述語記号)と領域に存在する制約の表現と語彙の解釈を制限する論理的言明。
    あるトピックに関する知識の表現と通信のための語彙とその語彙で示される実在物(entity)の関係と属性の集合である。
  ソフトウエア的発想でいえば
    語彙以上OOのオブジェクト未満
  もっとわかり易くいえば
    共通の概念の体系(“語彙”とその定義とそれら間の関係)

オントロジーの例
  SUMO(Suggested Upper Merged Ontology)
    Collection and organization of concepts used frequently
    Simple relationship between concepts

オントロジーの例
  DOLCE
    Concepts
      Endurant / Perdurant / Quality / Abstract
  Endurant:
    “Things”
    An existence over time
    May change its attribute
  Perdurant
    “process”
    No change over time
    May switch a part to the other
    Relations
      Parthood (abstract or perdurant)
      Temporally Parthood (endurant)
      Constitution (endurant or perdurant)
      Participation between perdurant and endurant

オントロジーの例
  “奈良観光オントロジー”

社会としてのWebとセマンティックWeb
  情報共有に注目
  情報共有を知識共有によって解決する
    抽象化
    共有のレイヤーを一段上げる

   しかし,他の大規模特性も同時に解決しないといけない
     多様性
     分散性
     動的
    …



セマンティックWebにおける大規模特性の解決
  多様性,分散性
     分散オントロジーとオントロジーアラインメント
      HICAL
     オントロジーの協同開発
      Semantic Wikis
    Web Mining によるオントロジーの構築
      Ontology としてのfolksonomy
       人間関係ネットワークの発見 (Polyphonet)

HICAL: インターネットディレクトリの関係付けの発見
  目的
    階層構造間の関係の発見
  問題設定
    インターネットディレクトリ
  方法
    インスタンスの共通性から統計的に推測

HICAL
  類似するカテゴリペアの判定
    インスタンスを共有をκ統計量で判定
    インスタンスとはURL
   概念の包含関係を利用
     上位概念は下位概念のインスタンスもインスタンスとして持つ
   カテゴリペアの探索
     木構造を上から探索
     発見したペアのみ詳細化

Semantic Wiki
  Wikiの仕組みを使ってメタデータおよびコンテンツを協同編集,公開
  沢山の実装
    Semantic MediaWiki
    Semantic MediaWiki (jp)
    IkeWiki
    …
Ontologies are us: A Unified Model of Social Networks and Semantics [Mika05]
   コミュニティを考慮に入れたオントロジーのモデル化
  Actor - Concept - Instance
    3 部 グラフから2 部グラフへの変換とネットワーク分析
    6 パターンのネットワーク

Social bookmarkingからのオントロジー抽出
  Del.icio.usからのコミュニティ・オントロジー抽出
    30,000 users(2004.12)
      Actor - ユーザ
      Concept - タグ
      Instance - ブックマークのURI

Social bookmarkingからのオントロジー抽出
  概念の上位下位判定
     出現頻度と共起,包含率からBroader - Narrower を 自動 決定

Polyphonet
  Webから人間関係を抽出するシステム
  技術分野
    Webマイニング
      Web上の情報に対して、パターンの抽出処理や解析処理を行うことで、明示的に書かれていない有用な知識を見つけ出す技術。
  特徴
    一般の検索エンジンを利用している。数万回~数十万回、Webの検索を行いながら、研究者の情報を抽出・整理する。
      検索エンジンでページを集める⇒一部のページの解析 ではなく、Web全体のページの解析を検索エンジンをうまく用いることで行っている。
    自然言語処理、機械学習と呼ばれる手法を組み合わせて用いている。
    名前と所属だけを入れれば、あとの情報はすべてWebから自動的に抽出する。

情報・コミュニケーション活動
Information and Communication Activities (ICA)
  2つの層による2つのサイクル

情報・コミュニケーション活動としてのブログ

情報・コミュニケーション活動としてのSNS
  人のつながりを中心としてコミュニケーションを支援

情報・コミュニケーション活動としてのwiki
  「創る」段階で情報活動とコミュニケーション活動を一体化

Web3.0?
  社会としてのWebはまだ途上
    Web1.0: 言葉が呪術の世界
      HTML を操れる者が特権階級
    Web2.0: 言葉を操る知識階級の世界
       ネットに積極的に関与する人々でつくられる世界
       まだ特別な階級による“ 善意 ” による “ 平和 ” な世界
       フラットな構造:擬似的な “ 民主主義 ”

Web3.0?
  社会としてのWebはまだ途上
    Web3.0?: ほとんどの人が参加する世界
      “ 声なき大衆” の参加
       混沌,混乱(cf. オンラインゲーム)
       構造化,囲い込み
   新しい秩序の形成
       革命??
       ほんとうの “ 民主主義 ” の実現????