Takeda's Report

備忘録的に研究の個人的メモなどをおくようにしています.どんどん忘れやすくなっているので.

情報の価値化?

2006年08月29日 | 研究
情報の価値化・知識化技術ワークショップなるものにでています(単に聴講).
「情報の価値化」なんてテーマでパネルをしているわけですが...

さすが辻井先生はわかっていらっしゃる.何が重要かというと,とにかく情報が公開されたこと,さらにどんどんその粒度が細かくなっていること,だから頭の中のプロセスが共有されるようになれば,何十倍の効率的な研究ができるようになるなどと.

前の記事に書いたように,この10年は恐るべき変化だったわけです.どんどん情報が公開,共有されるようになったわけです.それはどんどん進むだろう.とくにセンサーからどんどん情報が提供されるようになって,さらに一段と情報が増えるでしょう.

我々はビットとアトムの両方の世界に住んでいる(MIT石井先生).それは次の5年,10年でより明らかになるでしょう.

だから「情報の価値化」というテーマはなんとなくピントをはずしている.我々はすでに情報の世界に住んでいる.すんでいる世界の価値を問うというのはよくわからないよね.

情報の世界の構造とは何か,を問うことが第一だろう.我々の周囲はどういう形をとるだろうか.社会はどんな構造となるのだろうか.

今はその構造は比較的簡単である.いわばGoogleがあれば事足りるぐらい簡単な構造なわけです.しかし,センサー情報などが流入されてくれば,そうは言っていられない.きっともっと複雑な世界になるでしょう.

あとで振り合えって見れば,2000年代はシンプルな世界でよかったなあ,と回顧するかもしれない :-)

Webの進化と情報流通(2/2)

2006年08月29日 | 解説記事
5.学術情報の流通
では、学術情報の流通ではどうであろうか。学術情報においては情報流通を形作るのは出版社や学術団体(学会)であるが、これもスケールこそ違うが、大量情報の一方的配信という基本的にマスコミと同様の性格をもっている。ただし、情報流通は少し異なる(図2参照)。それは論文の投稿という形で利用者が情報を能動的に提供するという点である。マスコミにおいては利用者と情報収集は分離されていたが、学術情報流通では全体がループを形成している。一般の情報流通においては利用者は情報流通に能動的に参画することはできなかったが、学術情報流通では研究者の情報流通の担い手である。すなわち、研究者側も情報の収集、生成、公開という3つの活動を行っている。
とはいえ、学会や出版社がだす学術雑誌というのは出版そのものが限定されているので雑誌の発行そのものがある種の権威であり、さらにその学術雑誌の間にも権威の差があった。すなわち研究者側にそれほど自由度があるわけではない。このような固定的な枠組みで情報流通が行われてきた。
このような学術情報の流通は、利用者も情報流通の担い手であるという点においては、現在のWebにおける情報流通と同じである。同じというよりは先祖というのが正しいであろう。そもそもWebの開発の目的が研究情報の交換にあったことからわかるように、Webは個々の参加者が自主的に情報を公開、相互に交換し合うという学術コミュニティのやり方に基づいている。
ただし、現在のWebの状況は古典的な学術コミュニティの情報流通の方法を飛び越えて、さらに先に進んでいる。かつては学術出版社や学会は情報流通のコストの担い手であり、基本的には学術雑誌や学術会議を通じてしか、論文を公開して流通する方法がなかった。しかしWebにおいては誰でも情報を公開できる。また、公開のコストは格段に低くなった。単に自分の論文内容を人に見せたければ自分のWebで公開すればいい。むしろ、Webで手に入る論文の方が印刷物でした手に入らない論文よりもはるかにに引用されやすい5)。例えば、Googleで用いられているPageRankアルゴリズムの論文6)はスタンフォード大学のテクニカルレポートとして刊行・公開されているにすぎないが、少なくともWebで見つかる論文で322回引用されている7)。出版社の方も印刷物を伴いないオンラインジャーナルを積極的に刊行するようになり、ジャーナル数も増加した。この結果、これまでのような権威づけのやり方は通じづらくなっている。
このように、学術情報流通も確実にWebの進化に影響を受け、変化を迫られている。だとするならば、4章でみたような情報流通の変化も学術情報においても現れるはずである。例えば、非常に著名になる論文がある一方で、マイナーな論文の存在価値もまた見直されるであろう。また、既存の権威に頼らないボトムアップな順位付けや体系化も行われるであろう。
これから考えなければいけないこともまた同じであって、情報流通を単に情報活動ではなく、情報・コミュニケーション活動として捉えなすことである。すなわち、研究者間のコミュニケーションをもっと積極的に取り込む必要がある。研究者のネットワーク8)(図5参照)や研究者間のインタラクション支援9)の研究はこの方向の重要な一歩であると考えている。
考えてみれば、そもそも学会というのは研究者の集まりであって、研究者間のコミュニケーションを実現することが目的であった。その意味ではその本旨に立ち返えるということであるといえよう。

6.おわりに
本稿ではWebの進化に伴って情報流通がどのように変わってきたかについて考察を行った。Webは情報流通に革命的変化を及ぼしている。誰でも自由に情報を公開して利用することができるという理想的状況が今実現している。これは強調して強調しすぎることはない。ただ、急激な変革に我々自身も戸惑っているし、また社会も対応しきっていない。その結果、様々な軋轢や新しい問題が起きているのも確かである。しかし、このような自由な情報流通から後戻りすることはないであろう。我々もむしろ積極的にこの新しい情報流通に取り組み、問題解決に取り組んでいくべきである。

参考文献
1) Tim O'Reilly, What Is Web 2.0 Design Patterns and Business Models for the Next Generation of Software, 2005 http://www.oreillynet.com/pub/a/oreilly/tim/news/2005/09/30/what-is-web-20.html
2) Albert-Laszlo Barabasi, Linked: The New Science of Networks, Perseus Books Group, 2002 (邦訳:アルバート・ラズロ・バラバシ, 新ネットワーク思考, NHK出版, 2002)
3) Jim Giles, Internet encyclopaedias go head to head, Nature 438, 900-901, 15 December 2005
4) JXian Wu, Lei Zhang, Yong Yu, Exploring Social Annotations for the Semantic Web
5) Steve Lawrence, Free online availability substantially increases a paper’s impact, Nature, Volume 411, Number 6837, p. 521, 2001
6) L. Page, S. Brin, R. Motwani, and T. Winograd. The Pagerank Citation Ranking: Bringing Order to the Web. Technical report, Stanford Digital Libraries, 1998.
7) http://citeseer.ist.psu.edu/page98pagerank.html(accessed 2006-8-24)
8) Y. Matsuo, J. Mori, M. Hamasaki, K. Ishida, T. Nishimura, H. Takeda, K. Hasida and M. Ishizuka: POLYPHONET: An Advanced Social Network Extraction System from the Web, in Proceedings of the 15th International Conference on World Wide Web (WWW2006), pp. 397–406, Edinburgh, Scotland (2006), ACM Press.
9) K. Numa, T. Hirata, I. Ohmukai, R. Ichise and H. Takeda: Action-oriented Weblog to Support Academic Conference Participants, in IADIS International Conference on Web Based Communities 2006 (WBC2006) (2006).

Webの進化と情報流通(1/2)

2006年08月29日 | 解説記事

#これはとある図書館学系学術誌向けに書いている解説原稿の草稿です.自分の見直しを兼ねてブログ上でも公開します.かなり独断と偏見で書いているふしもありますので,ご意見があればぜひどうぞ.
##goo blogは図が1つしか入らないのでつらいですね.どっかに変えます.

Webの進化と情報流通

1.はじめに
いまや、World Wide Web(以下Webと呼ぶ)なしの仕事や生活を想像できないぐらいWebは我々の社会活動や生活に深く入り込んでいる。しかし、翻ってみれば、Webが実用に供されるようになって高々10年程度であり、極めて最近のことである。技術の進歩に比べれば社会の仕組みの変化は緩慢であり、いまなおWebによって社会は変わりつつある。一方、Webもさらに質的量的な変化を続けており、ことに近年の変化をWeb 2.0と呼ぶようになっている。本稿ではこのようなWebの変化と社会の変化の係わり合いを情報流通、特に学術情報の流通を中心に見ていく。

2.Web 1.0とWeb 2.0
Tim O'Reillyが名づけたWeb2.0はWebの進化の一つのスナップショットとして興味深いものである。彼の記事によれば、Web2.0とはまずWebをプラットフォームとして位置づけることであり、特徴的な要素としては

1. パッケージソフトウエアではなくてサービス
2. 参加のアーキテクチャ
3. 高い拡張性とコスト効率
4. 再構成可能なデータソースとデータの変換
5. 単一デバイスを超えたソフトウエア
6. 集合知の活用を挙げている。

この個々の特徴やその具体化されたサービスなどWeb2.0の詳細については元記事1)を参照されたい。
ここで重要なのは、Web2.0というのはこれまでのWeb(Web2.0に対してWeb1.0と呼ばれる)と断絶された新しいものが出現したわけではないという点である。Webの発明以来、世界中の利用者がWebを使い倒し、新しい使い方を発見したり、必要ならば機能を追加したりしてきた。そういった進化するWebの現状を総称しているがWeb2.0である。
したがって、単にWeb2.0として列挙されているは特徴やサービスを見るだけでは、Web2.0というコンセプトで表わそうとしている全体像を捉えるのは難しい。本稿で情報流通という切り口から、Web以前からWeb利用の流れをみていくことで、Web2.0で表現しようといることをみていくことにする。

3.旧来の情報流通とWeb時代の情報流通の違い
情報を伝達するという行為は、古く遡れば口伝など非文字時代から存在する。しかし、文字の利用によって、初めて時空間上の広がりを持つことが可能になった。そして印刷の発明によって大量の情報伝達が可能になり、時空間を越えた大量の情報伝達が可能になった。さらにラジオ・テレビといった放送や電話といった通信が加わり、20世紀の主要な情報伝達手段となった。
この時代の情報流通の特徴は大規模な情報の配送、すなわちマス・コミュニケーション(マスコミ)の発達にあろう。マスコミの担い手であるマスメディアは情報流通の基幹媒体を支配しており、情報流通全体をコントロールする役目を果たしている。このマスメディアによる情報流通を模式的に描くと図1のようになる。マスメディアは利用者を含む社会全体から情報を収集して、自らの手で編集して、利用者に配信している。利用者は基本的に収集や配信において受身の立場である。唯一の能動的行為は情報選択段階であるが、多くの人にとって、それはどのマスメディアを選ぶかという選択であり、これも必ずしも多くの選択肢があるわけではなかった。他には図書館で調べるという方法も用意されていたが、必ずしも多くに人が利用しているわけでなく、また手に入る情報も限られていた。
さて、Web時代の情報流通はどうであろうか。Webを用いれば誰でも情報を多くの人に提供することができる。これまで個人での情報提供することは原理的には可能であったが、量の壁を越えることはできなかったので、実質的には不可能であった。配信情報量や配信先の広さとコストは比例していたので、個人が広く情報提供をすることはできなった。ところがWebは最小限のコストで情報公開ができ、かつ配信先の広さや配信する情報量とコストは比例しないので、だれでも大量に広く情報提供をすることができるようになった。すなわち、これまでマスコミが独占してきた情報流通の仕組みを誰でも利用できるようになったわけである。
情報の収集においても劇的に変わった。これまでは情報の収集というのは、実質的にはマスメディアが提供するもののうちからの選択という消極的な選択というものであった。しかし、Webによって多種多様な情報が提供され、利用可能になった時代においては、情報収集の可能性は極めて広がっている。例えば、製品の情報を得ることを考えてみよう。以前であったらマスメディアを通じて提供される情報以上のことを得ようと思えば大変な労力がかかった。製品のカタログを手に入れるには販売店やメーカーにコンタクトをとって取得しなればならなかったし、少し古い製品であればそれすら不可能であった。また、その製品の利用者の感想などを集めることはまったく不可能であった。今は、Webを使えば、製品情報から利用者の感想、最安値の販売店まで、ありとあらゆる関連情報を収集することができる。
情報にかかわる活動とは、情報の収集、情報の生成、そして情報の公開の3つの活動からなるといえる(図2参照)。これはマスメディアなど情報流通を生業とする者にとって当然であるが(図1での取材、編集、出版・放送が、それぞれ、収集、生成、公開に相当)が、いまや個人でもこのような活動が可能になっている。すなわち、Webによって初めて一般の個人のレベルで3つの活動を行うことができるようになったわけである。この点においては、情報流通を生業とする者と個人は同じ土俵に立っているといえる。昨今は2ちゃんねるなどの掲示板やブログ(Weblog)など個人による情報がときと場合によってはマスメディアなどが提供する情報より重要な情報なることがあるが、このような状況を鑑みれば不思議はない。
ただし、もちろんこれはマスメディアと個人が対等な立場に立った、あるいは個人がマスメディアに取って代わるということを意味するわけではない。むしろ、異なるタイプの情報流通が始まっていると認識すべきである。その特徴は、これが昨今のWeb 2.0で強調されている集合知(collective intelligence)である。以降、Web 2.0の指し示すことの中から、情報流通のしくみとしてWebに注目して、概観していく。

4.Web時代の情報流通の仕組み
旧来のメディアは情報流通を実現するために組織が必要であった。このため、それぞれの組織の目的にあった情報流通を行っており、トップダウン型の情報流通であった。また情報流通の仕組み上、情報はいったん集められ、編集されたあと、提供される。このため集中型の情報流通である。同様の理由から情報流通の仕組みにより、一方向型であった。
これに対してWebにおける情報活動においては組織は必要なく、各個人が自発的に参加可能である。すなわち、ボトムアップ型の情報流通が可能になっている。また、誰でも情報公開ができるので、分散型(どこにも中心がない)の情報流通が可能である。そして結果として双方向の情報流通が可能である。
このボトムアップ型かつ分散型という性質は、とにかく多様な情報の流通を可能にしている。これまでであったらまず流れることのない極めて少人数の人しか興味をもとないマイナーな情報もWebなら情報として流通可能である。Webによる情報流通はかつてのマスメディア以上の広範囲に流通可能である。このため、世界的全体あるいは日本全体に分散したマイナーな興味をもつ人の間での情報流通も可能になった。あるいは極狭い地域の人しか興味を持たない情報も同様に流通可能になった。これは旧来のマスメディアでは不可能であった種類の情報流通である。
一方、集約的な情報流通も生まれつつある。ボトムアップかつ分散という性質だけであったら情報流通はひたすら発散的になってしまうと思われるかもしれない。Webの世界は巨大なネットワークとしてみることができる。このような巨大なネットワークは均一にリンクが分散された形態ではなく、不均等にリンクが分散されたネットワークを作りやすいことが知られている2)。すなわち、ネットワーク上の少数のノードにリンクが集中する傾向がある。この分布はべき法則にしたがったものになるといわれている。いわば、“富めるものはますます富む”という傾向である。このような傾向は実社会でも起こってきているが(例えば企業の寡占化傾向など)、Webのような非常に透過性の高い世界ではそれがより強力な効果をもたらしている。これまでは国家や言語、あるいは地域や社会階層など、さまざまな障壁があったが、Webの世界ではこのような障壁は格段に低くなっている。結果としてWebにおいては新しい集約的情報流通が生まれている。ただし、その集約的情報流通の核となるものは組織である必要なく(組織であってもかまわないが)、むしろ偶発的な核であることも多い。
この著しい分散と過度の集中、両方を併せ持つが現在のWebである。この現象の一端がロングテールと呼ばれる現象として現れている。ロングテールとは縦軸に人気度、横軸に商品などの種類を人気度順に左から右へ並べたグラフを書いたときに、そのグラフが長い尻尾をもった恐竜の形にみえるようなことをいう。一般に、商品の人気度というのは、左端にピークから急速に下がっていく。ロングテールの場合というのは、この下がったあと、人気度が非常に低いものの人気度が0ではないものが延々と続くというところに特徴がある。左端のほうをヘッド、長く続く右の部分をテールと呼んだりする。このテールの長い部分は著しい分散の表れである。これまでの情報流通ではどこかの閾値で切られて、流通されなかった部分ということになる。この部分が流通されるようになったということの価値は大きい。一方、ヘッドはより高くなる傾向が予想される。これもまたWebの別の側面である。
Yahoo!やGoogleなどの組織が情報集約の核となる場合は比較的理解しやすいであろう。しかし、このような組織を中核としない集約的情報流通もさまざま存在している。例えば、2ちゃんねるに代表される巨大掲示板をみてみよう。2ちゃんねるはシステム的に見れば、誰でも立ち上げうる掲示板の一つに過ぎない。実際、同様のシステムを運営している掲示板は他にある。しかし、2ちゃんねるは様々な要因はあったものの、あるときから雪だるま式にユーザが増え、結果的に日本最大の掲示板となった。この掲示板には多種多様な話題が取り上げられている。誰でも新しい話題を提起することができるので、ボトムアップ式の情報流通のしくみである。話題の個数で言えば、圧倒的にマイナーな話題が多い。ロングテールのテールの部分である。一方、2ちゃんねるは集約的効果も著しい。時事ニュースに関する板には極めて多数のユーザが集中して書き込みが行われており、ある種の世論形成を行われているといっても過言ではない。
また、別の例ではWikipediaを挙げることができる。Wikipediaとは誰でも書き込める仕組みで百科事典を作ろうというプロジェクトであり、英語版で約130万記事、日本語版で約25万の記事がある(2006年8月現在)。Wikipediaの百科事典としての品質の議論は他に譲るとして3)、このような集約的情報流通が可能であるということが驚きである。
また別の例としてはソーシャル・タギング・サービスがある。ここでタギングとはWebページや写真などに何らかの文字列を結びつけることであり、分類や整理のために行われる。ソーシャル・タギングとは、このタギングを多くの人間で共有しながら行っていくというものである。Webページに対するソーシャル・タギングではdel.icio.us、写真に対するものとしてはflickrが有名である。タギングには文字列である以上の制約はないので、個人ではまだしも、集団であればひたすら発散してしまうだろうと思うかもしれない。しかし、実際には同じくべき法則にしたがった分布ができている4)。すなわち、少数の人にしか使われない多数のタグがある一方、少数のタグには沢山の人に使われている。結果としてある種の分類システムとして機能しており、これはfolkとtaxonomyを組み合わせた造語folksonomyと呼ぶようにまでになっている。
これらのシステムにおいて技術的に特別な仕組みが発明されたわけではない。小さなコミュニティでの情報流通の仕組みをスケールアップしているに過ぎない。元々の目的はそのような小さなコミュニティでの情報流通の支援である場合が多い。しかし、そのスケールアップによって得られた効果はその目的を超えて、一部において既存のマスメディアと拮抗するようにまでなっている。このようなボトムアップ型情報流通は従来のマスメディアでは拾うことのできなかった情報を広く伝えることができるという意味では画期的であるが、一方制御の仕組みがないのでいわば“暴走”する危険性も危惧されている。

5.情報・コミュニケーション活動支援
前章ではボトムアップ型の情報流通について述べた。ボトムアップ型の情報流通は一方ではロングテールと呼ばれる裾野の極めて広い情報流通を実現する。また一方では集約的効果によってマスメディアに拮抗する情報流通も可能になっていた。実際の人々の活動はこれらを両端とする広いレンジに広がっている。すなわち、一方で大規模な情報流通に参加しつつまた一方では小さな情報流通にも参加している。ではこの広いレンジの情報流通活動を実現するのはなんであろうか。それは人々の間で行われているコミュニケーションにある。人々は多様なつながりをもっており、そのつながりによって情報流通が形成されている。すなわち、人のつながりの部分も含めて情報流通をみていく必要がある。
ここでは、情報流通に関わる人間の活動を情報・コミュニケーション活動として、2つの層からなる6つの活動として模式化している(図3参照)。ここでは、先の情報を収集する、作る、公開する、という活動に対応するコミュニケーション活動として、関係を求める、一緒に行動する、自らを公開する、という3つを挙げている。関係を求める活動では自分と関係する人々を探してつながりをつくる活動である。一緒に行動するという活動では、実際に何かを共同で作業している。自らを公開する活動では、新しい関係が可能になるように、自らを人に見せる活動である。
多様な情報流通ツールもこの視点からみるとわかりやすくなる。例えば、ブログにおいては、基本は情報の作成と公開活動を支援するものである。ところが、ブログにはもうひとつの特徴がある。それは個人と個人を結びつけるも働きである。ブログは、実名であれ匿名であれ個人が公開することが多い。いわばブログがある意味ネット上の個人を表現している。ブログにはトラックバックという仕組みやブログロールといった他ブログへのリンクといった慣習があり、ブログ間の関係が重視されている。これはまさに、関係付ける活動と自らを見せる活動の支援である。ただ、ブログにおいては明示的な機能ではなく、ユーザの使い方で実現されている。
mixiに代表されるソーシャル・ネットワーキング・サービスはより明確にコミュニケーション活動を支援している。まさに、つながりを作る、求めるというのが基本サービスである。ただ、共同活動といった色合いは少ない。
wikiはまず第一に簡便にWebページが作れるという意味では、情報作成活動、情報公開活動のツールであるが、一方で共同でページを作ることを支援している。すなわち、一緒に行動する活動も支援している。現在はそれぞれのツールに得意不得意があり、それらを適宜利用して情報・コミュニケーション活動を実現している。今後はこれらがより統合されていくことであろう。
先に挙げたボトムアップ型の情報流通が抱える問題点の解決についてもコミュニケーション活動が重要な役割を果たすと考えられる。単に情報の流通に注目するのではなくて、その情報流通の基盤となっている人のつながりまで含めて情報流通を考えることで、信頼性の基盤に立った情報流通を構築できると考えられる。コミュニケーション活動に伴って、情報の収集や生成、公開といった情報活動が行われている。見方を変えれば、情報活動の根拠がコミュニケーション活動であるいえる。情報は誰が作ったかはもちろん重要であるが、それだけにとどまらない。誰がその情報を利用しているか、誰のための情報なのか、といった関係性も情報の信頼性の根拠である。
例えば、ブログの世界では著名なブロガー(ブログを公開する人)というのがいる。著名なブロガーとは、そのブログの内容が多くの人によって読まれ、結果として沢山のトラックバックやブログロールで指されることで、ネット上でも突出する存在となっている人々のことである。ただし単に被リンクが多寡だけではない。ブログの場合、トラックバックなどを参照することで、どのような人々に支持されているかを知ることができる。すなわち、すなわち、ある種の信頼のネットワークが作られているといえる。なお、彼らは必ずしも実名でブログを運営しているわけではない。ニックネームなどの場合もあり、この場合は実社会でどのような人であるかはわからないわけである。そのようなこととは関係なく、前述のような信頼のネットワークが作られているというのは、ネットワーク上での信頼ある情報流通の可能性を示唆するものといえよう。 (続く)