佐々木俊尚の「ITジャーナル」

佐々木俊尚の「ITジャーナル」

世の中の事象をコンピュータ上で可視化する手作業

2005-11-28 | Weblog
 前回の続きをもう少し。

 世の中にある事象は、デジタル化しただけでは使えない場合も多い。美崎さんの例で言えば、本をスキャンしてデジタル化し、画像として保存しても、そのままでは再利用は難しい。検索ができないからだ。検索ができるようにする――つまり可視化するためには、テキスト化するか、もしくはアノテーションやタグを付加する必要がある。

 これは考えてみると、実のところの私の取材にも同じことが起きている。

 取材にはいつも、ノートブックパソコンとICレコーダー2台を持って行く。インタビュー中はICレコーダーで録音しながら、ノートブックパソコンで相手のしゃべっていることばを同時タイプしていく。このタイプがうまくいけば、デジタル化と可視化が一気に行われることになって、その後原稿にするのにとても便利だ。

 だが相手のしゃべり方が非常に速かったりすればタイプが追いつかないときがある。また、非常に微妙な取材(たとえば対決的な取材だったり、相手が話したくないことを無理矢理引き出したりするようなとき)の場合には、パソコンに向かってタイプすることをはばかられる場合もある。

 そんなときはICレコーダーの録音が役に立つ。

 新聞記者時代には、テープでの録音は特別な場合を除けば、基本的には行っていなかった。会社から支給されている小型のメモ帳にひたすら書きまくるか、あるいはそれさえ許されない場合は、必死で頭の中に記憶した。それさえ許されないというのはどういうときかといえば、刑事などへの夜回り取材の場合だ。お互いの信義があるから、録音どころかメモ取りさえいっさい行わない。相手が重要かつ長い話をしてくれたときには、勧められる酒も上の空で必死で頭の中に焼き付け、トイレに立った時などに便器に座ったままで必死でメモ帳に書き起こしたりした。

 まあでもこれはある種の文化、風習のようなものである。日刊のメディアである新聞には「その日暮らし」的風土があり、あまりまどろっこしいことは好まれないのだ。

 月刊誌や書籍などの取材の場合には、当然のように録音が行われる。かつてはカセットテープが主流だったが、あとから管理がたいへんだった。九〇年代後半からはMDも登場して音質は向上したが、メディアの管理が面倒なことはかわりがなかった。

 しかし2000年ごろからICレコーダーが急激に普及し、多くのライターが使うようになった。かつてはメモ帳が主流だった新聞の世界でさえそうで、自民党本部前のぶら下がり取材などでは、政治家の前にたくさんのICレコーダーがマイクのように突きつけられるようになっている。ICレコーダーの場合、データはパソコンのハードディスクに転送できるから、日にちと取材対象をファイル名につけておけば、管理も容易このうえない。

 だがテープがデジタル化されてファイルになっただけでは、当たり前だけれど使いにくい。やっぱり録音の内容をテキストに起こす作業が必要になり、この作業にかかる時間はテープのころとあまり変わらない。パソコンの場合は書き起こしキーなどが使えるから若干は楽になったとはいえ、それでも1時間の録音をテキストに起こそうとすると、2時間から3時間はかかってしまう。書籍の取材などで6時間ぐらい話を聞いていたりすると、テキスト化の手間を考えただけで絶望的な気分になる。

 そこで最近は、量の多いものに限っては、テキスト興しを外注に出している。1分20円から30円程度。1時間の録音だと、1万2000円から2万円程度かかる。高いか安いかは費用対効果の問題があるから一概には言えないけれど、美崎さんは書籍のスキャニング費用として「1ページ10円で外注に出している」と言っていた。ほぼ同じスケールの金額といえるかもしれない。

 テキスト化ではなく、タグやアノテーションを付加するのにもやはり人力が必要だ。フォークソノミーなどはそれをひとりの力でなく、多くの人の助けをやってしまえば楽になるという考え方による試みだけれども、やっぱり人手がかかることには代わりはない。

 結局のところ、世の中の事象をコンピュータ上で可視化するためには、どこかで必ず人手を加えることが必要になってしまっている。Google Newsがアルゴリズムによる完全自動化で編集者をなくしたのと同じように、この部分の手作業を自動化するすべはないのだろうか。

「記憶する住宅」プロジェクト

2005-11-19 | Weblog
 竹田茂さんのスタイル株式会社が運営している「携帯大学」の会合で、未来生活デザイナー、美崎薫さんのレクチャーを聴いた。

 美崎さんは自宅で「記憶する住宅」というプロジェクトを実施している。これまでの人生で出会った人や読んだ本、観たビデオ、見た風景などありとあらゆる体験をデジタルコンテンツ化し、ハードディスクに蓄積するというものだ。そしてこの蓄積したデータは、Smart Calenderなどのアプリケーションソフトを使って閲覧することができる。このソフトは2004年度のIPA未踏ソフトウェア事業にも採択されているが、非常にすぐれたインターフェイスを持っている。このソフトを使って過去の写真を見る体験は、不思議な感動を伴っている。

 美崎さんの試みは、マイクロソフトのゴードン・ベル博士が行っているMyLifeBits(私の人生の断片)プロジェクトと同等のものといえる。

 これらのプロジェクトを総称して、「ライフログ」と呼ぶ人もいる。自分の人生が、どれだけデジタルに転写できるのか? デジタルに転写された人生は、イコール自分となるのか? もしデジタルコピーの技術がどんどん進化していって、人間が外界から取り入れた五感すべてをデジタル化できるようになったとしたら、そのデータは自分をそのまま表現したものになるのか? そうだったらそのデータに転写されない「自分」には何が残っているのか?

 考え出すときりがないが、非常に興味深い思考実験だと思う。

 ところでその日の美崎さんのレクチャーでは、読んだ本をどうデジタル化するのかという話があった。世の中のたいていのものはアナログで、それをすべてデジタル化していくのは非常な困難が伴う。写真はデジカメで撮れるからまあいいとしても、たとえば配布される紙の資料、映画館で観る映画、コンサートで聞く音楽はみんなアナログだ。

 私が美崎さんに初めて会った時、名刺を渡すと彼はその名刺を首からぶら下げていたデジカメでパチリと撮影し、名刺を返してくれた。彼はそうやって何でもデジタル化しているのである。しかし本はそう簡単にはいかない。読んでいくはじから一枚一枚スキャンしていくのはたいへんだし、本に集中できない。

 そこで彼は、SOHOビジネスの人に依頼して、本を丸ごと一冊渡してスキャンを頼んでいるのだという。料金は1枚10円。250ページの本なら2500円になる。買う値段よりも高くなるが、その金額ですべてデジタル化されるということを考えれば、安いともいえるかもしれない。

 しかしデジタル化されていても、あくまでそれはスキャンデータであってテキストになっているわけではない。だから検索はそのままの状態では不可能で、もう一段仕掛けが必要になる。理想的にはOCRだが、いまの技術レベルでは現実的ではない。現実的な解としては、ページごと、章ごとなどにタグをつけていくということになる。

 しかしこの手間もそうとうに面倒で、ひとりの力では難しい。だから美崎さんは「本は人々の共有物なんだから、みんなでタグを付けていくようなことができればいいのに」という。最近、Flickrなどで話題となっているフォークソノミーの考え方である。だが現実には、著作権の問題があるから書籍をデジタル化し、そこにみんなでタグ付けをしていくというプロジェクトは日本ではなかなか実現しそうにない。

"グーグルチルドレン"のコミュニティサービス

2005-11-10 | Weblog
 はてな、イー・マーキュリー、グリーという今をときめくネットベンチャー3社を取材した。
 いずれもC2C(消費者間取引)やCGM(Consumer Generated Media)、あるいはソーシャルメディアなどと呼ばれているようなコミュニティベースのビジネスを展開している。流行の言葉で言えば、Web2.0企業である。

 ……余談になるが、デジタルガレージが「Web2.0」という名前の会社を設立したという。何ともデジタルガレージらしいというか、あるいは機を見るに敏な伊藤穣一氏らしいというべきか、あざといまでに単刀直入なネーミングには思わず笑ってしまった。ブログブーム初期の2002年にJBA(Japan Blogging Association)という団体を立ち上げて、日本の先駆的ブロガーたちから批判を浴びたのを思い出してしまう。

 余談はさておいて、上記の3社にはいずれも共通点がある。広告に依存した収益モデルを持っているということだ。はてなとグリーはGoogle AdSenseやアフィリエイトが収益の柱になっている。またイー・マーキュリーのmixiは、バナー広告だ。バナー広告依存というとなんだか古い印象を受けるが、同社の笠原社長の話を聞いていたく納得した。

 mixiはユーザーの7割が3日に一度は必ずログインしているという。驚くべき利用率で、コミュニティサービスというのはそれだけ麻薬的ということなのだろう。ユーザーが1日に閲覧するページの数も平均50に達しており、みんなものすごい勢いで没入している。そこまでの利用率となるとポータルサイトよりもバナー広告の認知度も当然高くなる。笠原社長は「大規模ポータルサイトではバナー広告を1000万人の利用者が一度見るだけかもしれないが、mixiでは170万人のユーザーが繰り返し同じバナー広告を見ることになり、認知度が高い。しかもそうやってきちんと認知してから広告をクリックするため、コンバージョン率が一般的なバナー広告の3倍にも達している」と話した。

 さらにイー・マーキュリーでは、ユーザーのパーソナルデータの蓄積を生かして、性別や住所などにセグメント分けしたターゲッティング広告を配信していくことも考えているという。このあたりになると、AmazonのパーソナライゼーションやGoogle Baseのコンセプトにも近づいていく。

 話を戻すと、3社とも広告収入を収益源として、その上で無料サービスを提供するというモデルである。もちろんはてなやmixiは有料サービスも提供しているけれども、決して収益の中心ではない。そしてこうした枠組みが実現するようになったのは、GoogleやOvertureなどの偉大な先行者が新たな時代の広告依存型モデル――すなわちターゲッティング広告というきわめて効率の良い広告モデルを打ち立てたからだ。このターゲッティング広告の登場によって、Web2.0的なビジネスを志向する企業は、コンテンツの有料化に頭を悩ませなくても良くなったのである。

 そうやって収益源を確保しておいて、あとは楽しく技術開発を行い、人々が気持ちよく情報やコンテンツ、物品を交換できるようなC2Cのプラットフォームを提供していく。そうしたGoogleの戦略というかライフスタイルは、「日本版Googleを目指す」と話している近藤社長の率いるはてなやGREE、イー・マーキュリーなどの企業に共通したものだ。

 そういう意味ではてなやGREE、イー・マーキュリーのような企業は、「グーグルチルドレン」とでも呼ぶべきかもしれない。マイクロソフト的な古い時代のネットビジネス(=守旧勢力)を破壊しようとしているGoogle(=小泉首相)が生み出した、新たなタイプの企業群(=小泉チルドレン)であるからだ。まあそのアナロジーが適切であるかどうかは別にして。