goo

現代の大聖堂、現代の図書館

『新たなルネサンス時代をどう生きる』より 大聖堂、信じる人と疑う人

五百年後、やや小さな集団が、クレーンと大型機械の助けを借りて、サン・ピエトロより数倍大きな建築物を、数十年早く建てられるようになった。他の多くの分野では、人はいまだに規模に太刀打ちできずにいる。しかし今、人々の集合的能力の向上は、現代のいかれた夢想を手の届くところまで引き寄せつつある。

ほとんどの人は、すでに新しい力を鋭く感じ取っている。ほんの十年前には不可能だったことが、今では当たりは、何万もの人々によって、一クリックずつ構築された。こういう人々は世界じゅうに散らばっているが、共通の関心によってインターネット上に集められている。彼らの共同作業は、それぞれの分野できわめて幅広く利用されるようになった。ウィキペディアは、印刷版の百科事典のほとんどを市場から締め出してしまった。アパッチはあらゆるインターネットサーバーの六十パーセントを動かしている。前回のルネサンス時代の図書館と同じく、フェ前になっている。ウィキペディアやオープンソースソフトウェア(リナックス、アパッチ)のような現代の大聖堂イスブックやユーチューブはおおぜいの人々によってまとめられ、多くの形で人類の歴史を記録している。〝コラボレーション〟は流行語となり、日常生活の一部となった。それは人々の仕事ぶりを測る尺度や、助成金申請の基準、企業戦略と政府計画の優先事項、そしてまったく新しいソフトウェア産業にもなっている。

モバイルデータ接続の広がりによって、今やコラボレーションは生活のあらゆる瞬間の一部となっている。前回のルネサンス時代、人々は互いの顔を見るために町の広場へ行った。新しいルネサンス時代、町の広場は、人々の個性、選択、行動に関するリアルタイム・位置ベースのデータという形で、常にそばにある。買い物、食事、運動、旅行、待ち合わせなど、ますます幅が広がる必要を満たすため、いつでもそこを訪れられる。愛やセックスを求めるパートナー同士を引き合わせたり、さらには、起業家と投資家、運転手と乗客、空き部屋と旅行者、地方自治体と町の小さな問題、助けが必要な人と優れたカウンセラー、問題とそれを解決する人材、、被害者と支援者と監視機関を結びつけたりすることができる。

十年前には、こういう事業やフォーラムは、どれも実現不可能だった。今では、誰もが話し、学び、つくり、共有し、実行し、援助する方法として不可欠な一部であり、そういうあらゆる物事をさらにすばやく、効率的に、大きな規模で、(ときには)内密に行うことを可能にしている。

しかし、新たな集合的努力のなかで最も野心的なものは、あまり知られていない。それは、日常生活の支援ではなく、人間の文明と科学を束縛してきた長年にわたる規模の限界-日進月歩の計算資源でさえ乗り越えられない限界を打ち破ることを目的としている。

第一は言語だ。それは人間の文化と知識を、理解し合えない孤島に分断する。今日の〝共通語〟である英語を理解できるのは、世界人口の約二十五パーセントにすぎず、そのレベルもさまざまに異なっている。母語の意味をきちんと把握して人類の半分と接するには、十四言語以上、四分の三と接するには四十言語以上話せなくてはならない。人類の言論の主要な場であり、知識の宝庫であるインターネットも、同じように言語の壁で区分されている。何を見るかは、使う言語に左右される。英語を話す人は最も豊かな貯蔵庫を利用している。世界のツイートとオンラインでの最も学術的な研究の半分は、英語のみだ。五百万本の記事を載せている英語版のウィキペディアは、次点の言語版(ドイツ語、百九十万本)の二・五倍以上、上位五十言語版の中央値の十五倍以上大きい。一方で、英語利用者は、非英語のウェブで進展している大規模な現象には、ほとんどまったく気づかないでいる。たとえば、中国のソーシャルメディア(主要な通信プラットフォームであるウェイボーとウェイシンは、ユーザー基盤とチャット量に関してはツイッターをはるかに上回る)、ノリウッド(ナイジェリアのハリウッドという意味で、その携帯動画は、この国をインドのボリウッドに続く世界第二位の映画制作の中心地にする一助となった)などだ。総合的な結果として、国境を越えるデータの流れは二〇〇五年以来、約二十倍に急増したものの、もとの地域を出ていく国際取引は約半分しかない。これは国境を越える商品(六十八パーセント)よりはるかに少ない。商品は、かさや重さがあっても、言語や文化の相違に邪魔されにくいからだ。

完全な多言語のウェブは、文明にとって計り知れない価値のある贈り物になるだろう。残念ながら、これまでのところそれは、人間の能力を超えている。ウィキペディアの英語版全体を、たったひとつの主要他言語に翻訳するだけで、少なくとも一億ドルのコストと、一万人年の時間がかかる。たとえ誰かが資金を出す気になっても、目的言語によっては、取り組む翻訳者の数が足りないかもしれない。コンピューター作動の翻訳エンジンが、いくらかその作業を自動化できる。たいてい、外国語の発言が意味することの要点は伝えられる。しかし、一九九〇年代のアルタビスタのバベルフィッシュから、今日のグーグル翻訳まで、あらゆるエンジンの利用者が明らかにしているとおり、意味の多く、明瞭さのほとんど、文体のすべてが、今も翻訳の過程で失われている。人間の翻訳者は原文全体の意味を把握することから始め、次にそれを目的言語で忠実に表現しようとするが、コンピューターは個々の単語--またはせいぜい熟語--を認識することから始め、次に全体の結果を考慮せずに、他言語の類似語をつなぎ合わせる。本当に優れた翻訳ができるようになるには、あと数年かかるだろう。

それでも、多言語のウェブはすでに実現可能になりかけている。かつて要素に組み込まれていなかったのは、他言語に対する学習意欲の広がりだ。最近の推計では、十二億人強にのぼる。また、ウェブの文章を少しばかり翻訳することは、多くの言語学習者が楽しみ、無料でもやりたがる有益な練習であることがわかった。その結果、集合的な翻訳資源は途方もない伸びを示している。すでにエンターテイメントや他の人気コンテンツでも、その存在感は増してきた。中国では、ハリウッドの超大作やヒットしたHBOのテレビシリーズが、アメリカでリリースされたその日のうちに、中国語の字幕つきでオンラインで手に入れられる(字幕は英語を学んでいる熱心なファンたちがつける)。オンライン教育ポータルのカーンアカデミーでは、六千本の教育ビデオのほとんどが、ボランティアによって六十五言語からひとつ以上の字幕をつけられている。別のオンラインポータル、TEDは、二万二千人以上のボランティアを集め、八万以上のjlEDトーク〃を百以上の言語に翻訳している。合計すると、二〇一五年には世界じゅうのボランティア翻訳者の数が、およそ二百~四百万人にのぼったと推定される。彼らはたった一年で、エンターテインメント、教育、ニュース、災害救助(たとえば被害者のツイートをリアルタイムで翻訳して緊急時対応者に伝える)などの分野で、二千五百万~五千万時間の無料の翻訳サービスを行った。

才気あるビジネスモデルは、どうやって集合的な翻訳力をさらに拡大して、ボランティアが放置している公的なコンテンツに(あるいは報酬を払って私的なコンテンツに)適用すべきかを考案している。カーネギーメロン大学計算機科学部准教授ルイス・フォン・アン博士が創設したデュオリンゴは、その一例だ。これはウェブとアプリベースの学習プラットフォームで、言語学習者にウェブからーたとえばウィキペディアの記事やCNNのニュース記事から--の実際の文章を示して、翻訳を促す。複数の生徒が同じ文章を同じように訳したら、システムがその翻訳を信頼できると見なし、次にそれを原文の所有者に返すか、売り戻す。学習ツールは利用者には無料で、ゲーム性があって効果的なので、学習者が殺到している。デュオリンゴは、二〇一二年六月、利用者三十万人で始まった。三年後には、二千五百万人(アクティブユーザー千二百五十万人)が十三の異なる言語を学び、さらに八言語が開発中となった。もし充分な数のデュオリンゴ利用者が第二言語熟達度で初心者から上級レベルに進歩すれば、すぐにでも、ウェブでかつて克服できなかった言語の壁の多くが破られるだろう。上級のユーザーが百万人いれば、デュオリンゴは英語版ウィキペディア全体を約百時間で翻訳できる。

集団で打ち破りつっある第二の規模の限界は、科学データ分析だ。〝科学の多くの分野で障害となるのは、どんなデータを得られるかではなく、持っているデータで何かできるかだ〟と天体物理学者のクリス・リントットは言う。データは豊富にある。その選別能力がないのだ。コンピューター作動の機器は、研究者が求めるデータ--リントットの場合、遠い銀河の画像--の収集は日々上達しているが、求めるパターンの認識や、意味のある信号と無意味な雑音との区別はまだかなり不得意だ。その結果、いつか研究するための膨大なデータの備蓄がますます増えていく。スイスにあるCERNの大型(ドロン衝突型加速器は、素粒子がどんな動きをするかについて、毎秒一ギガバイト近くの新しいデータを生んでいる。世界じゅうのDNA配列解析装置は、人間の遺伝子の働きについて、合算すると毎秒一~ニギガバイトのデータを量産している。NASAでは、データが空から降ってくる。その多様な任務は、宇宙について毎秒約百五十ギガバイトの新たな観測結果を生んでいる(ちなみに二〇一五年、フェイスブックの十五億人余りの利用者は、合計で毎秒約五ギガバイトをアップロードした。あなたは世界全体のニュース配信についていけるだろうか? NASAの問題はそれより三十倍大きい)。同じデータの大洪水が、気象学者、地質学者、社会学者、経済学者などのほとんどのデータ主導の研究者たちに押し寄せている。科学はすでに、たくさんの大きな疑問に対する答えを集めてきた。人間がまだ、それを知らないだけだ。

しかし、じきに知るようになるだろう。集合天才のさまざまな功績のおかげで、パターンをとらえて雑音を除去するのはコンピューターには困難かもしれないが、人間の脳には簡単にできることがわかった。間違いは、白衣を着ていない人を科学研究から締め出したことだった。現在、コンピューターを最も得意な分野に集中させるよう研究方法を設計し直し、最も必要な場所に人間の知力が提供されるようにおおぜいのボランティアを募ることで、〝市民科学〟が、広範囲の分野を悩ませてきた分析上の障害を克服し始めている。

二〇〇七年、クリス・リントットとケヴィン・シャヴィンスキーはギャラクシーズーを共同創設して、アマチュア天文学者を募集し、二〇〇〇年から撮影されてきた約九十万の銀河の目録づくりと分類の援助を頼んだ。その作業は、ひとりの熱心な大学院生が一日二十四時間、週七日、年三百六十五日休まずに働いたとして三年から五年、作業を二重チェックすればその二倍かかるはずだった。しかし、十万人以上のボランティアによって半年以内に終わり、それぞれの銀河は平均で三十八回再チェックされた。二〇一四年半ばには、数十万人のギャラクシーズーのボランティアたちは、七つの巨大規模のデータセットを処理し、以前のどの版より十倍大きい銀河の目録をまとめ、四十四本の科学論文に相当する結果を生んだ。そのあいだ彼らは、長年の推測だけで未発見のまれな天文現象を見つけ、ほかにも、たとえばまったく予想外の〝ハニーの天体〟などを発見した。オランダの学校教師ハニー・ファン・アルケルは、天空の物体に自分の名前をつけてもらった。プロの天文学者でもめったに成し遂げられない栄誉だ。

ギャラクシーズーはズーニバースへと広がり、二〇一五年には、百十万人の登録ボランティアを抱える世界最大の市民科学ポータルになった。全体として、天文学、生物学、生態学、気候科学、人文科学などに及ぶ数十の活発なプロジェクトの膨大なデータセットに取り組んでいる。〝プラネットフォー〟というプロジェクトでは、火星愛好家を募り、赤い惑星の表面の地図作成に協力してもらっている。チンプ&シーでは、動物好きの人たちに、ヒョウ、ゾウ、チンパンジーなどが、アフリカの森じゅうに置かれた何百台ものカメラの前を歩いたり走ったり跳んだりする姿を見つけてもらっている。オールドウェザーは、十九世紀半ばまでさかのぼって航海日誌を書き起こすため、一般の人々の協力を求めている(古い航海日誌は、現存する最も完全な長期の気象データセットになっているが、マヌティウスの時代に見つかった古代ギリシャの原稿と同じく、散逸して世界じゅうの海事博物館や文書館でほこりをかぶっている)。エンシェントライブズは、考古学マニアを集めて、二千年前の何千枚ものエジプトの古文書を翻訳してもらっている(象形文字の知識は必要ない)。ヒッグスハンターズは、ヒッグス粒子や他のエキゾチック粒子の証拠をさらに探すため、大型ハドロン衝突型加速器のデータを選り分けてくれる人を募集している。

ズーニバースは、市民科学プラットフォームの一例にすぎない。ほかにも、ボランティアが衛星写真を調べて密漁を防いだり、行方不明の航空機を探したりするトムノッドや、人間の脳の地図をつくるのに役立つゲーム、アイワイヤーなどがある。世界じゅうで、さらに何百万人ものボランティアが、他の方法では実現できない何千もの大がかりなプロジェクトに関わっている。市民科学は、さまざまな研究分野で労働力を大きく増やしてきた。効率的な研究室の人々が一生をかけてやっていたことが、今ではひと握りの管理人によってほんの数年でまとめ上げられるのだ。

市民科学は万能薬ではない。データを大衆が利用しやすい形にし、慎重に各プロジェクトを管理して、結果が同業者のきびしい評価に耐えられるようにするには、やはり専門家の多大な努力が必要だ。ときには、それができないことがある。写真や音や特異な原稿であふれたデータセットの分析は、たとえば世界の粒子加速器によって送り出される数値の絶え間ない流れの分析より、人々の参加を募りやすい。研究機器によって生み出されたデータが膨らみ続けるにつれ、人員十万人の研究チームでさえ、遅れを取りたくなければ研究を加速する必要があるだろう。二〇二〇年に稼働する予定の巨大な電波望遠鏡スクエア・キロメートル・アレイは、それ自体が、フェイスブック五千個分と同量の新しいデータを毎日生み出すことになる。ズーニバースのチームが、効率のよい処理方法--たとえば、ほかの人より精確な仕事をするボランティアを選り抜いて、再チェックの回数を減らすなど--に取り組み、困難打開の手助けをしている。

市民科学プラットフォームはもっと洗練される必要があり、そうなっていくだろう。現在行われている最良の研究は、市民科学と、そこから学習できる機械を結びつけ、人間が新しい銀河を見つけたりヒョウとチーターを見分けたりしているあいだに、機械がそのやりかたを学び、アルゴリズムを向上させるものだ。こうすれば、人材に余裕ができ、最も複雑な事例に集中できる。一方、既存のプラットフォームはすでに、科学が発見を予期していたより何十年も早くいくつかの答えを出し、できるとは想像もしなかった疑問に取り組む後押しをしてきた。
コメント ( 0 ) | Trackback ( 0 )
« ロシアの破局―... 何を探してる... »
 
コメント
 
コメントはありません。
コメントを投稿する
 
名前
タイトル
URL
コメント
コメント利用規約に同意の上コメント投稿を行ってください。

数字4桁を入力し、投稿ボタンを押してください。