29Lib 分館

図書館・情報学関連の雑記、読書ノート、音楽ノート、日常生活の愚痴など。

グーグルの協力を取り付けた空前の物量によるデジタル人文学

2016-03-14 09:29:47 | 読書ノート
エレツ・エイデン, ジャン=バティースト・ミシェル『カルチャロミクス:文化をビッグデータで計測する』坂本芳久訳, 高安美佐子解説, 草思社, 2016.

  計量書誌学。グーグル社の協力のもと、同社が電子化した膨大な書籍を対象にして、時代毎の語の出現頻度の変化を調査した結果と、そうした研究の経緯を紹介する内容である。原書はUncharted : Big data as a lens on human culture (Riverhead Books, 2013)で、著者二人はハーバード大出身の若手研究者。邦題の「カルチャロミクス」は著者らの造語で本文中に時折登場する。アメリカ英語学会が選ぶ2010年の「もっともすぐに廃れそうな言葉」の部門の栄誉に輝いたという。

  2000年代半ばからGoogleが電子化してきた紙の書籍だが、その一部をそのまま公開しようとしても著作権の壁に阻まれてしまう。けれども、単語や句だけを切り取って表示し、出典がわからなくなれば大丈夫、というわけで、著者らはNグラム・ビューワーを開発する。ただし、研究はビューワーの公開以前から行われていて、19世紀初頭から現在までに至る期間の、各種の語彙の出現頻度を調べている。検証されるのは、不規則に変化する動詞(drive-droveなど)の数の減少、新語や新たな言い回しの普及パターン、有名人や新発明・新発見が書籍で言及されるパターン、検閲による言論弾圧が少なくとも検閲が継続している間は効果的であることなどである。このほか、グーグル社との交渉や、データのバイアスに対する考え方、一つの概念に複数の表現用語彙がある場合の処理などについても解説されている。付録として最後にライバルとなる語(football/baseball, fever/cancerなど)の栄枯盛衰がわかるグラフが付されている。

  本書で紹介される「ジップの法則」が発見されたのが1930年代であることからわかるように、計量書誌学にはそれなりの歴史がある。しかし本書には先行研究への目配りがあまりなく、その点が気になったところだ。記述からは、どうも計量書誌学の文脈にこの研究を位置づけようという気が著者らにはないらしいことがうかがえる。個人的には「結局、検索キーワードとテキスト上の語彙がマッチングしたのを数えているだけだろ。凄い新しい研究であるかのように装うのは大げさ」という気になった。だが、確かに対象期間と文献量は圧倒的であり、過去に例を見ないものである。やはり新しいのかな。確かに面白い。物量の勝利だろう、これは。 

  
コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 米国向けブラジル音楽紹介本... | トップ | 参加メンツから想像される音... »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

読書ノート」カテゴリの最新記事