http://www.dap.ndl.go.jp/ca/modules/car/index.php?p=2164
#Google Book Search ネタが続くなぁ
「作りたい」と前エントリで書いたけど,Google Book Search に協力している University of Michigan はすでに MBooks とかいうシステムを作る予定なんだそうな.
8月31日付け"Chronicle of higher education"によると、ミシガン大学が"Google Book Search"で得られたデジタルデータを利用して、新しい蔵書検索システムを構築する予定であると報じています。
スキャンしたデータは、OCRで文字認識がなされていて、本文検索が可能ということで、本文の中身を検索して、著作権の存続期間が終了した図書は全文データを、著作権が存続している図書は、検索した単語が出てくるページと頻度が表示されるようなシステムになるそうです。また著作権の存続期間が満了した図書は、Google Book Searchとは異なり、テキストデータが提供されるそうです。このデジタルデータを、ミシガン大学は"MBooks"と呼んでいるそうです。
うーん.Google Book Search で提供されるのは書籍の各ページの画像データであるのに対して,この MBooks ではコピペ可能なテキストデータが(もちろん著作権切れの図書に限定して)提供されるという点がアドバンテージということだろうか.そしてそれは Google が PDF を提供し始めてもさほど変わらないと……(ダウンロードできる PDF は画像をパッキングしただけだしな)
確かにテキストでデータをくれりゃあコピペに限らず,Perl などのプログラミング言語での処理,他アプリケーションでの再利用も簡単にできるようになる.なかなか良いアイディアじゃないか.感心した.
さて,しかしながら,コピペが可能となると,次に問題になるのは剽窃 plagiarism なわけだ.
* * *
U. of Michigan Adds Books Digitized by Google to Online Catalog, but Limits Use of Some には,
Steven J. Bell, director of the library at Philadelphia University, said Michigan's new digital-book service could spur more scholars around the world to use interlibrary loans to request single pages or groups of pages from books held by Michigan. After all, if scholars can consult Michigan's online catalog to find out which pages contain the terms they are looking for, they might request just those pages rather than the entire book.
とある.つまり,この MBooks が ILL(赤字)と組み合わせて使えるということだ.具体的にはどういうことか?
最初に引用したニュースソースにも書いてあるように,著作権が切れてない図書に関しては「検索した単語が出てくるページと頻度が表示される」ようになっているので,ある図書のうち必要な/自分が読みたいページはどこなのかを MBooks で特定し,そのページだけを ILL でコピー請求する.こうすれば依頼元/先ともにコストが節約できるというわけか.
#Google Book Search ネタが続くなぁ
「作りたい」と前エントリで書いたけど,Google Book Search に協力している University of Michigan はすでに MBooks とかいうシステムを作る予定なんだそうな.
8月31日付け"Chronicle of higher education"によると、ミシガン大学が"Google Book Search"で得られたデジタルデータを利用して、新しい蔵書検索システムを構築する予定であると報じています。
スキャンしたデータは、OCRで文字認識がなされていて、本文検索が可能ということで、本文の中身を検索して、著作権の存続期間が終了した図書は全文データを、著作権が存続している図書は、検索した単語が出てくるページと頻度が表示されるようなシステムになるそうです。また著作権の存続期間が満了した図書は、Google Book Searchとは異なり、テキストデータが提供されるそうです。このデジタルデータを、ミシガン大学は"MBooks"と呼んでいるそうです。
うーん.Google Book Search で提供されるのは書籍の各ページの画像データであるのに対して,この MBooks ではコピペ可能なテキストデータが(もちろん著作権切れの図書に限定して)提供されるという点がアドバンテージということだろうか.そしてそれは Google が PDF を提供し始めてもさほど変わらないと……(ダウンロードできる PDF は画像をパッキングしただけだしな)
確かにテキストでデータをくれりゃあコピペに限らず,Perl などのプログラミング言語での処理,他アプリケーションでの再利用も簡単にできるようになる.なかなか良いアイディアじゃないか.感心した.
さて,しかしながら,コピペが可能となると,次に問題になるのは剽窃 plagiarism なわけだ.
* * *
U. of Michigan Adds Books Digitized by Google to Online Catalog, but Limits Use of Some には,
Steven J. Bell, director of the library at Philadelphia University, said Michigan's new digital-book service could spur more scholars around the world to use interlibrary loans to request single pages or groups of pages from books held by Michigan. After all, if scholars can consult Michigan's online catalog to find out which pages contain the terms they are looking for, they might request just those pages rather than the entire book.
とある.つまり,この MBooks が ILL(赤字)と組み合わせて使えるということだ.具体的にはどういうことか?
最初に引用したニュースソースにも書いてあるように,著作権が切れてない図書に関しては「検索した単語が出てくるページと頻度が表示される」ようになっているので,ある図書のうち必要な/自分が読みたいページはどこなのかを MBooks で特定し,そのページだけを ILL でコピー請求する.こうすれば依頼元/先ともにコストが節約できるというわけか.