中村如水随想録

身体論、体癖論、潜在意識、NLP、アレクサンダーテクニーク、インナーゲーム、引き寄せの法則、音楽。今、ここ。

広告

※このエリアは、60日間投稿が無い場合に表示されます。記事を投稿すると、表示されなくなります。

114. 論文の文献管理

2011年03月26日 14時29分14秒 | いろいろ
自分で論文を書こうと思ったら、ともかく大量の論文を管理しなくてはいけない。それは確かである。

紙に印刷した論文は、今でも電子ファイルよりも遙かに読みやすいが、すぐにボロボロになっていくし、非常にかさばる。分類して管理するにも、グループ分けに結構悩むことになる。超整理法は?という声も聞こえてきそうだが、我々の頭は時系列というよりは、やはりテーマ別になっているので、正直なかなか手が出せない。

そこで、今の時代だと電子ファイルでの論文管理ということになる。あるいは、とくに一元管理を目指さず、コンピューターに放りこんでおいて、検索で頑張る、という手も有効かもしれないが、その場合でも、最終的に論文を書くときには参考文献リストを作らなくてはならない。


EndNote



最初に断っておくが、この分野では、長らく EndNoteというソフトが、定番中の定番として認められてきた。これは新品を購入すると¥52,290(アップグレードで¥20,790)もする高価なソフトである。Word などのワープロソフトと連動して、自動の参考文献リスト作成機能など、論文の引用に関してはかっちりした機能を提供するようだが、使い勝手が悪い、という評判も一部にあって、私は結局一度もまともに触ったことがない。頻繁にアップデートされて、そのたびにアップグレード料金を払わされる、というビジネスモデルに辟易している人もいるようだ。最近のヴァージョンでは、PDFの管理など、個人用データベースとしての機能も充実してきているようである。私はちなみに、食わず嫌いのアンチEndNote派である。


FileMaker Pro + iPubMedMaker 7


iPubMedMakerは、横田欽一さんという方が一人で作成された力作で、これ自体は無料で利用できるが、有料の個人データベース作成ソフトである FileMakerPro を母体として機能するもの。PubMedからの論文の取り込み、PDFファイルの管理、参考文献リストの自動作成、といった機能を備えている。私はいつから使っているのか記憶が定かではないが、たぶん10年くらいになるのではないだろうか。集めたPDFが今では 3.5 GB にも至っており、5000本の論文がひとつのデータベースに入っている。

私はそこそこ満足して10年これを使っていた。FileMaker ProはほぼEndNoteに匹敵するほど高価だが(FileMaker Pro 11は、¥39,900 およそ $490、アップグレードで¥23,940)、これは他の用途にも使えるし、お買い得だと思っていた。今思うと、使い始めた当初は、研究室に FileMaker Proがすでにあったので、実質的にただで使えたというのが大きかったように思う。しかし、他の人にこれを勧めたところ、あんたはこんなややこしいものを一体どうやって使いこなしているのか、全く理解出来ない、という感想だった。たしかに、iPubMedMakerが、データの取り込みを担ってくれるとはいえ、いちいちPDFファイルを指定するのも、メモ欄に、検索用のタグを入力するのも結構な労力である。私は頭がオカシイのかもしれない。

気に入っている点としては、オンラインのデータベースにある論文だけでなく、古い論文や、本なども、手動入力で対応可能であり、完璧とは言えないものの、参考文献リストの書式については、いちいち細かく自分で設定できるので、小回りが効いて、これも悪くない。

ちなみに、iPubMedMakerには英語版も存在しているということを最近(というか今日)知った。
iPubMedMaker 7 英語版


Mendeley


これは最近同僚から勧められたもので、私の使っている上記の泥臭い方法に比べるといかにもスマートだ。ロンドンの会社が開発している。メンデリーという名前は周期律表のメンデレーエフと遺伝学のメンデルからもじったものらしい。クラウドコンピューティングに基づいた設計で、ネットワーク上のサーバを介して、複数のコンピュータ間で、集めた文献リストやPDFの同期が図れるため、自宅と仕事場で、シームレスな作業環境が作れる、という訳である。利用は基本的に無料だが、クラウドに使うための保存スペースは制限があって、1GBまでは無料で、お金を払うことで大容量を使用できる、という、まあ合理的なプランになっている。仮に、新しいFileMaker Proを買うのを控えて、7 GBの Mendeley Plan ($4.99/月)を選んだら、浮いたお金で、ほぼ100ヶ月、8年間使えることになる。EndNote X4なら、128ヶ月、10 年間ですね。

1 GB  Free
7 GB  £4.99/month
15 GB  £9.99/month
More
(容量のうち半分が、個人用で、残り半分が共有用となる)

ちょっと試してみたところ、データベースへの新規取り込みはかなり簡単であり、また既に入手済みのファイルなら、ドラッグ&ドロップで収納可能。PDFの取り扱いは非常にスムーズだ。PDF閲覧機能が内蔵されていて、PDFの上に直接メモ書きできるというのも優れている。タグ付けによる論文の分類も見事である。




他の特徴としては、WebページにはMendeley利用者の SNS (ソーシャルネットワーキングサーヴィス)があって、一番良く読まれている論文などをパッと調べることが出来る、という点がある。なお、 Zoteroのデータベースから、Mendeleyへの移行は可能だが、逆は不可能ということ。


Zotero



Zoteroはブラウザ FireFox の機能拡張として動くというちょっと変わった物。zoh-TAIR-oh (ゾウテアロウ)というように発音するらしいが(UK /zəʊ'teərəʊ/, US /zoʊ'teroʊ/ と想像する)、名称の由来は不明。もう丸一日以上これをいじくり続けているが、いまだに名前が覚えられない。 現在、単体として動くスタンドアローン版も開発中で、開発途中の物(アルファ版)がすでに利用出来る。 George Mason University (GMU) ジョージ・メイソン大学Center for History and New Media (CHNM、歴史/新メディア・センター) が開発している。ユーザインタフェースは日本語しているが、後述の理由から、英語版のFirefoxと共に英語で使用したほうが問題が少なそう。

これもMendeley同様、クラウド仕様で、同期が簡単にできるのが特徴。有料メンバーになれば大容量の保存スペースが利用できるようになるところも同じ。ただし、料金プランを容量だけで比較すると、無料だと100 MBしか与えられないので実用的とは言えず、無料で使いたいなら、Mendeleyのほうがややお得なようだ。

なお、このブログの次の記事で紹介している Dropbox の中に、データを保存するようにすれば、無料で最大 2 GB まで使用可能。設定はそれほど難しくない(下記参照)。同期機能が内蔵されるまではみなさんこの裏技を使っていたようだが、無料で使えるZoteroの容量が少ないので現在でも有用と言えそう。ちなみに Mendeley はこの裏技は無理のようです。

100 MB  Free
1 GB  $20 ($1.67/month)
5 GB  $60 ($5.00/month)
10 GB  $100 ($8.25/month)
25 GB  $240 ($20.00/month)

新しいデータの取り込みは非常に簡単で、ブラウザ上に現れるボタンを押すだけ。また既に入手済みのファイルなら、ドラッグ&ドロップで収納可能。また論文だけに限らず、Web ページや、ファイルなどいろんなものを一緒に管理できるようだ。インタフェースなどは、どちらもよく似ているのだが、Mendeley と大きく異なる点は、PDFファイルに直接注釈を加えることができないこと。したがって PDF に関しては、Adobeや、Mac OS X の Preview など他のPDF閲覧用ソフトを使用することになる。人によってはそのほうが嬉しいということもあるかもしれない。

そして Mendeley 同様、現時点では文献リスト作成機能が弱く、カスタマイズ性にも乏しいようである。下記参照。

Mendeley にはない Zotero の特色としては、タイムラインというものがある。これは横長の年表の上に、ここの論文を出版年月に応じて配置するという、なかなか洒落た機能である。


また、ブラウザの拡張機能であることを生かした、Webアーカイブ作成機能というものもある。気に入ったウェブページの魚拓のようなものを作って、保存しておけるのだ。さらにこうして保存したウェブページは、本物と外見に変わりはないが、注釈を加えたり、色で文字を強調したり、といった編集作業が可能となる。少し試してみたが、これは案外便利だと感じた。ちなみに、WiredMarker というFIreFox アドオンも同じような機能を持っているらしい。




それぞれの特長

目下のところ、操作性、特にデータの取り込みの容易さに関して、新勢力の Mendeley や Zotero が、私の愛用してきたiPubMedMakerを圧倒していると言える。

さらに PDFの扱いに関しては Mendeley が Zetero を凌駕しているようだ。

一方、Zetero の特長としては、やはりブラウザと一体になっていることで、Web アーカイブ機能は優れているし、ブラウザ上の書誌情報の取り込みもスムーズである。

ところが、一旦入力さえ済んでしまえば、FileMakerPro自体はデータベースソフトとして優秀なので、iPubMedMaker 利用の場合も結構便利であった。メモ書きは、抄録の下の部分にそのまま記入できるし、抄録の一部を赤文字や太文字にしたり、ということは簡単にできる(Mendeley, Zoteroは仕様上これはできない。Mendeleyはこの代わりにPDFに直接メモが書き込めるが、PDFがないときはどうすればよいのか?)。 タグ付けによる分類も、私は手動でやっていた。

すでに私のデータベースの規模からすると、いずれにせよ無料プランでの使用では不足する。月に5ドル(400円くらい)を覚悟する必要がありそう。

同じような結論に達した上でMendeleyを選んだ方がいたようである。
ZoteroからMendeleyに移行した訳


Mendeleyの課題

古い文献の手入力は可能か?→ File > Add Entry Manuallyで可能

古い文献や本について、手入力以外の入力方法はあるのか?→ Amazonからの取り込みも出来る様子。http://www.mendeley.com/import/

Supplementary Dataなどの付属ファイルの扱いは?→ Detailes > Files > Add Files... から追加できる。

Bookからの参考文献リスト作成は上手く行くのか?→ そこそこうまくい様子。

参考文献リストの書式設定はどのくらいめんどさいのか?→ 文法さえ理解すればいいのだからなんとかなりそう。

検索機能に問題がありそう。PMIDを検索窓に入力しても、該当する文献がヒットしない。PMID 自体はデータとして存在しているのでもし本当だとしたら不思議な仕様。PMIDなどを用いた重複文献検索機能もないのでは?→ Zeteroのほうは、PMIDによる検索は可能。また、Zeteroの詳細検索機能は、かなり細かい検索が可能な様子。

通常のウェブページからでもWebpage snapshot を保存することはできるが、Zetero の Webアーカイブ機能とは比べものにならないくらいお粗末なものである。日本語のページは文字化けしたし、スタイルシートなどは無視されて、レイアウトは原型をとどめていない。


Zoteroの課題

参考文献リストの書式設定ファイルにたとえば Natureを選ぶと、著者が多いときには、「Anderson, C. et al. 」というように二人目以降の名前が省略されるはずだが、この et al. の部分がなぜか日本語化されてしまい、「Anderson, C. 」「Anderson, C. 」などと出力されてしまう。→  FireFox自体を日本語版から英語版に切り替える(英語版をダウンロードして、日本語版と入れ替える)と、ちゃんと et al. と表示されるようになった。日本語の扱いに関して問題を抱えているようだ。

実際、どの程度問題になるのか、人によるかも知れないが、Mendeleyでは取り込み時に自動的に PDF ファイルの名前を変更してくれるのに対して、Zotero はこの点について自動処理機能や、一括処理機能がない。→  PDF 一個ずつについて、右クリックから「ファイル名を変更」という処理を手動で行う必要があり、やや煩わしい。

論文PDFからの書誌情報抽出機能を有している(Preferences...>Searchを選んで、"PDF indexing” のふたつのプラグイン?を手動で導入する必要あり。この辺りも Mendeleyよりも煩雑になっているので今後に期待したいところ。)が、Mendeleyと違ってその処理は自動では走らない。→ ファイル毎に右クリックから処理を選んでやる必要がある。

ペイン(操作用の四角い領域)の幅をマウスで調節しようとすると、非常に正確にポインタを置かないと反応してくれないため、何度も失敗してしまう。これは設計の問題だと思う。

デフォルトでは、 Preferences...>General の Automatically tag items with keywords and subject headings がオンになっているが、PudMedから書誌情報を入力した場合、勝手にいくつものタグが生成されてしまい、自分の思い通りの分類がかえってできなくなってしまう。→ オフにしておいて、好みの分類用タグを手動で加えるほうが、私の好みにはあっている。

デフォルトでは、Preferences...>Advanced の Data Directory Location が、Firefox のProfile フォルダの中に設定されているが、これはどこにあるのか分かりにくく、あまり良くないように思う(好みの問題だが)。→ 使い始めのときに、フォルダの場所をわかり易い場所に指定しておく必要がありそう。あるいはデータの保存場所を Dropbox の中に指定し、Zotero内蔵の同期機能を解除することによって、無料で 2 GB までのデータを同期させることが可能。


Menedeley/Zotero共通の課題

両者ともに、重複文献の検索という大事な機能が欠けているようだ。これはデータベースが大きくなってくると、非常に重要である。同じ論文がふたつデータベースにあるとき、たとえば重要なメモを片方にだけ残していたりすると、あとで探すのが難しくなる。また文献リスト作成時にも問題を生じやすい。この点では今だに iPubMedMaker + FileMaker Pro が有利である。

一番の問題、iPubMedMaker-FileMaker Proに貯めてある5000件をどうやって再入力するか?FileMaker Proの書き出し機能を使って、PMIDを抜き出して、PubMedで一気に検索をかける、というのは不可能ではなさそう。→ FileMaker Proからエクスポートで、 PMIDだけをタブ区切りテキストに出力する。ここの文献のPMIDが一行ずつ出力される。こうやって得た5000件についてどうやって書誌情報を得るかだが、これはどうやら簡単ではないらしい。Selenium IDE というFirefoxアドオンで、webページ上の作業を自動処理化できるので、これをもとに、順次PMID をPubMedに自動入力して、 clipboardに保存し、一括してダウンロード、というのが現実的か。しかしこのためのプログラミングは避けて通れなさそう。

PMIDのない、古い文献や本などをどう扱うか?PMIDがない、という検索条件が使えればよいが。→FileMaker Proの検索フィールドに「=」とだけ入れれば、空欄になっているレコードを検索できるらしい(http://www.filemaker.co.jp/help/html/find_sort.5.8.html)。

有料会員になったところで、さらによいサービスが現れたとき、また移行しなければならない可能性がある。Mendeley も Zotero もデータベース自体は、他の形式でエクスポート可能、インポート可能なので、原理的には何とかなりそうである。集めたPDFなどは容易に移行できるだろう。しかし、非常に難しそうな(というかほとんど無理っぽい)のは、この中にたくさん書きこんであるメモをどうやって復活、移植するかである。メモこそ命、といってもよいわけです。おそらく手動で一個一個、ノートへコピーするしか手がなさそうである。

同期に失敗して、やっと構築したデータを一瞬で失う危険性はどの程度か?→ バックアップさえ定期的にとっておけば回避できる問題の筈。

今日いじってみて、一番問題だと感じたのは、最も基本的な、文献リスト作成機能が、ショボイ、ということだ。私が投稿したことのある雑誌のスタイルが、一覧表になかったし、一覧表にあるものでも、余分な doi や URL などの項目が付いてきたりして、そこを修正しようにも、意外とカスタマイズ性に乏しいのである。

意外に感じたのが、ここの雑誌の指定する参考文献リストの書式に関して、新しいソフトのほうが小回りが効かないということ。自ら Citation Style Language という言語(要はXMLの一種らしい)で、書式定義ファイルを作らないといけないようだ。なお、Mendeley と Zotero は全く同じ、書式定義ファイルを使っているようで、道理でどちらも同じ問題を生じるわけである。Mendeleyは、この書式定義ファイルの編集機能を開発中、とのことである。
How do I create my own citation (CSL) style?



英語版ウィキペディアの、「文献管理ソフトウェアの比較」も参照されたい。
http://en.wikipedia.org/wiki/Comparison_of_reference_management_software
コメント   この記事についてブログを書く
« 113. イギリスから震災を見た。 | トップ | 115. Evernote と Dropbox »
最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。

いろいろ」カテゴリの最新記事