限りなき知の探訪

45年間、『知の探訪』を続けてきた。いま座っている『人類四千年の特等席』からの見晴らしをつづる。

沂風詠録:(第110回目)『私の語学学習(その44)』

2010-11-23 14:56:16 | 日記
前回から続く。。。

CDのPerseus 2.0 にはプラトンやアリストテレス、ヘロドトス、クセノポンなどの古典ギリシャ語の基本的な文が収容されていた。しかし、しかし、私が読みたいプルターク(Plutarch)はなぜか分からないが Perseus には全体の2割位しか収納されていない。それで、プルタークを読もうとした場合に、分からない単語(動詞の変化形)に出会うと、当初のように 『 All the Greek Verbs 』で辞書のエントリーの単語を見つけ、辞書をひくより仕方がない。

しかし、既に Perseus 2.0 をパソコンにインストールし、使い慣れてきた私は、動詞変化形リストや紙の辞書やを使うのがおっくうになってきた。 Perseus に原文が入っているものはテキストから直接、調べたい単語をクリックすると形態素解析(morphological analysis)から辞書まで一連の動作をすることはいとも簡単であったからである。しかしプルタークのように本文が収容されていないと、せっかくの形態素解析ツールが使えない。ギリシャ語の場合、ドイツ語のウムラウトやフランス語のアクサンに該当する、アクセント記号と気息記号やフランス語のセディーユに似た下付きイオータがあるが、これらを正しく付けないと形態素解析してくれないのだ。ところが、それらの記号は普通のキーボードでは入力できないのだ。

普通の人はここで、あきらめてしまうのであろうが、私は以前はプログラマーで C言語で数十万行のソフトウェアを開発していた経験があるので、このような文字変換のプログラムはたやすいことである。早速 Perseus の形態素解析ツールのデータ形式を調べて、アクセントと気息記号を普通のキーボードから入力するソフトを数時間で作りあげた。これを使うことでプルタークの文章に出てくる難しい変化形はこのソフトに入力し、そのアウトプットを形態素解析ツールにコピベ(cut and paste)することで、Perseus 2.0の機能をフルに使うことができた。



以前も『自分でプログラムが組めるメリット』で述べたように、私は現在の人文系の研究者はすべからくプログラムをマスターすべきと考えている。人文系の研究というのは、その大部分が資料検索であろう。対象とする資料の入出力フォーマットや、文字コードはそれぞれ異なる。つまりデータのフォーマットは、作成者の都合で決められていて、データを利用する研究者の都合はほとんど考慮されていない。それで、たとえ大量のデータを入手できても、手作業でチェックするとなるとミスや見落としも発生する。ところが、時間をかけ、丁寧に資料をチェックすること、それこそが研究だと考えている研究者が多い。

今やインターネットや Google でコンピュータ検索の威力を知ったあとでは、この方式は強弁にしか過ぎないことがわかる。しかし、いくら Google や PC が進展しようと、専門資料の特殊な検索・解析方法や、出力データを自分の思うとおりにまとめてくれるプログラムは存在しないし、待っていても誰も作ってくれない。つまりは、自分で作らないといけないのだ。腕のよい大工は、大工道具を買って揃えるのではなく、みずから手にハンマーを持って鋼を鍛え、刃を研ぐ所から始めるのに相当する。良い仕事をするためには、良い道具を持つことが必要であるというのは、なにも工芸に限った訳ではない。この意味で、理科系に限らず、人文系の研究者も良い研究をしたければ一年でもいいから真剣にプログラミングの勉強をし、自分の要望に合った処理プログラムを簡単に作れるようになるべきだと私は思う。

このように言うと必ず、『そんな暇はない。こちらは研究だけで超多忙だ。』という反論が返ってくる。しかし、考えてみて欲しい、コンピュータですれば、数秒ですむのに、手作業だと数時間を費やす作業を一年に何回していることだろう。プログラムを学ぶというのは、こういう時間的ロスをなくすだけではないのだ。例えば、どこかの会社に自分達の用途にあった処理プログラムの作成を依頼したとしよう。自分自身がプログラムができると、相手にこちらの要望を正確に伝えることができる。喩えて言えば、ラケットを特注する場合、素人で全くテニスをしたことがない人より、テニスの選手の方が、どのようなラケットを作って欲しいかという要望を詳細に述べることができるようなものだ。出来上がったラケットを見た場合、テニスの選手の方は大抵思い通りのものを手にするはずだ。

自然科学や工学系では研究者は世界、つまりグローバルで研究をしているので、使っている道具(ソフトウェア・プログラム)も立派なものが多い。しかし、人文系の場合、日本の人文系の学者は総じてITリテラシーが低い。それのみならず言語の制約があるためか、日本の人文系の研究者は世界の最先端のITの進化に取り残されている。それで使っている道具(ソフトウェア・プログラム)と言えば、ワープロと表計算の域を出ていない。結局、日本の人文学、社会学が国際的に低い評価しか受けないのは、ちょうど太平洋戦争当時に揶揄された、方や防空頭巾と竹槍、方や火炎放射器とB29、のように彼我の物量(ソフトウェア・プログラム)の差がその一因ではないか、と考える。

続く。。。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする