日々呟く。

とうとよ/清貧の独り言。

分かっているつもりの恐ろしさ。

2005年09月22日 20時14分59秒 | 司書講習日記
まずはお詫びを申し上げます。
本当に申し訳ありません。

一体どう償ってよいのか、どうにも償いようのない問題で、そしてとても大きな問題なので、もうどうしてよいか分からないのですが、とにかくお詫びを申し上げます。

私が何を謝っているのか。
それはこれから説明します。


うちの班の情報検索演習、そのテストの課題に、このような問題がありました。

CD-ROM新聞記事データベースを用いて、「桜」と、「サクラ」を検索し、これらの検索キーワードの関係を説明しなさい。

この問題、どうもかなりの難題だったようです。
私の班では、かなりの方が試験に合格できず、再試を受けられていました。
その大きな原因となったのが、この問題だったようです。

まず、問題にある、CD-ROM新聞記事データベース。
これは以前にも紹介した、情報検索演習の教科書であった『情報と検索の活用 第2版』(データベース振興センター)付属のCD-ROMの中に収録されている、読売新聞新聞記事データベースのことです。

この問題の何が難しかったのか。
それは、まず、問題文の中にある、「これらの検索キーワードの関係を説明しなさい」という部分、この「関係」という言葉について、意味がわからなかったという方が多かったようです。

私が見せてもらった答えの中で、よく有ったのが、「桜」と「サクラ」を検索し、その検索結果の内容について比較している回答。

「桜」の検索結果には、同期の桜、桜桃、桜島、桜の開花などが含まれ、「サクラ」の検索結果にはサクラエビ、サクランボ、サクラメント、サクラの開花などが含まれる。
だから…

と、それぞれの検索結果の内容のキーワードの比較検討をしている回答が多く見られました。


私は、この回答を見せてもらうまで、そんな「関係」の見方には気づいていなかったので、「そう言われれば、それも関係なのかもなぁ」と感心してしましたが、おそらく、問題で問われている「関係」は、この「関係」ではないと思われます。
なぜかと言えば、これは、「検索キーワードの関係」というより、「検索結果の関係」だと思われるからです。

問題で尋ねられているのは、検索キーワードとしての、「桜」と「サクラ」の関係です。
もっと詳しく言うとするなら、この新聞記事データベースにおける、キーワードとしての「桜」と「サクラ」の関係。

キーワードとしての「桜」と「サクラ」の関係なので、その検索結果の詳しい内容は、この際あまり重要ではないと思われます。
全然関係ないかといわれると、そんなことはないのですが。


なんだか話をややこしくしているかもしれません。
では、そうでないなら、この「関係」とはどんな関係なのか。
それはつまり、先程言った、キーワードとしての、「桜」と「サクラ」の関係なのです。

まず、どうしてこの問題でキーワードとして取り上げられているのが、「桜」と「サクラ」なのでしょう。

もし、これが、「桜」と「菊」なら話は簡単かもしれません。
「桜」と「菊」というキーワードには、何の関連性もない。
あるとするなら、お互い花であるということぐらい。

ですが、これが「桜」と「サクラ」の場合はそうではない。
この2つのキーワードは、どちらも「さくら」です。
漢字とカタカナという違いはありますが、どちらも「さくら」であることには変わりはない。

じゃあ、このデータベース上では、その2つのキーワードの関係は、どのように扱われているのか。

それがこの問題の尋ねていることだと思われます。


では、実際に検索して、その関係を見て行きます。

まず、「桜」という言葉を、見出しのみで検索します。
すると結果は123件です。
一応検索結果の一覧を見てみると、当然、漢字の「桜」の含まれる見出しがヒットしており、ここにカタカナの「サクラ」は見当たりません。
実は一つだけ、カタカナのサクラがあるのですが、まあ、ほとんどないと言って良い。

では、次に「サクラ」を、これまた見出しのみで。
今度の結果は、24件。
「桜」に比べるとずいぶん少ないですね。
こちらも中身を見てみると、やはり、カタカナの「サクラ」だらけで、漢字の「桜」は、ほぼ、見当たりません。

この結果から、どんな関係がわかるのか。
それはつまり、漢字の「桜」の検索結果の中には、カタカナの「サクラ」は見当たらず、また、カタカナの「サクラ」の検索結果の中には、漢字の「桜」は見当たらないということです。

これを簡単に言ってしまうと、このデータベースでは、漢字の「桜」とカタカナの「サクラ」は、先程の「桜」と「菊」と同じように、まったく関係のないものとして扱われている。
そういうことになると思われます。

どちらも同じ「さくら」なのだけど、このデータベースでは、まったく違う2つの言葉として扱われている。
そういうことになります。


これが、この問題の解説です。
これ以上は必要有りません。


私がお詫び申し上げている理由はここにあります。


ここに、さらに続きとなる文章があります。
この後の文章が、私がお詫び申し上げている原因です。


まず、「桜」を見出しのみで検索した結果は123件でした。
そして、「サクラ」の場合は、24件。

この2つのキーワードが、まったく別のものであるならば、「桜」or「サクラ」の検索結果、つまり、「桜」と「サクラ」のいずれかのキーワードが含まれている検索結果は、その2つを足したものと同じになるはずです。

が、まずは、それをやる前に、「桜」と「サクラ」が一つの見出しに両方含まれているものがあるかどうかを調べておかねばなりません。
これをorで検索した場合、1つの記事で2件分ヒットしてしまうことになってしまいますから、検索結果の数が違ってきてしまいます。

ということで、まずは、「桜」and「サクラ」で検索します。
この新聞記事データベースでいうなら、「すべての文字列を含む」で検索するということです。
見出しのみで検索すると、結果は1件。
これは、一つの見出しに、「桜色」という言葉と、「サクラ」という言葉の両方が使われています。

では、被っているのが1件あるということなので、「桜」の123件と、「サクラ」の24件を足したもの、つまり、147件から、1件引きます。
すると、146件。

「桜」と「サクラ」が、このデータベース上で、まったく別のキーワードであるという関係ならば、この2つをorで検索すると、146件ヒットするということになります。

この新聞記事索引でのor検索は、「いずれかの文字列を含む」で検索するということ。
早速やってみます。もちろん見出しのみで。
そうすると…

結果は見事146件。
これにより、この2つのキーワードは、まったくの別の言葉として扱われていることが証明されました。

ですから、「この2つのキーワードは、このデータベース上では、関係のない言葉として扱われている。」
というのが、最終的な答えになるはずです。



この部分。
私から、この問題について聞いた方は、ここまで書いていらっしゃるはずです。
そして、これが私のお詫び申し上げている理由です。

この部分は、私の勘違いに他ならず、答えには必要ありません。

いや、必要ないどころか、加えてはいけない部分です。


そうなのです。
私は、自分の勘違いから、余計な部分を加えて、数人の皆さんにお話しをしてしまいました。

この部分を、詳しく書いていれば書いているほど、答えが間違っていると判断される可能性が高まってしまいます。


その理由についても一応説明します。

まず、or検索というものについて考えなければなりません。
これは、その条件となる複数のキーワードのどちらかが含まれているものを検索する方法です。

そして、and検索。
これは、その条件となる複数のキーワードのどちらもが含まれているものを検索する方法です。


では、私が今、余計な部分と言ったところで、やっていることはなんなのでしょう。
これは、ただ単に、その2つのキーワードの検索結果の全体のヒット数を示すものでしか有りません。
普通に、「桜」と「サクラ」の2つの検索結果を足す、つまり、or検索をすると、被っている1件の部分が、2重に数えられてしまい、実際より1件多くなってしまいます。
これを予め引いておくこと(この被っている部分をand検索で導き出すことができます)で、被りのない、すべてのヒット件数が導き出されるのです。

これで分かるように、ここには、2つのキーワードの関係は、なにも関わってきません。
この作業をしたところで、2つのキーワードが、別のものとして扱われている説明にはならないのです。

つまり、この部分について、先程私が上に書いた文に、近い文章で書いていればいるほど、答えからは外れてしまうことになります。


私自身は、こんな風に考えていながらも、試験に合格しています。
それはなぜか。

それは私が、その時、時間がなかったために、この部分をすごくあいまいに書いているからです。

私の回答は、検索結果を並べ立てて、最後にこう書いただけのものです。

「以上の検索結果から、2つのキーワードは、別のものとして扱われていると言える。」

この回答からは、or検索の結果が、それにどう関係してるのかまったく分かりません。
ですが、それが逆に良かったのです。

その為、私の答えは、間違いと判断されなかったのではないかと思われます。
採点が済んだ答案を見たわけでもないので、確実ではないのですが、きっとそうなのでしょう。

ですが、今回の場合は違います。
時間がたっぷり有ったために、しっかり詳しく書くことができてしまいました。

私の説明を聞いて、それをそのまま飲み込んで書かれてしまった方は、きっとor検索の部分を強調して書いていらっしゃることでしょう。
私自身、そこを強調しましたし、さらに、そこを追加するよう勧めたりもしました。

そうなると、逆にそれが災いし、答えから外れていると判断される危険性があるのです。



この問題が間違いと判断されることで、再試も合格できない方がいらっしゃる可能性があります。
これは私の責任によるところが非常に大きい。

再再試が行われるのなら良いのですが、その保障はない。

司書講習は、一つの単位を落とすだけで、もう今年は司書資格を手に入れることができなくなってしまいます。
そうなると、その方の一年を、私は奪ったことになる。

そしてそれは、ともすると、その方の人生を奪ったことにもなるかもしれない。

実際、私がそうなったと考えれば、人生を奪われたも同等です。


私は、誰かの人生を奪ってしまったのかもしれない。


今はお詫びすることしかできません。
大変申し訳ありませんでした。



このようなことを、このblogで、また仮名を使ってお詫びすることは不謹慎かもしれません。
ですが、とにかく報告をしておきたく、ここにこうやって書かせていただきました。