スウェーデンの今

スウェーデンに15年暮らし現在はストックホルム商科大学・欧州日本研究所で研究員

学生に剽窃・コピペをさせないための武器 「Urkund」

2014-04-10 13:15:49 | コラム
小保方氏の件について、問題の発端となったSTAP細胞のことについては色々と議論が続いているが、私は詳しく追っていないので置いておくとして、英語で書かれた博士論文のかなりの部分が実は英語のホームページからの剽窃(コピー&ペースト)だということが発覚した件については色々と考えさせられる。

印刷された博士論文をわざわざ国立国会図書館まで出向いて入手し、それをスキャンしてOCRにかけてデジタル化し、ネット上の情報と照らし合わせる人が現れるなど、本人は考えてもいなかっただろう。ただ、小保方氏の件は氷山のほんの一角に過ぎず、大学生のレポート・論文におけるコピー&ペーストはもっと高頻度に行われているのではないかと思う。今回の事件を受けて、自分の博士論文も同じようにも検査されでもしたら大変だ、と冷や汗をかいている研究者や教授は少なからずいるのではないだろうか?

現在、日本の大学では、学部教育から修士課程、博士課程における研究不正に関する教育が不十分だったとして、レポートや論文の書き方を指導したり、不正を行わないように注意したりする教育を学部の時から行うなどの対策が打ち出されているようだ。それ自体は必要なことだとは思うが、いくら「剽窃・コピー&ペーストはしてはダメですよ ♡」と学生の倫理に訴えたところで、その不正が発覚する確率が低ければ、不正をする学生はし続けるだろう。そういう学生がいて、インチキをしながら要領よく好成績を収め、進級・進学や就職を有利に進めていくならば、他の学生も真面目に自分でレポートや論文を書くのがバカバカしくなり、自らもインチキに手を出してしまうかもしれない。そうすると、大学全体、いや国全体の教育や研究の質を低下させてしまう

剽窃・コピー&ペーストをやめさせる上でもっと効果的なのは、剽窃がいかに簡単に見つかってしまうかを学生に知らしめて、悪い出来心を起こさせないようにすることだと思う。ただし、そのためには実際に剽窃を簡単に見破るための装置をきちんと導入する必要がある。

私がスウェーデンの大学で学部生の教育に携わるようになったのは博士課程の3年目くらいから。最初はティーチング・アシスタントとして、そして次第に科目そのものの責任者をしたり、学部論文の指導もするようになった。今ではスウェーデンのほとんどの大学は、学生が提出するレポート・課題・論文に剽窃がないかをきちんとチェックする強力な武器を使っている。Urkundと名づけられたシステムだ。(余談だが、Urkundとはスウェーデン語で「証書・文書」を意味し、犯罪の一つとしてのUrkundsförfalskning(文書偽造)という単語をニュースなどにおいて耳にすることも多い)

このUrkundというシステムでは、学生が教員にレポート・課題・論文を提出する際に、紙にプリントアウトして提出する、ということはもはやしない。すべてMS WordかPDF形式にしてメールに添付し、デジタル的に提出するのである。

ただ、学生は私に直接メールを送るわけではない。学生はUrkundシステムに設けられた私宛の特殊なメールアドレスにレポートなどの文書を送るのである。Urkundはその文書を受け取ると、(1)ネット上の文字列・PDF文書、(2)書籍などの印刷物、(3)Urkundシステムを通じて過去に提出された文書、と照らしあわせて一致度を検証する。そして、学生の文書とともにその検証結果が教員である私のもとに届けられるのである。学生がUrkundシステムに文書を提出してから、私がその文書と検証結果を受け取るまでの時間は2時間から半日だ。


このUrkundシステムが比較対象としている情報だが、まず、上記の(1)については、Web上の様々なサイトを定期的にチェックし、保存しており、その数は100億サイトに上る。Web上に掲載されたPDFもオープンアクセスのものなら、ちゃんと保存し、学生の提出した文書の剽窃検証に使っている。アクセスが限定された有料学術誌は比較対象になっているのか気になるところだが、JstorやScience Directなど大手とはどうやら提携しているようで、試しにこれらの大手出版社のジャーナルに掲載された論文の一部をコピペして、このUrkundに送ってみたところ、いくつかはヒットした。そもそも、経済学の分野ではPeer-review付きの学術誌に掲載する前に、オープンアクセスのWorking PaperとしてWeb掲載することが多いので、そのようなWorking Paperとの比較で剽窃が分かる。

次に、(2)については、Urkundを運営している企業によると、大手の出版社などと提携して学術・非学術雑誌の記事、日刊紙の記事、百科事典、各種書籍、データベースをシステムに取り込んでいるらしい。ただし、その程度はよくわからない。

(3)については、2012年11月時点で650万にのぼる学生のレポートや論文などが蓄積されているという。この素晴らしいところは、例えば、ある科目で私が昨年と同じ課題を生徒に与えたとして、ある学生が昨年受講した学生のレポートの一部をコピーして私に提出した場合でも、ちゃんと見破れる点である。しかし、それだけでない。スウェーデンの多くの大学が同じUrkundシステムを利用しているため、たとえば、ウプサラ大学で提出された学士論文をヨーテボリ大学の学生が入手して、そのまま、もしくは一部を剽窃して提出したとしても見破れるのである。

このUrkundシステムは、もともとスウェーデンのウプサラ大学教育学部と、電子データベースなどを専門とするスウェーデン企業との提携で開発され、2000年秋に実用化した。いまほどインターネットが発達していなかったにしろ、ウプサラ大学も既に90年代終わりから剽窃・コピペの問題に頭を悩ませており、ITを駆使してうまく対抗できないかと考えていたようだ。2000年秋からウプサラ大学で運用が始まってしばらくすると、その有効性が評価され、スウェーデン国内の大学が次々と同じシステムを利用するようになった。最近では、高校でも利用されるようになっているという。剽窃は大学よりも以前の段階から問題となっているのである。

その利便性は国際的にも評価され、その結果、現在ではフィンランドやデンマークの大学のほか、トルコの大学も加わっているようだし、フランス、スペイン、オランダ、ベルギー、ドイツ、ポーランドにも支社があるところを見ると、これらの国々の大学でも利用されているようである。

まさに、必要性が元となり、合理的思考とIT活用とがうまく結びついて完成した新しいビジネスといっても良いかもしれない。

また、このUrkundシステムの便利なところは、学生にしても教員にしても、何か特別なプログラムやアプリをインストールする必要が全くなく、普段から使っているメールプログラム(WebメールでもOK)とブラウザだけで全ての機能を活用できる点である。

さらに嬉しい機能としては、学生が過去に同じメールアドレスから送ったレポートとは比較しない、という点だ。例えば、レポートに多数の不備があり、再提出を要求したとする。再提出されたレポートは1度目に提出されたレポートと大部分が同じであるため、この機能がなければUrkundシステムは「ほぼ一致」と判定してしまう。しかし、この機能のお陰でこの学生が同じアドレスから再提出をしていれば、その問題がなくなるのである。


Urkundから私のもとに送られてくる、検証結果はこんな感じである。


これは提出されたレポート・課題の一覧。一致度の高さが色で表されている。あるレポートの上にカーソルを置くと、「この文書の43%が他の72の文書・文献に使われている文言と酷似している。一致度が高い箇所のうち、もっとも長いものは467語であり、この箇所は他の文書・文献と100%一致している」と表示される。 (レポートの総ページ数が5ページとなっているが、これは概算らしく、間違っている)

そして、個別のレポート・課題についての検証結果を開いてみると、このようになっている。


一致度が高い箇所には、その程度に応じて色が付けられている。そして、そのうちの一つをクリックしてみると、


なるほど、この箇所の52%が、スウェーデンの環境保護庁のサイト(www.swedishepa.se)に掲載された文章に似ていることが分かる。

どのようなアルゴリズムを使っているのか分からないが、感度は抜群だ。ただ、実際それが剽窃・コピペに分類されるのかはケース・バイ・ケースで、個別に判断していかなければならない。例えば、一致度が100%でも、引用という形を取っていればOKである可能性が高い。



Urkundの案内パンフレットより(和訳は私が加えた)

ヨーテボリ大学がこのUrkundシステムを利用していることは、新入生向けのオリエンテーションで学生に告知されるし、私も自分の講義の中で改めて学生に伝える。「剽窃しても見破るのは非常に簡単だから、剽窃しようなんて考えないほうが良いよ」と釘を差しておく。それが抑止力となり、私の経験の範囲内で言えば、実際のレポート提出では剽窃のケースはほとんどない。

ほとんどない、とは言っても実はこれまで2、3件あった。もっとも深刻なケースは、他の学生が前学期に提出したレポートを入手し、ところどころ言葉を入れ替えただけで提出した学生だった。Urkundから私のところに送られてきた検証結果は「98%一致」。レポートの中身を吟味した上で「丸写し」と判断。その学生は経済学部の学生部長を経て、大学の規律委員会に送られ、数ヶ月の停学となった。


では、このUrkundシステムが利用されるようになったことで、スウェーデンにおける剽窃・コピペの件数は減ったのだろうか? 興味があったので、統計を掘り起こしてみた。統計といっても、剽窃・コピペの全件数を数え上げた統計があるわけではない。この件数はunobservableだ。存在するのは、発覚した件数の統計だけだ。考えてみればすぐに分かることだと思うが、発覚した件数からUrkundの効果を推し量るのは難しい。Urkundは抑止力によって剽窃・コピペの件数を減らすかもしれないが、一方、Urkundの活用が進めば剽窃・コピペを見破るのが容易になるから、発覚する件数は増えるからだ。

いずれにしろ、参考までに、スウェーデンの行政庁の一つである大学庁のまとめによる剽窃・コピペの発覚件数(各大学の規律委員会への報告件数)と停学処分の件数をグラフにしてみた。


(注:2004年からは国立ではなく財団立である3校、つまり、ストックホルム商科大学、ヨンショーピン大学、シャルマシュ工科大学が統計に加えられた)

これを見ると、過去10年ほどで増加傾向にあることが分かる。スウェーデンの大学が次々とこのシステムを活用するようになったのは2000年代半ばから後半にかけてなので、不正を見破るのが容易になったことを反映しているかもしれない。Urkundは今では大学教育の重要な根幹をなすようになり、学生にも十分、そのシステムの存在が認識されるようになってきたから、そろそろ抑止力が有意に現れ始めて、学生がそもそも剽窃・コピペをしなくなっていき、発覚する件数も減少していく頃だろうか・・・? グラフから分かるように2012年は前年よりも減少しているが、これが一時的なものなのか、それとも長期的なトレンドとなるのかは、今後の統計を見なければわからない。乞うご期待!

P.S. 実は過去にも似たような記事を書いていた。
2010-04-06:学生の盗用・コピーをチェックするための画期的な方法
2010-04-25:レポート盗用の摘発

最新の画像もっと見る

コメントを投稿