東京都立高入試、英語スピーキングテストにさらなる瑕疵 本当に厳正な採点が行われたのか〈AERA〉
2/24(金) 18:00配信
58コメント58件
昨年11月に、都内の公立中学校の3年生ら7万1千人あまりを対象に実施されたスピーキングテスト。都立高校入試にも利用される(撮影/朝日新聞社)
複数の採点ミスの発覚に、平均点に関する疑念──。今年度導入された英語スピーキングテストは、都立高入試の合格発表を控えるいまも反対運動が続いている。なぜ次々に疑念が生まれるのか。
【図表】不受験者のほうが有利?
逆転現象とは
* * *
音漏れに、前半組の解答の声が後半組に聞こえる会場設計の不備、学習指導要領からの逸脱、不受験者に仮得点が与えられることで起こる「逆転現象」など、数々の問題点が指摘されてきた英語スピーキングテスト「ESAT-J」。都立高校入試の一部として、昨年11月に初めて行われたこのテストは、東京都教育委員会(都教委)が事業者と共同実施。タブレットを用いて受験生の解答音声を録音し、フィリピンで採点する方式で行われた。
その結果は、3月に合格発表を控える都立高校入試の総合得点の一部として利用される。1月にスピーキングテストの結果が返却された後にも、新たな問題が浮上した。誤って低く採点された受験生が8人いたというのだ。 複数の採点者が気づかないなんて
都教委はトラブルの原因を、「8人の解答音声データの一部に、一定の機械音のみが録音され、解答音声が確認できない箇所があることが判明した」とする。京都工芸繊維大学でコンピューターを使ったスピーキングテストを開発・運営してきた同大名誉教授の羽藤由美氏は、今回のトラブルについてこう話す。
「これは『解答音声の回収トラブル』と呼ばれるものです。回収できない理由はさまざまですが、通常はいくつものケースを想定し、システムを構築します」
都教育庁の瀧沢佳宏指導推進担当部長は都議会文教委員会での答弁で、「(最初に)機械で波形をチェックし『無音』の場合はバックアップファイルで採点したが、『音が録音されている』ものに関しては確認をしなかった」としている。 羽藤氏は言う。 「機械音などの雑音が入るのは、当然想定しておくべきトラブル。録音された解答音声が極端に小さいことなどもあります。『無音』のケースしか想定していなかったことが信じられません」
最初のチェックをすり抜けた「機械音」の解答。都教委の説明が事実なら、それらの解答の一つひとつを、2人の採点者が耳で聞き、並行採点をして結果を出したはずだ。複数の人間が、シャーという機械音に気づかないことなどあるのだろうか。
「問題のある解答の採点に関わった複数の採点者が、誰ひとり機械音の解答に気がつかないままで採点を終わらせたことも信じられません。
採点ミスが知らされたのは、願書提出締め切り前日の2月6日。14日に再提出ができるとはいえ、突然の採点ミスの連絡に受験生は戸惑ったはずだ。なぜこんなタイミングになったのか。
「解答音声を希望者全員に開示することになったからかもしれません。成績を出した後で、開示に備えて事業者が解答音声を確認した結果、ミスを公表せざるを得ない事例が見つかったのではないでしょうか」(同)
さらに、テストの等化が適正に行われたのかとの疑念も指摘されている。 本試験と追試で平均点が約9点も違う
今回のように本試験と追試・再試験が行われる予備日で「同じ仕様で異なる問題」が使われるテストでは、二つのテストの難易度や、採点の「あまさ・からさ」をそろえる統計処理(等化)が必要となる。受験者の能力を、「同じものさし」で比べるための作業だ。
本試験(平均60・77)と予備日(同52・16)の平均点が、8・61違うことに疑問をもったアオヤギ有希子議員(共産党)が、都議会文教委員会でこれら二つのテストを「等化したのか」「したならどのようにしたのか」を質問した。
だが都教育庁の瀧沢氏は、
「質問の趣旨が正確にわかりかねる」として答えなかった。羽藤氏は言う。 「ここははぐらかすのではなく、『等化している』と断言しなければならなかった場面です。本試験と予備日の間に生じた大きな平均点の差は、受験した生徒の能力の差を表すものであり、『問題の難易度や採点のあまさ・からさは影響していない』と都教委が断言できないようでは、異なるテスト版の成績を比べて合否を決めることはできません」
もし、予備日の問題の難易度が高かったために、平均点が大幅に下がったのならば、予備日の受験生が不利になる。
さらに羽藤氏は言う。
「等化された複数のテスト版を作るには高度な専門知識と入念な準備が必要です。今回のように全ての問題を公開しながら、たった3回のプレテストを行っただけでそれが可能とは常識的には考えにくい。このような状況で、本試験と予備日の平均点に大きな差が生じた場合は、事業者が行った等化がうまくいっていないことを疑ってみるべきです。しかし都教委には、事業者の仕事を検証しようという姿勢が見られず残念です」
試験後に保護者や専門家から湧き上がった平均点に関する疑問は、これだけではない。
今年度の平均点は、これまで3年間のプレテストに比べて、おおよそ7点アップしている。都教委は「教育の成果」と発表しているが、羽藤氏は首をかしげる。
「リーディングやリスニングならまだしも、スピーキングにおいて東京都の中学生全体の能力がたった1年間で跳ね上がったと見るのは非現実的。やはりここでも、異なるテスト版の等化がうまくいっていないことをまず疑ってみるべきだと思います」
以下はリンクで