英語民間試験が共通テストでの活用中止に?CEFRの対応表に見える「ズレ」とは?

こんにちは。manavi編集長・研究員の岡田です。

2021年5月24日、大きなニュースが流れてきました。

延期・再検討となっていた、『大学入学共通テスト』での英語の民間試験活用が、正式に中止される見通しとなったのです。

文部科学省で5月24日に開催された「大学入試のあり方に関する検討会議(第26回)」で具体的にどのような話になったのかは議事録を読むまでわかりませんが、多くの教育学者が指摘してきたように、『大学入学共通テスト』に複数の英語民間検定試験を導入することにはかなりの課題がありました。

また、そこで話題にあがっていたCEFRの扱いについても無理があったと思います。それが実運用の段階になって露見したというのが実情ではないでしょうか。

今回の記事では、文科省の方針の批判ではなく、テスト設計・英語教育の観点から、「何が問題だったのか」を考えていきます。

また、その中で2018年の増補版CEFRの要点に触れつつ、本来の「複言語複文化主義」に基づいた言語教育の方向性について私なりに述べてみたいと思います。

▲目次に戻る

そもそもなぜ「英語4技能を評価するテスト」は難しいのか?

今回、様々な議論がある中で、最も話題になったのは「スピーキングテスト」でした。

リーディング・リスニング・ライティングは従来の客観式テストでも実施されてきました。もちろん、どんなテスト設計でどんな出題をするか、どのような回答形式で、どのように採点するか・・・などによって、計測できる力は様々です。

テストを行えば何らかの能力の測定はできると考えられています。その中でも、選択式問題や一意に解が出るような出題であれば、採点にブレが出ず、公平だということで入試では誰が採点しても◯×が明確につく問題が多く採用されています。

一方、「スピーキング」はある種の「パフォーマンス」ですから、客観的なテストをすることは非常に困難です。

まず、考えてみましょう。「スピーキング力」というのはどんな力ですか?

これは「体力とはどんな力ですか?」という問いに似ています。握力?短距離走のタイム?持久走のタイム?個々人によって結構凸凹した結果になると思います。

スピーキングも、要素に分解すると、いろいろややこしいのです。「発音の正確さ」でしょうか?「適切な英文を提示すること」でしょうか?(その場合、ライティングとどのように違うのでしょうか?)「返答の間のとり方」でしょうか?覚えてきた英文をスラスラと暗唱することでしょうか?

「間のとり方」もコミュニケーションの場面では非常に重要なので、この項目をスピーキングテストに導入するとして・・・質問されてから何秒で答えることが「適切な間」になるのでしょうか?これは採点者・評価者によって変動するのではないでしょうか?変動するのであれば、評価の客観性はどのように担保されるのでしょうか?

このようなパフォーマンスの評価は、陸上競技のような物理的なタイム・記録に基づくものとは異なり、フィギュアスケートや水泳の飛び込み競技などのように、複数の評価者が予め設定されている評価基準(ルーブリック)についてちゃんと同様の理解ができているように研修した上で評価に臨みます。非常に人間的な感覚ですが、それを揃えるようにしているのです。

これは検定試験でも面接で行われる方法です。これであれば、パフォーマンス評価は成立します。

では、『大学入学共通テスト』の受験者、約50万人全員に面接を施せば良いのでしょうか?

それが物理的・時間的に無理なことから、民間試験導入という話題が出てきたのです。

▲目次に戻る

民間試験の導入にどんな問題があったのか?

「50万人を一括で面接したりすることは難しい。でも、その50万人をいくつかの試験に分散させたらいいのではないか?」

そう考えられて、複数の民間検定試験を利用することが決まりました。(当初は7団体・8種類の試験。レベル別で23種類)

ところがこれには、以下に挙げるような問題点がありました。

①受検者の集中への対応

確かにそれぞれの検定試験の「年間受検者数」を合わせると50万人を超えます。

一方、この「受検者」は大学入試の学齢の人だけではなく、あらゆる世代とあらゆるレベルの人がいる上に、年間で分散しています。

これが一定の偏りがある時期に、同じレベルの検定に一気に受検者が集中した場合、各検定試験団体は対応できるのでしょうか?

また、どの検定試験にも満遍なく人が分散すればよいのですが、どの試験を受けるかが任意であれば、受検料や実施会場や試験内容などによって受検者が偏る可能性も考えられます。

②各試験の特徴の違い

例えば実用英語検定とTOEIC では、そもそも計測したい英語運用能力の方向性(コンセプト)が異なっているので、出題傾向や問題の設計が違います。

そうした各試験のオリジナリティを無視して一律に入試に活用することに無理はないのでしょうか?

③英語以外の「外国語」への対応

『大学入試センター試験』では「外国語」の試験の枠があり、多くの大学や受験生が英語を選択しているものの、ドイツ語・フランス語なども選択可能です。

しかし、今回利用が検討されていた試験は「英語のみ」で、他の外国語に関しては掲げられていないのです。

このような幾つもの問題があったにもかかわらず、民間試験活用は断行されようとしていました。

その中で、複数の民間試験を活用する際に、それぞれのスコアを比較するために利用されたのがCEFR(Common European Framework of Reference for Languages)の対応表でした。

以下が文部科学省から提出された対応表です。

出典: 『各資格・検定試験とCEFRとの対照表』 (文部科学省)

▲目次に戻る

CEFRはテストの「標準化」に使えるものなのか?

みなさんはテストの「標準化」という言葉を聞いたことがありますか?詳細には立ち入りませんが、少しだけ例を挙げてお話しします。

もし、学校などで行われるテストがあったとして、同じ力を測っていると説明を受けながら、同じ学生が毎回違うスコアで評価されたらどうでしょうか?成績が伸びたのかどうかもそれではわかりません。

また全員が0点、全員が満点をとれるテストは能力測定としては妥当でしょうか? 

このような状況にならないために、テストは設計者によって緻密にデザインされています。同じ学力の人がほぼ同じスコアがでるような問題設計・問題の精査・採点基準の統一化・・・などの工夫がなされています。

当然ながら、民間試験もそれぞれが内部で標準化されているのです。

しかし、複数のテスト間でその標準化はなされているでしょうか?

一時期、SNS上では、同一人物がいくつもの民間試験を受検してスコアが文科省の対応表通りにはならないことを示した投稿がありました。その情報を元にして、「スコアが出やすい検定を受けるべし」という風潮もあったわけです。

そもそも、TOEICもTOEFLも同一の団体(ETS)が実施していますが、なぜ複数の検定試験を用意しているかというと、計測するべき英語運用能力が異なるからです。

ウィキペディアによると「TOEFLは、英語圏の高等教育機関における英語コミュニケーション能力(講義の受講、学術書の講読、ディスカッションへの参加等)を問うており、入学者選抜のための基準として用いられている。これに対し TOEIC はビジネス英会話および日常会話を主眼にしている。」とあります。

これら、どちらを受検すべきか、どんな力が測れたというべきかは、まさにテストの設計によって異なるのです。ですから、複数のテスト間で標準化を図ること自体が、それぞれの設計思想に沿ったものになっているかは疑問なのです。

対して、実際にはCEFRを利用して標準化がなされているようになっているのが、先ほど示した対応表です。

ところが、CEFRの本来の目的を考えれば、この対応表自体がその意図から離れていることは確かだと思います。なぜなら、明確に「標準化に使うツールではない」とされているからです。

増進堂・受験研究社主催のセミナーで使用したスライド(岡田・制作)

もともと、ヨーロッパでは各国の公用語がEU全体の公用語としてほぼ認められています。ですから、大学の授業などでも「この講義ではスペイン語で聞く(受容)力が必要で、レベルはB1を想定しています」というような告知がされます。

受講生はその目安をもとに、「自分は書くことはC2レベルだけど、聞くことならB1はあるから、受講しても問題なさそうだな」などと判断するのです(
Figure9 )。

出典: 『Common European Framework of Reference for Languages: Learning, teaching, assessment 』(欧州評議会)

また以下のように、同じ人物が「フランス語」「スペイン語」・・・といった複数の言語の複数の技能についてそれぞれA1だとかC2だ、というように凸凹の評価で良いわけです( Figure10)

出典: 『Common European Framework of Reference for Languages: Learning, teaching, assessment 』(欧州評議会)

またその線引きも虹のようなもの(Figure4)で境界線は曖昧なものだと説明されています。(Figure5みたいに明確な線引き能力測定においては存在しないのです。)

出典: 『Common European Framework of Reference for Languages: Learning, teaching, assessment 』(欧州評議会)より一部抜粋

ところが、日本ではCEFRは「標準化」に使われようとしていました。

また、CEFRではそれぞれの技能ごとに参照レベルがあったのに対して、日本では4技能全体で参照レベルを利用しようとしていました。「4技能をバランスよく育成する」という学習目標は良いのですが、ヨーロッパでの複言語・複文化主義という文脈で生まれたCEFRの思想とはそもそも異なるのです。

▲目次に戻る

最後に

今後、日本にも多くの在留外国人が来ることになります。その中で、複言語・複文化主義に基づいたオリジナルのCEFRの理解はますます重要になってくるでしょう。

今回の制度改革に振り回されたのは、受験生自身です。

本来、民間検定試験の受検は学習者が任意で受けるものです。また検定ですから、「学校で求められるのとは異なる軸で英語運用能力を評価してみたい」「自分の能力の証明として利用したい」という意図があったはずです。

個人差はありますが、社会的には「何度でもチャレンジできる」「受検に強制力は働かない」という点で気軽なもののはずでした。

ところが入試に直結するようになると、「どの検定が有利に働くか?」「A大学で求める試験は◯◯だが、B大学では△△だ。複数のテスト勉強をしなければ」「検定料だけでいくらかかるんだ」など、悩みは出てきます。

誰のための入試なのか?誰のための教育なのか?を忘れる社会にならないよう、それぞれの立場で整理することがますます必要となってきます。

▲目次に戻る