【第9回】ついに来た!データの活用問題〜傾向と対策〜
迫田 昂輝先生
こんにちは!算数・数学の受験指導をしています、迫田昂輝(さこだこうき)です。
突然ですが皆さん、メジアンって聞いたことありますか?
日本語では中央値と呼ばれています。実はこれ、算数の「データの活用」という単元で学習する言葉です。多くの保護者様にとっては馴染みの薄い言葉ではないでしょうか。
データや資料を活用する問題はこれまでもありましたが、せいぜい表やグラフから数値を読み取って、平均値を求める程度のものでした。しかし、ついに今年の中学入試で「データの活用」の単元がいくつかの中学で出題されました。
今回は、この馴染みのないデータの活用の単元の正体に迫っていきたいと思います。また、せっかくですので、この単元の簡単な解説もしていきます。データの活用の単元を学習したことない方も、気軽に読んでもらえると嬉しいです。
保護者の皆様には「データの活用」という単元にあまり馴染みがないかもしれません。
それもそのはずです。なぜならこの単元は、ごく最近導入された単元です。初めは高校の数学Ⅰという単元で必修(2012年)になりました。それが中学学習単元に降りてきて、今現在小学校の学習内容にも入ってきました。
そして、データの活用の単元が導入された最初の児童達の入試が今年だったわけです。 このような問題が出題されました。
下の表は、中学生16人の生徒が50点満点のテストを受けた結果を表したもので、中央値が43.5点、平均値が44点でした。このとき、表のアの人数は 人、エの人数は 人です。
※実際に2021年の中学入試で出題された問題から、一部数値を変更した例題として掲載しております。
かなり難しい問題で、高校生でも間違う可能性が高いと思います。解説は、記事の最後に公開しております。
近年、ビッグデータの活用やAI(人工知能)の普及により、データを扱う重要性が高まってきました。その背景もあり、高校・中学・小学校で幅広くデータの活用の単元が導入されることとなりました。
ちなみに高校では2022年度から、これまで必修ではなかった統計の単元が必修になる予定です。
つまり、ごくごく最近学習するようになった単元なので、保護者様の世代では馴染みが薄いのではないかと思います。せっかくですので、簡単な授業を行ってみましょう。
平均値や中央値などの、データを扱う上で意味のある重要な値をまとめ代表値と言います。平均値は皆さんもお分かりだと思いますが、中央値(メジアン)ということはご存知でしょうか?
ここで、私が書いた高校生向けの学習参考書「数学のトリセツⅠ・A」から、中央値に関する説明を抜粋します。
こんな例を考えてみましょう。5 人の社会人がいます。この 5 人の年収は次のようになっていました。
さて、ここで 5人の平均年収を考えてみましょう。平均年収は、
(200 + 250 + 350 + 700 + 1000)÷ 5 = 500
ですから、5人の年収の平均は500 万円です。したがって、350 万円の年収の人は平均以下ということになりますね。
しかしながら、350 万円の年収の人は平均以下ではあるものの、この 5人の中ではちょうど真ん中の年収なわけですから、悲観する必要も特になさそうですよね。
このように、データの真ん中の数字を中央値(メジアン)と呼びます。
ある年のデータですが、男性の平均年収は 514 万円でしたが、中央値は 442 万円 でした。ということは、年収が 480 万円の人は「平均以下」ではありますが、「真ん中より上位」ということになります。年収 480 万円の人は「俺の年収は平均以下なんだ〜」と嘆く必要はなく、堂々と胸を張って「上位の方にいるんだ!」と言っていいわけです。
ここからもわかるよう、平均値と中央値というのは扱われ方が違います。「何番目なのか?」を知りたい場合は、平均値よりも中央値の方が役に立ちますね。
データの大きさ(データの個数のこと)が奇数の場合は,先ほどのように中央の値がすぐにわかるのですが、データの個数が偶数個のときは、ど真ん中(中央)がありませんよね?その場合は,真ん中にある 2 つの数字の平均値を中央値 とします。
たとえば,与えられたデータが
の場合、データの個数が6個ですから「ど真ん中」がありません。ですので、真ん中2つの値(3番目と4番目)である 40 と 50 の平均をとって、45 が中央値ということになります。
また、最頻値(モード)ということばも学習します。これは、読んで字の如く「最も頻繁に出る値」です。
例えば、子ども20人にアンケートを取り、今月読んだ本の冊数を調べた結果、以下のようになったとしましょう。
これを、小さい順に並び替えると、
0、0、1、1、2、2、2、3、3、3、4、4、4、4、4、5、5、6、7、8
となります。最頻値は、最も頻繁に出る値ですから、4(冊)ということになります。
ちなみに、中央値は10番目(3冊)と11番目(4冊)の平均なので、3.5(冊)ということになります。
では、せっかくですので、もう一問。
『小学高学年 自由自在 算数』 p.392より
いかがでしょうか?仕組みさえわかってしまえば、そこまで難しい内容ではありませんよね。
こちらの解説も、記事の最後に公開しておりますので、そちらをご覧ください。
個人的に、今年の中学入試においてどの程度「データの活用」の単元から出題されるか興味がありました。というのも、大学入試においては共通テスト(旧センター試験)では「データの分析」が出題されるものの、2次試験においてはそこまで扱いが大きくなかったからです。
中学入試算数といえば図形の難問や、大人でも苦しむ整数問題などがメインです。データの活用の単元は多くの学習塾で取り扱うことはほとんどなかったようでした。「仮に出題されたとしても大したことないだろう」とたかをくくっていた塾も多いと思います。
しかし、蓋を開けてみれば、いくつかの中学でこの単元から問題が出題されました。当然、図形や文章題に比べればはるかに分量は少ないわけですが、1点が合否を分ける入試においては、無視するわけにはいかないでしょう。今後もこのタイプの問題が出る可能性は大いにあります。
では、どのように対策をしていけば良いのか。現状としては、データの活用の単元が出題されたことが昨年まではなかったので、過去問が圧倒的に足りていません。また、現在発売されている多くの中学入試対策の問題集も、その扱いは小さくなっています。
しかし、中学・高校生向けの問題集にはこれらの問題が多く掲載されています。先に紹介した青山学院中等部の問題も十分高校レベルの問題ですので、中学・高校生向け問題から抜粋して解いていくことになります。各学習塾もきっとこの辺りに関しては今後力を入れていくことでしょう。
また、データの活用の単元は中学、高校と学習が続きます。中学ではさらに難しくなり、四分位数や箱ひげ図、高校に入ると分散や相関係数などが出てきます。これらの単元は、当然小学校学習内容から接続するので、小学校で躓くと後々苦労をします。中学受験をしない場合でもしっかり勉強をしておくことが大切です。
あと付け加えておくとすれば、本文で触れたように、この「データの活用」の導入の背景には、ビッグデータの活用やAI(人工知能)の普及によってデータを扱う重要性が高まってくることがあります。
入試や教科学習の枠をこえて、これからの社会を担う子どもたちが、実生活で役立つ思考方法となるわけですので、馴染みのなかった保護者の皆様もぜひお子様とご一緒に学んでいってみてください。
最後に、先ほどの例題の解説をいたします!
下の表は、中学生16人の生徒が50点満点のテストを受けた結果を表したもので、中央値が43.5点、平均値が44点でした。このとき、表のアの人数は 人、エの人数は 人です。
16人の生徒がいるので、中央値は小さい方から数えて8番目と9番目の生徒の平均値となります。すなわち、中央値は
(43 + 44)÷2 = 43.5
より、43.5点であることから、8番目の生徒は43点、9番目の生徒は44点であることがわかります。
42点以下の生徒が6人いることから、43点の生徒は2人であることがわかるので、アは2となります。また、人数の合計から
イ+ウ+エ=16-(1+1+4+2+4)=4 …①
平均を求める式から、
40×1 + 41×1 + 42×4 + 43×2 + 44×イ + 45×ウ + 46×4 + 47×エ = 44×16
であるから、
44×イ + 45×ウ + 47×エ = 185 …②
ここで①式の両辺を44倍すると、
44×イ + 44×ウ + 44×エ = 176 …③
②式と③式を比べ(差を取)ると、
ウ + 3 ×エ=9
ここで、ウ、エの組み合わせは、
(ウ,エ) = (0, 3), (3, 2), (6, 1), (9, 0)
になるのですが、①から、ウ、エの和が 4 より大きくなることはないので、ウが0、エが 3 となります。
(ちなみにイが 1 になります。)
答え ア…2、エ…3
詳しい解説を聞きたい方は、「数学のトリセツ」より、こちらの動画をご覧ください。
『小学高学年 自由自在 算数』 p.392より