統計のおはなし

2019年7月8日に昨年度における衆参両院の議員所得が公開され、各種メディアから報道されました。

平均所得は2,657万円だそうです。

「だそうです」と伝聞形で書いたのは元データを公開しているサイトを私が見つけられないので確認していないため。

今回取り上げた理由は「平均所得」を用いることが適切であるかを考えたいためです。

中学・高校生は資料の整理・統計を学んでいますが、「平均値」「中央値(メジアン)」「最頻値(モード)」の使い分けを知らないと誤った認識を持つ危険性があります(受験勉強にはそこまで求められませんが)。

統計というのは①どういうデータを集めるか②どのような手法で統計処理するかが大切です。

不都合な要素を意図的に数えなければ、あたかも望み通りの結果が出ているように見せることも出来るからです。

ですから①必要なデータが1)全ての項目について2)正しく採集されていること、②集めたデータが1)適切な手法を用いて処理されること2)わかりやすくグラフ化されること、が大切でありまた面白いところだと思います。

そこで、私は今回の平均所得という形での公表は不適切だと思いましたので検討します。

データの採取方法、については採取項目や手法がわからないので今回は問いません。

集めたデータの処理(平均値を選択)について検討したいと思います。

簡単に言うと、国会議員の議員報酬とは別に個人として所有する資産であるとか、副業など議員活動以外の所得も総所得にカウントされていることが問題となると思います。

元々お金持ちだった人が議員になれば、議員の総所得としては大きくなってしまうからです。

そして、もし一人が天文学的な所得(ここでは仮に1兆円としましょう。)を得ていたとしたらどうでしょうか。

国会議員が仮に1000人いたとしても、1兆円を山分けすれば、その平均値は10億円上がってしまいます。

つまり999人の国会議員所得が仮に0だったとしても、平均をとると一人当たり10億円の所得となってしまうのです。

これでは国会議員達は皆さん所得が多すぎるではないかという誤解を与えませんか?

10億円でも安いと思える方も、0より悪い、むしろ金払えと思われる方もおられるかもしれませんが、それは置いておきましょう。

統計の話に戻して、では中央値をとるとどうなるでしょうか。

答えは0です。

最頻値でもやはり0です。

1人の大金持ちと、999人のボランティアからなる仮定の下ではこれらの方が現実に即した評価方法と言えるでしょう。

では平均値を用いるのが妥当であるのはどのような時でしょうか?

それは1.上限や下限が定められている学校のテスト(仮に100点満点)や、2.データが正規分布(ちょっと難しい用語ですが説明はまたの機会にさせてください)を描く場合です。

1.であれば実態把握に対してさほど大きな誤差を生まず、2.であれば中央値・最頻値との誤差も小さい(厳密には一致する)です。

結論としては、「所得」という上限の制約のないものについて平均値を用いることは「意味」はあるが適切ではないと思います。

それは所得に大きな格差があったとしても平均をとると全体が良いように見えてしまうからです。

国会議員が「高額な所得を得ている」のだという印象を与えたいのであれば平均値を用いるのはわかります。

統計を用いた情報には注意しないと現実を見誤ります。

ただし、今回の報道での平均所得については平均値と中央値での差は100万円~200万円程度かと思います(最高で17億円程度の所得を得た方が一人いただけで、他には数千万円程度の人達がいただけだったはずです。そして議員給与として支給されている報酬は年間で2千万円程度【人により多少の差異がある】のようです)。

平均値と中央値などとの差の大きさをどう考えるかは主観が入るので、議論の余地があります。

以上が、統計における「平均値」についてのおはなしです。

統計は面白い学問ですが、統計処理という表現方法で人間の思いが入り込む危険性があります。

また、採取するデータの選択においてはさらに慎重でなければなりません。

たとえば「子供にとって良い保育園・幼稚園」を評価しようとするとどのような評価基準を採るべきかなど、比較の指標は難しい問題です。

また身近な例で言えば「おいしいラーメン」を評価する際に、売上高のみで評価すればよいか?を考えると、そうとも言い切れないと思われるのではないでしょうか。

高校受験やセンター試験においては「適切・妥当なデータの選択」までは問われていません。

しかし受験勉強の方法や指導においては統計データを利用(悪用?)した誘導が見受けられます。

たとえば「脳科学的に正しい」などです。

そんなことも今後書いてみたいと思うので、今回は導入がてらニュースを題材に取り上げてみました。

私はかねがね「普通」ってなんだろうと思うことがあります。

「ふつう」、「まとも」、「平均的」、「標準」、「一般的」、「国民的」、「あたりまえ」などの言葉はどれも同じように見えて違った場合をはらんでいると思いませんか?

他にも、「平等」と「同じ(イコール)」とは置き換え可能でしょうか?

せっかくの統計の話題なので、図表を用いて説明したかったのですが載せ方がわかりません。

また機会があれば補足していこうと思います。

2020年度(2021年実施)センター試験に代わる大学入学共通テストについて

2020年度実施の大学入学共通テストについて。

変更点などを紹介しつつ、備忘録として挙げておきます。

詳細は大学入試センターや各種予備校のサイトにありますので、ここでは私が重要と思う点のみ紹介します。

・国語と数学にて記述式問題が一部に登場します。

・英語にて民間の資格・検定試験の結果を利用する大学が出てきます。

英語については、大学入試共通テストと民間の試験の結果のいずれか、または両方を各大学が独自に選択して合否判定に利用するようです。

民間の資格・検定試験としては英検・ケンブリッジ英検・GTEC・TOEFL・TEAP・IELTS・TOEICがありましたが、TOEICは参加表明を取り下げました。

英語については、志望大学ごとに受験科目・民間の試験が採用されるのか否かを調べておく必要があります。

各種試験の難易度の差や、受験回数、受験時期の制限などもあり、教育産業界では良くも悪くも盛り上がりを見せております。

それはどの試験を選択するかによって有利不利が発生することと、そもそも試験会場が限られている民間試験もあるため、受験生に地域的な格差が生じやすいことが原因です。

そのため、どうやって生徒の英語能力をあげるかではなく、仕様変更に伴うビジネスチャンスに即応したいという活況だと思います。

国語や数学の記述問題のサンプルも大学入試センターのサイトより配布されています。

以下、私の感想です。

採点基準を統一することの困難さ、採点自体の労力の増加はあるにせよ、受験生に特別の準備を強いる変更とは私は思いません。

仕様変更自体に良しあしはないと思いますが、学力の向上を目指しているとは思えない「変更のための変更」といった印象です。

本来であれば大学側がもっと入試内容に意見を述べるべきだと思います。

たとえば海外から一流の学者を招聘して講義を行うため、難関大入学者には英語能力の向上を期待するというならば受験生も納得すると思います。

意欲的な在学生も喝采を送るのではないでしょうか。

今やろうとしていることは、仕様変更への対応力を期待しているとしか思えません。

合格してくる受験生はこの程度の仕様変更などものともしない圧倒的な学力を有するごく少数の生徒と、情報戦を勝ち抜いただけの多数の生徒達になるでしょう。

そもそも前者には多少の仕様など意味をなさず、後者には助言者の有無や地域差が合格の主な理由となるでしょう。

目標を決めずに基準を変更したところで成功も失敗もありません。

言い換えると出た結果から成功と主張することが出来てしまう「あと出しじゃんけん」です。

目標がないとは思いませんが、堂々と言えないような目標を隠そうとしているからこのような仕様変更になるのだと思います。

しかし、この責任は私を含む有権者である大人にあるのであって、大多数の受験生である未成年の生徒達にあるのではないことは自覚しておきたいと思います。

日本では18歳で選挙権があるのだから、受験生にも受験制度について責任があるというのは無理筋かと思いますがいかがでしょうか。

今後はこのような発信の機会を増やしたいと考えております。

あまり需要のない私のサイトですが、教育に関する内容でご希望があれば回答しますのでコメントなどお願いします。

知識の薄いところも多々ありますが、出来るだけ調べてお役に立てるよう努めます。