2019年7月8日に昨年度における衆参両院の議員所得が公開され、各種メディアから報道されました。
平均所得は2,657万円だそうです。
「だそうです」と伝聞形で書いたのは元データを公開しているサイトを私が見つけられないので確認していないため。
今回取り上げた理由は「平均所得」を用いることが適切であるかを考えたいためです。
中学・高校生は資料の整理・統計を学んでいますが、「平均値」「中央値(メジアン)」「最頻値(モード)」の使い分けを知らないと誤った認識を持つ危険性があります(受験勉強にはそこまで求められませんが)。
統計というのは①どういうデータを集めるか②どのような手法で統計処理するかが大切です。
不都合な要素を意図的に数えなければ、あたかも望み通りの結果が出ているように見せることも出来るからです。
ですから①必要なデータが1)全ての項目について2)正しく採集されていること、②集めたデータが1)適切な手法を用いて処理されること2)わかりやすくグラフ化されること、が大切でありまた面白いところだと思います。
そこで、私は今回の平均所得という形での公表は不適切だと思いましたので検討します。
データの採取方法、については採取項目や手法がわからないので今回は問いません。
集めたデータの処理(平均値を選択)について検討したいと思います。
簡単に言うと、国会議員の議員報酬とは別に個人として所有する資産であるとか、副業など議員活動以外の所得も総所得にカウントされていることが問題となると思います。
元々お金持ちだった人が議員になれば、議員の総所得としては大きくなってしまうからです。
そして、もし一人が天文学的な所得(ここでは仮に1兆円としましょう。)を得ていたとしたらどうでしょうか。
国会議員が仮に1000人いたとしても、1兆円を山分けすれば、その平均値は10億円上がってしまいます。
つまり999人の国会議員所得が仮に0だったとしても、平均をとると一人当たり10億円の所得となってしまうのです。
これでは国会議員達は皆さん所得が多すぎるではないかという誤解を与えませんか?
10億円でも安いと思える方も、0より悪い、むしろ金払えと思われる方もおられるかもしれませんが、それは置いておきましょう。
統計の話に戻して、では中央値をとるとどうなるでしょうか。
答えは0です。
最頻値でもやはり0です。
1人の大金持ちと、999人のボランティアからなる仮定の下ではこれらの方が現実に即した評価方法と言えるでしょう。
では平均値を用いるのが妥当であるのはどのような時でしょうか?
それは1.上限や下限が定められている学校のテスト(仮に100点満点)や、2.データが正規分布(ちょっと難しい用語ですが説明はまたの機会にさせてください)を描く場合です。
1.であれば実態把握に対してさほど大きな誤差を生まず、2.であれば中央値・最頻値との誤差も小さい(厳密には一致する)です。
結論としては、「所得」という上限の制約のないものについて平均値を用いることは「意味」はあるが適切ではないと思います。
それは所得に大きな格差があったとしても平均をとると全体が良いように見えてしまうからです。
国会議員が「高額な所得を得ている」のだという印象を与えたいのであれば平均値を用いるのはわかります。
統計を用いた情報には注意しないと現実を見誤ります。
ただし、今回の報道での平均所得については平均値と中央値での差は100万円~200万円程度かと思います(最高で17億円程度の所得を得た方が一人いただけで、他には数千万円程度の人達がいただけだったはずです。そして議員給与として支給されている報酬は年間で2千万円程度【人により多少の差異がある】のようです)。
平均値と中央値などとの差の大きさをどう考えるかは主観が入るので、議論の余地があります。
以上が、統計における「平均値」についてのおはなしです。
統計は面白い学問ですが、統計処理という表現方法で人間の思いが入り込む危険性があります。
また、採取するデータの選択においてはさらに慎重でなければなりません。
たとえば「子供にとって良い保育園・幼稚園」を評価しようとするとどのような評価基準を採るべきかなど、比較の指標は難しい問題です。
また身近な例で言えば「おいしいラーメン」を評価する際に、売上高のみで評価すればよいか?を考えると、そうとも言い切れないと思われるのではないでしょうか。
高校受験やセンター試験においては「適切・妥当なデータの選択」までは問われていません。
しかし受験勉強の方法や指導においては統計データを利用(悪用?)した誘導が見受けられます。
たとえば「脳科学的に正しい」などです。
そんなことも今後書いてみたいと思うので、今回は導入がてらニュースを題材に取り上げてみました。
私はかねがね「普通」ってなんだろうと思うことがあります。
「ふつう」、「まとも」、「平均的」、「標準」、「一般的」、「国民的」、「あたりまえ」などの言葉はどれも同じように見えて違った場合をはらんでいると思いませんか?
他にも、「平等」と「同じ(イコール)」とは置き換え可能でしょうか?
せっかくの統計の話題なので、図表を用いて説明したかったのですが載せ方がわかりません。
また機会があれば補足していこうと思います。