学校の数学の中でも虐げられているような気が...

20 年以上前の話ではあるが、高校の数学で「確率・統計」という科目は受験を控えた3年生に登場する。こういったものは、とかく、受験問題としては重要視されない傾向がある。受験の数学だと、選択問題の中の1つになるので、確率・統計を解かなければいけない、ということはない。歴史だと近・現代史が軽視されるのと同じ構図があった。

今がどうなのかは、正確には知らないが、そう変わっているとは思えない。

学校での数学は、物理や化学の道具としての数学に重きが置かれている気がする。進学して、理科系の大学に入って勉強するのなら、それらの知識は必要なのだが、そうでなければ、「数学なんて分からなくても困らない」というのは、ある面では正しい。微積分や行列の知識など、学校を卒業して役に立つことは無いだろう。

でも、統計は違うと思う。

統計と言っても、実験データを解析するために使うような物はいらない。回帰曲線の求め方など知らなくても良い。でも、中学校の数学に出てくる基本的な統計処理は、知っていると知っていないとでは、大違いだ。

誰でも知っているはずの「平均値」。でも、「平均値」は平均値付近で山を描くような分布でなかった場合には、その値は実感と離れてしまう。よく、「平均年収」が、実感よりも高い値になっていると思う人は多い。理由は簡単で、高額所得者の金額は青天井で、高額所得者の人数が少なくても、その金額がの大きさの影響で、平均値を押し上げてしまう。極端な状況を考えれば、一人が年収1億で、19 人の収入が 0 であっても、平均年収は 500 万円になる。

平均値は、こういった「偏った分布」に弱い。それを補うために「最頻値」や「中央値」がある。「最頻値」は、分布の山の頂点がある値、「中央値」は順番に並べていって、ちょうど真ん中となる値。上記の極端な分布の例であれば、「最頻値」も「中央値」も 0 円になる。

実際の所得分布も平均値より最頻値・中央値は低い値になっている。

ところが、マスコミも「平均値」しか取り上げないし、驚いたのは国税庁が出している民間給与の実態調査にも平均値しか、代表値としては取り上げられない。

国税庁ホームページリニューアルのお知らせ|国税庁

さすがに分布状態を知るための表はあるのだが、この統計を代表する値としては平均値しか出てこない。

「平均値」「最頻値」「中央値」は中学の数学の教科書に登場していたと思う。かれこれ 30 年近く前の話だから今は違うのかもしれないが、統計の初歩が分かっていたら、平均値が統計を代表する値としてふさわしいのかどうかを、まず最初に考えるはず。

確かに「分布がよく分からないから、とりあえず平均を計算してみる」ということはある。でも、毎年のように調査していて、ちゃんと分布の特徴も分かっている給与所得の統計に、平均値と実感の乖離が大きいことは、そんな難しい数学の話ではない。

自分が中高校生だった頃には、まだ「べき分布」は有名ではなかった。私も最近、経済物理学の本を読んで、どういう分布なのかを知った。この「べき分布」をありきたりの統計値で表現すると、平均値は限りなく 0 に近くなり、標準偏差は無限大になる。その経済物理学の本では、年収が 2000 万円を超える辺りから、べき分布となっている、と書かれていた。

「平均値」は役に立つとは限らない。それは、分布次第だ。

というところを、ちゃんと学校の数学の時間に教えてもらえないかなぁ。別に、難しい数式が出てくるわけでは無い。逆に、難しい数式が出てこないから、受験問題向きじゃない、ということで軽視されるのかもしれないが、普通の人にとって、一番身近で実用的な数学だと思うのだが...