深谷薬局 養心堂

漢方薬局 深谷薬局養心堂

平均値の落とし穴

よくデータで平均値というのが使われる。
平均がいくらいくらと言われると、おおよそ皆そんな感じと思う。
しかし、平均は「実態のおおよそ」と全然違う事がある。
平均の欠点は、数値の大きい人が一人でもいると全体の平均が引きずられて大きくなってしまう事だ。
例えば、100人の給料の平均を出すのに、その中に一人、イーロン・マスク氏のような人がいたらどうなるか。
イーロン・マスク氏の給料は30兆円と言われる。マスク氏以外の人の給料が1円だったとしても平均値は一人3000億円!
こういう人がいると平均は実態からかけ離れてしまう。
そこでより実態に近いのが中央値。
少ない人から多い人に順番に並べて、真ん中の人の値を使う。
これが実際の感覚に近い。
ではなぜ、中央値ではなく平均を使うのか。
理由は平均の方が計算しやすいからだ。
平均の場合は、一人一人の値を順番に合計して、最後に人数で割れば出る。
これに対して中央値は全部のデータを保存して並べ直す必要がある。
この並べ直すという作業は、人間にとってはとても大変なのだ。
100件くらいならできなくも無いが10000件手作業となるととても大変。1日かかっても終わるかどうか。
しかし、今はコンピュータがある。10000件のデータの並べ直し(ソート)なんて一瞬で出来る。
入力の手間は同じなので、平均も中央値もコンピュータを使えば計算の手間はあまり変わらない。
なので、そろそろ平均値はやめて中央値を使うようにした方が良いと思える。
なのに何故そうならないのか?


ブログ一覧に戻る