前回の続きです。

前回(平均年収の罠)「平均という値は外れ値があると歪むのであんまりあてにならないよ」「中央値では歪みなく真ん中の値を見ることが出来るよ」という2点を示しました。

さて、中央値というのは前回も書いたように真ん中のケースの値です。ということはずらっと調査対象を並べ、それを降順、昇順のいずれかで並び替えて真ん中のケースを見るという作業が必要です。前回の例は5ケースしかなかったので簡単でしたが、年収調査ではとんでもない人数を調査していますので無理です。そもそも国税庁が全員のデータは公表してませんので研究者でも無い限り物理的に不可能です。

じゃあ、どうする!?

ここで出てくるのが、階級別の表です。
階級別の表とはどんなものか、前回の例に再び登場してもらって確かめてみましょう。
階級とは?

階級というのは、数をある程度の値で切って、カテゴライズしたものです。
今回はテストの点数を10点刻み(正確には9点刻み)でカテゴライズつまり階級としました。
階級別の表では、各階級に属する人数(度数)とそれまでに数えあげられた人数(累積度数)が最低限必要です。今回は分かりやすくしたかったので累積度数の%バージョンも入れました。

公的な統計はほとんどこの階級別の表という形で出されています。調べている数が膨大なので、こうしないと効率よく発表できないんですね。

でもこれだと、中央値は出させない気もします。
しか~し!!
こちらのサイトによれば、ある計算式を入れれば推定が出来るというではありませんか!

その式とは……。

中央値のある階級の、下端を X' , 度数を f' , 幅を C, X'より下の度数を F',総度数を F とすると、中央値は

“Me=X'+C*(F/2-F')/f'”

で算出が出来る。


というものです。

数学が苦手な方はくらくらするかもしれません。大丈夫です。私も数学は苦手です。でも丹念に見れば対して難しいことは言っておりません。

式を言葉で言い換えてみましょう。

中央値
=中央値所属階級の最低数+階級がいくつきざみか×(合計度数÷2-中央値所属階級前までの累積度数)÷中央値所属階級の度数


で出せる!

え、余計分かりにくい? それは諦めてください……。

これで本当に中央値が出るのか? 例で確かめてみましょう。
A組
Me=61+9×(5÷2-0)÷3=68.5 実際は70
B組
Me=61+9×(5÷2-0)÷4≒66.6 実際は62

やはり階級から算出しているので、正確には出ません。推測というのが使い道になりまそうです。ただ、大外れしているわけではありませんから、使えないわけでは当然ありません。(ちゃんとA組>B組ですしね)

では、本題の年収の中央値(推定)を出してみましょう。
算出には平成25年度分の民間給与実態統計調査の調査概要の部分を使用します。
(リンク:平成25年度分
年収の中央値(推定)
平成24年度:約350万円
平成25年度:約352万円(+2万円)


どうでしょう。だいぶ実感に近い値が出たんじゃないでしょうか。自分の周りで平均とったら大体こんなもんだよという程度の。

中央値で見てみても昨年度より年収はあがっていますが、上がり幅が6万から2万に縮まりました。ちょっとこの幅の縮小が何を意味するのかは専門では無いので分かりかねるところなのですが。

というわけで結論。
本当の平均年収はおおよそ352万円だよ!!
(ここでは誇張も含め中央値を本当の平均と扱っております。ご了承くださいませ)

ちょっとお堅い記事になってしまいましたが、見捨てないで見ていただけると嬉しいです(笑)
ではでは~



関連記事
Secret

TrackBackURL
→http://hiraisoanime.blog.fc2.com/tb.php/915-06546a60