平均世帯所得524万円にかかったバイアスを取り除いて「普通」を暴く
ふと気になって、とあるWebページにたどり着く。
まずこの図はミスっている。意図的なものかは知らない。
2000万円以上の所得をもつ人が1.3%いるのに、棒の長さが0.1くらいしかない。数値が間違っているか。グラフが間違っているか。どちらかが間違っている。
平均世帯で2000万円以上稼いでいる人が1.5%いるおかげで、平均値が釣り上げられている。
中央値が405万?
あえていうなら、データが表すのは「世帯」の所得であること。一人当たりではない。共働きをしていれば、それだけ「世帯」の所得は増える。それにしても。
中央値が405万?嘘くさい。
平均値が524万?嘘くさい。
というわけで、見方を変えてみました。
たまたま成功した人の成功体験を鵜呑みにするのが危ないのと同じように、神話的な成功物語と現実を区別しようというお話です。
統計学的に厳密に見ると、外れないバイアス
厳密に統計的な意味で「外れ値」かどうかは議論しません。正規分布で大小0.13%しか外れ値認定されていないからです。全然外れません。
箱ひげ図を使った場合でも、1600万以上の値が弾かれるだけです(それでもマシだとは思いますが)
統計学とは、なんだかんだ言って、バイアスを弾く工夫を提供する学問で、バイアスをいかに設定するかは、人力なのです。
正規分布ではないけれど、厳密ではないけれど、正規分布の分析手法を使います。
(上の図の裾野を左側に広げれば、正規分布として見ることもできそうだが)
分析の方針は、「あまりにも庶民的でない数値(両端か、片端か)をデータに含めないとどうなるか」です。
1:95%の世帯の平均所得
95%より外側のデータを2.5%ずつ削ります。すると世帯所得の最高額が1600万円になり、100万円以下の割合も減り、次のようなデータになります。
世帯所得(「万」未満) | % | 各世帯所得階級の合計金額 |
100 | 4.4 | 220 |
200 | 14.6 | 1460 |
300 | 14.5 | 2175 |
400 | 12.9 | 2580 |
500(中央値:400に近い) | 10.7 | 2675 |
600 | 8.5 | 2550 |
700 | 6.4 | 2240 |
800 | 5.8 | 2320 |
900 | 4.6 | 2070 |
1000 | 3.7 | 1850 |
1100 | 2.6 | 1430 |
1200 | 2.3 | 1380 |
1300 | 1.8 | 1170 |
1400 | 1 | 700 |
1500 | 0.8 | 600 |
1600 | 0.6 | 480 |
合計 | 95.2 | 25900 |
結果は・・・・
平均世帯所得(年) | 平均世帯所得(月) |
272.0588235 | 22.67156863 |
この金額、どこかでみたことありませんか?
「平均」的な給与だと私は思いました。
とても実感できます。これが、庶民の「平均」でしょうか。
2:所得の中央値から68%のデータだけをとると・・・
さらに、庶民中の庶民のデータだけ取ってみましょう。
68%という数値は正規分布のデータの分布の指標であり、この数値を採用します。
ちなみに、正規分布では平均値の場所が中央値でもあるのですが、このデータは平均値が中央値ではないので、中央値である300万から400万未満の値から左右に34%ずつ取ります。
世帯所得(「万」未満) | % | 各世帯所得階級の合計金額 |
200 | 13 | 1300 |
300 | 14.5 | 2175 |
400(中央値:300に近い) | 12.9 | 2580 |
500 | 10.7 | 2675 |
600 | 8.5 | 2550 |
700 | 6.4 | 2240 |
800 | 2 | 800 |
合計 | 68 | 14320 |
結果は
平均世帯所得(年) | 平均世帯所得(月) |
210.5882353 | 17.54901961 |
月収17万という数字をどこかでみた覚えが・・・
求人情報を見ている方なら、これは正社員の「最低」賃金と同じだと思うかもしれません。
3:中央値ではなく平均値から68%を抽出すると平均所得は・・・・
1の95%を抽出したデータを2では中央値(300万以上、400万未満)を基準に68%とりました。
ここでは、1のデータの平均値(200万以上、300万未満)から68%取ってみます。
すると。。。
世帯所得(「万」未満) | % | 各世帯所得階級の合計金額 |
7.7 | 0 | |
100 | 4.4 | 220 |
200 | 14.6 | 1460 |
300(中央値) | 14.5 | 2175 |
400 | 12.9 | 2580 |
500 | 10.7 | 2675 |
600 | 3.2 | 960 |
合計 | 68 | 10070 |
100万以下から足が出ました。(ここに致命的な何かがある気がします)
この時点でこの数値が意味をなしているかわかりませんが・・・
結果は・・・
平均世帯所得(年) | 平均世帯所得(月) |
148.0882353 | 12.34068627 |
この数値、どこかで見たような・・・
寄り道!生活保護、アルバイトによる給与
生活扶助が71,460円(平均年収の中央値である福島県の独身世帯の金額)
住宅扶助が36,000円(平均年収の中央値である福島県の独身世帯の金額)
とすれば、合わせて11万。独身世帯でなければ増えます。
独身者の生活保護と同じくらいの金額です。
時給1000円で1日7.5時間、月に20日働くと15万円と比べてもいいかもしれません。
4:32%を端からとると・・・
2では1の中央値から68%とりましたが、しそもそも正規分布ではないので、1と同様に、端から32%を除いたデータで計算すると・・・
世帯所得(「万」未満) | % | 各世帯所得階級の合計金額 |
200 | 8.8 | 880 |
300 | 14.5 | 2175 |
400(中央値:300に近い) | 12.9 | 2580 |
500 | 10.7 | 2675 |
600 | 8.5 | 2550 |
700 | 6.4 | 2240 |
800 | 5.8 | 2320 |
900 | 0.4 | 180 |
合計 | 68 | 15600 |
1と2の間の数値になりました。
平均世帯所得(年) | 平均世帯所得(月) |
229.4117647 | 19.11764706 |
この数値も求人サイトで見かけますね。
まとめ(どの数値を使うか?)
平均世帯所得(年) | 平均世帯所得(月) | |
1:元のデータの外側を2.5%ずつ削る(95%) | 272 | 22.6 |
2:1のデータの中央値から68%をとる | 210.5 | 17.5 |
3:1の平均値から68%とる | 148 | 12.3 |
4:元のデータの外側を16%ずつ削る(68%) | 229.4 | 19.1 |
生活保護(単身者・生活扶助・住宅扶助) 11万
フルタイムアルバイト 15万
3はデータが欠損しているので参考程度に。
1は庶民中の庶民ではないので参考程度に。
2は極端な数値を省いた1のデータの中央値を参考にしているので、妥当と言えば妥当。
2か4か。
5:高所得者の1割を意図的に削る。
するとどうなるか。1割という数値に根拠はありません。やってみましょう。
世帯所得(「万」未満) | % | 各世帯所得階級の合計金額 |
100 | 6.9 | 345 |
200 | 14.6 | 1460 |
300 | 14.5 | 2175 |
400(中央値:300に近い) | 12.9 | 2580 |
500 | 10.7 | 2675 |
600 | 8.5 | 2550 |
700 | 6.4 | 2240 |
800 | 5.8 | 2320 |
900 | 4.6 | 2070 |
1000 | 3.7 | 1850 |
1100 | 1.4 | 770 |
合計 | 90 | 21035 |
平均世帯所得(年) | 平均世帯所得(月) |
233.7222222 | 19.47685185 |
まとめ(2回目)
5の結果を受けて、庶民中の庶民、普通中の普通の所得を次のように概算しようと思いながら。
平均世帯所得(年) | 平均世帯所得(月) |
230万 | 19万 |
5の分析の「1割」と言う数値があまりにも根拠がないため、2と4の平均にします。
平均世帯所得(年) | 平均世帯所得(月) |
220 | 18 |
6:68%を、下から取ると・・・???
庶民の感覚であれば、下から68%をとりたい。正規分布ではないし、貧困に近いし、そちらの方が現実的だろうという色眼鏡をつけて分析してみましょう。5の数値を1割ではなく、32%にした場合。
世帯所得(「万」未満) | % | 各世帯所得階級の合計金額 |
100 | 6.9 | 345 |
200 | 14.6 | 1460 |
300 | 14.5 | 2175 |
400(中央値:300に近い) | 12.9 | 2580 |
500 | 10.7 | 2675 |
600 | 8.4 | 2520 |
合計 | 68 | 11755 |
平均世帯所得(年) | 平均世帯所得(月) |
172.8676471 | 14.40563725 |
これは時給1000円のアルバイトをフルにこなした時の月収に近いですね。
7:95%を下から取ると???
ついでなので。
世帯所得(「万」未満) | % | 各世帯所得階級の合計金額 |
100 | 6.9 | 345 |
200 | 14.6 | 1460 |
300 | 14.5 | 2175 |
400 | 12.9 | 2580 |
500 | 10.7 | 2675 |
600 | 8.5 | 2550 |
700 | 6.4 | 2240 |
800 | 5.8 | 2320 |
900 | 4.6 | 2070 |
1000 | 3.7 | 1850 |
1100 | 2.6 | 1430 |
1200 | 2.3 | 1380 |
1300 | 1.5 | 975 |
合計 | 95 | 24050 |
平均世帯所得(年) | 平均世帯所得(月) |
253.1578947 | 21.09649123 |
結論、日本の世帯の真の庶民の「平均所得(月)」は、「生活保護」+7万円の18万である。
びっくりする結果ですが、世帯の平均所得が524万という数値にかかったバイアスを取り除いた結果、庶民の「平均」、つまり「ふつう」が見えました。生活保護を単身者世帯で計算しましたが、17万、22万という数値が一人の月収の額と(なぜか)近似していたことを思えば、この結論は妥当だと評価しておきます。
7万円の、重みを感じます。
この7万円の差は、いったい何なのか。必要最低限ではないこの月7万を、どのような営みに変えるのか。生き方を問われている気がします。
反省、振り返り
単身世帯が4割であること、高齢者の人口が多いこと、大学進学者の半数以上は奨学金という借金を背負っていること、そもそも元のデータの標本に偏りがある可能性などを勘案すると、このデータ分析は不十分と言わざるを得ませんが、与えられたデータを使って「平均524万」にかかっているバイアスを取り除くことはできたと思います。
アメリカの格差はもっとすごい、と言われているらしいです。若いみなさんは、日本でどのように暮らしていくのでしょうか。そもそも、お金を何に使うのか。どんな社会を作りたいのか、という視点がこの分析には抜け落ちています。
「普通が一番」
という言葉を聞くことがあります。
その普通とは何かを、改めて考えるきっかけになれば幸いです。
今回は、金銭的な、「普通」のお話でした。
もっと大事なことは、精神的な「普通」だと、私は思います。
精神的健康さ、精神的な成熟が、経済的な安定や発展以上に、私には問題であると思われます。
コメント