問題の毎月勤労統計:本来はサンプル調査ですが
厚労省の基幹統計「毎月勤労統計調査」に調査方法に手抜きがあったことが問題になっています。
この統計は本来サンプル調査で、国勢調査のような「センサス」(全数調査)ではありません。(毎月勤労統計調査の母集団は「事業所統計」でこれは全数調査です)
しかし、業種別、規模別、男女別、年齢階層別、正規、非正規別といった内訳についても統計的に誤差の範囲が限定されたものにするためには内訳についてもいて一定以上のサンプル数がないと、誤差の範囲が拡大してしまって、正確な統計になりません。
勿論サンプルの取り方が統計理論に則ったもの、例えば層別・多段のランダム・サンプリングといった方法できっちりした方法によらなければなりません。
その中で、分類別に区分していって、例えば、卸売業で規模500人以上の事業所、女性、正規労働者などといった形ですが、細かくすればするほど、対象事業所の数が少なくなって、サンプリングをすると偏りの出る可能性が大きくなりますから、そういう場合は全数調査にするといった事にならざるを得ません。
今回は統計の設計上サンプル数が少ないので、全数調査にすべきところを、手間を減らすためでしょうか、サンプル調査で間にあわせた、という事のようです。
通常、最終サンプルの数が500以上あれば、統計的に有意などと言われますが、今回の場合はどうなのでしょうか。
サンプリングにしたが、統計的に有意と言える範囲なのかどうかという事が、統計業務をやる人には生命線だと思います。
勿論、基幹統計(かつての指定統計)に回答しないと罰則がありますから、統計的有意が担保されるわけですが、手間を省くために、真面目に答えてくれそうな会社をサンプルに入れるようなことがありますと、そういう会社はいい会社(事業所)が多いですから、例えば賃金水準が高めに出るといった偏りが起こり得ます。
このブログでも、毎月勤労統計からみて、今年に入って賃金決定の様相が少し変わって、高めいなったと指摘しましたが、せめて、「手は抜いたが、サンプリングは統計理論に基づいていいて、この調査結果は、そんなことで出たものではないことを願っています。(ちょっと冗談が過ぎましたか・・・。)
厚労省の基幹統計「毎月勤労統計調査」に調査方法に手抜きがあったことが問題になっています。
この統計は本来サンプル調査で、国勢調査のような「センサス」(全数調査)ではありません。(毎月勤労統計調査の母集団は「事業所統計」でこれは全数調査です)
しかし、業種別、規模別、男女別、年齢階層別、正規、非正規別といった内訳についても統計的に誤差の範囲が限定されたものにするためには内訳についてもいて一定以上のサンプル数がないと、誤差の範囲が拡大してしまって、正確な統計になりません。
勿論サンプルの取り方が統計理論に則ったもの、例えば層別・多段のランダム・サンプリングといった方法できっちりした方法によらなければなりません。
その中で、分類別に区分していって、例えば、卸売業で規模500人以上の事業所、女性、正規労働者などといった形ですが、細かくすればするほど、対象事業所の数が少なくなって、サンプリングをすると偏りの出る可能性が大きくなりますから、そういう場合は全数調査にするといった事にならざるを得ません。
今回は統計の設計上サンプル数が少ないので、全数調査にすべきところを、手間を減らすためでしょうか、サンプル調査で間にあわせた、という事のようです。
通常、最終サンプルの数が500以上あれば、統計的に有意などと言われますが、今回の場合はどうなのでしょうか。
サンプリングにしたが、統計的に有意と言える範囲なのかどうかという事が、統計業務をやる人には生命線だと思います。
勿論、基幹統計(かつての指定統計)に回答しないと罰則がありますから、統計的有意が担保されるわけですが、手間を省くために、真面目に答えてくれそうな会社をサンプルに入れるようなことがありますと、そういう会社はいい会社(事業所)が多いですから、例えば賃金水準が高めに出るといった偏りが起こり得ます。
このブログでも、毎月勤労統計からみて、今年に入って賃金決定の様相が少し変わって、高めいなったと指摘しましたが、せめて、「手は抜いたが、サンプリングは統計理論に基づいていいて、この調査結果は、そんなことで出たものではないことを願っています。(ちょっと冗談が過ぎましたか・・・。)