社会統計学の伝統とその継承

社会統計学の論文の要約を掲載します。

坂田幸繁「ミクロデータの利用とパネルデータ-DOR景況パネルデータを素材に-」杉森滉一・木村和範編『統計学の思想と方法』北海道大学図書刊行会,2000年1月

2016-10-06 10:36:41 | 2.統計学の対象・方法・課題
坂田幸繁「ミクロデータの利用とパネルデータ-DOR景況パネルデータを素材に-」杉森滉一・木村和範編『統計学の思想と方法』北海道大学図書刊行会,2000年1月

統計は調査統計と業務統計とが二本柱であるが,両者とも公表される際には集計量として示される。調査統計の場合に,個票としての調査票が集計される。研究者の側からみれが,集計量はそれとして,個票レベルで統計を扱うことができれば,より深く,多様な分析が可能になると想像できる。欧米では1970年代に,日本ではかなり遅れて1990年代にいわゆるミクロデータやパネルデータと呼ばれるデータセットに関心が高まった。筆者によれば,ミクロデータとは,個人や企業が識別される危険性を除き,「匿名化」処理を施した個票のセットを言う。またパネルデータとは,ミクロデータの利用の先端で観念されるデータであり,同一標本が継続的に観察されるデータのことである。

 筆者は本稿で,ミクロデータやパネルデータの利用について,対象把握の側面からその特徴を解明している。検討素材に,DOR(中小企業同友会調査)景況パネルデータから抽出した中小企業製造業のデータセット(1992年第1四半期~1996年第4四半期)が活用されている。

 まず,バブル崩壊後の中小企業における正規従業員数と臨時・パート数に関して複数時点の集計値の観察だけでは,その背後で進んでいる実態が不明な場合があり,そのような場合にミクロデータの活用が有効であることがあることが示されている。筆者はDORデータでその例を示している。具体的には,臨時・パート数と正規従業員数の平均値系列に対して,マクロデータとミクロデータとについて単純相関係数と最小二乗回帰直線を二時点でもとめると,マクロ集計量で確認されたものとミクロデータ(1992年,1996年)とでのそれとかなりの相異がある。前者ではそれなりに正の相関がみられるが,後者ではそれが消え,1996年のミクロデータでは全く相関がない。筆者はこのように,集計値の利用とミクロデータの利用では,分析結果が異なって出てくる可能性に着目し,もしミクロデータが利用できるならば,その分布を踏まえたより実質的なマクロ集計値系列の分析ができると結論づけている(p.205)。

 筆者は,次にデータリンケージについて解説している。例をあげて叙述しているので,そのさわりだけを要約すると,ある企業活動の調査で,異なる側面を調査した2つの調査(A,B)があったとして(同一時点,同一調査対象),A調査から例えば企業の収益(変数X),B調査で例えば従業員の過不足感(変数Y)が把握されたとして,この場合に2つの変数X,Yとの関係を分析するときに,データリンケージの手法が浮かぶ上ってくる。もしA調査とB調査の量調査の対象企業がかなり重複し,しかもA調査における回答企業とB調査におけるそれとを一対一で簡れづけることが可能であれば,重複企業を抽出し,抽出企業ごとに回答結果を結合すると,二つの変数XとYを含むデータセットが得られる。結果として得られたこのデータセットが分析対象の母集団を近似的に反映していることが確認できれば,新規調査を行わなくともよい。ミクロデータを基礎にしたデータリンケージの手法は,新規調査に代わる代替的推計法としての利用価値がある。

 筆者はさらにミクロデータの利用の一環として,パネルデータの解説を行っている。試験的に使われているデータは,DORの景況調査である。DOR景況調査は,中小企業同友会が定期的に実施している景況調査で,調査対象は同友会会員企業である。DOR調査は本来の意味でのパネル調査ではない。ここで例示に使われたデータは,筆者は景況把握のために行われている継続調査された原データセットを上記のデータリンケージの手法で時点を異にする同一調査を結合してパネルデータとして仮想的に編成したものである。

 筆者が行っているのは,各企業の景気予想を実績値と対応させ,予測パフォーマンスを把握するというものである。筆者はここで予測を,企業主体がその売上高に関して,主観的判断をまじえて概括的に行う「独自予想」と,過去の実績を単純に外挿して行う「外挿予測」とに分け,分析している。その結果,製造業企業では在庫を除く4つの変数(業況,売上,生産,採算)に関して,外挿予測方式が独自予想方式よりパフォーマンスが高くなっている。しかし,これを各変数の変動局面に関係させて比較すると,「好転・増加」もしくは「悪化・減少」といった局面では外挿予測方式が独自予想方式より予測的中率が高いが,「横ばい・不変」という局面では逆に外挿予測方式より独自予想方式のほうが若干予測パフォーマンスがよい。つまり独自予想方式は,上昇や下降といった局面では,その傾向が今後も続くという外挿予測方式に劣るが,横ばい状態では,今後も「横ばい・不変」と単純に外挿予測するよりも独自予想を行ったほうが的中率の高まることを示唆している。ここに独自予想が担う役割を意味づけることができる,という(p.213)。パネルデータを使うことによって,予想の形成過程,あるいは予想の外れをどのように予測主体が調整していくのか,その調整は合理的かといった問題の検討ができるというわけである。

 最後に筆者は,ミクロデータの有用性が複数のミクロデータの総合的利用にあること,データリンケージがその重要な形態であること,などを指摘して,擱筆している。
 なお,この論稿には補論「二次利用としてのパネルデータの編成-DOR景況パネルデータ-」がついている。DOR調査の調査主体である中小企業同友会の紹介(会員企業約4万,平均従業員規模約30人,平均資本金規模約1500万円)と調査の概要(1990年以降四半期ベースの定期調査と毎年一回の特別調査),そのミクロレベルでの二次利用の可能性(本来の調査目的以外での調査個票の統計的利用)の点検,景況パネルデータとして再編するにあったての未解決問題の提示である。また,同友会が1997年度特別調査の枠組みのなかで取り組んだ詳細な構造統計調査からわかった同友会調査データの統計対象の特性を5点にわたって列挙している。(1)大部分のサンプルが,中小企業基本法の規定に該当する企業層である。(2)そのなかで従業員数平均および資本金平均に関して,同友会会員企業はやや上位に位置し,パネル対象企業はさらに上位の層である。(3)資本金規模では2000万円から5000万円規模,従業員数では10人から100人規模が中心である。(4)業種業態では中分類以上の分類レベルで二つ以上のカテゴリーにまたがる事業活動がみられ,製造・サービス・卸・小売といった複合事業である。(5)業種では「製造業」「流通・商業」のウエィトが高い(約7割)。地域別では,「北陸・中部」地域が2割を占め,次いで「関東」「近畿」「北海道」である。全国的な事業所数の分布と比較すると,DORではサービス業のウエィトが低く,製造業のそれが高い。また中小企業事業所が集中する関東,近畿圏の割合が低く,北海道・東北地域の比重が大きい。 

コメントを投稿