吉田忠「標本調査による構造的変化の把握-農林省農家経済調査におけるランダムサンプリングをめぐって-」『統計学』(経済統計研究会)第10号,1962年7月,(『数理統計の方法-批判的検討-』農林統計協会,1981年)
標本調査論の意義と限界をユニークな視点で,批判的に考察している。この視点は社会統計学の側から標本論批判の到達点の確認のもとで,しかし現実の各種の社会調査に適用された標本調査の結果からその有効性を一概に否定できない事実をおさえての議論展開ということである。
筆者によって確認されている標本調査の評価は,以下のとおりである。(p.71,以下ページの表記は単行本のもの)
(イ)実在の社会集団に関して,全数調査をもとにした母集団リストがあるとき,ランダムに抽出されたサンプルの標本平均値で構成される純解析的集団の確率的安定性を利用して,その社会集団の特性値の平均を推定することは可能である。
(ロ)しかし,それは確率的操作にもとづいてくみ立てた純解析的集団を媒介するという迂回的把握であるから,直接的把握である全数調査に比して種々の制約があり,その制約が社会集団の認識には致命的な場合もある。
筆者が本稿で試みているのは,(ロ)でいう制約を明確にすることである。その論点はほぼ出尽くしていたが,(イ)の否定と連動させた議論が多く,混乱した状況がみられるので,整理が必要という(本稿の第一の目的)。この整理を踏まえ,農林省農家経済調査を例に標本調査の問題点を検討するというのが本稿の第二の目的とされている。
筆者は標本調査のメリットについて,その技術的なメリット(迅速性,経済性,誤差の縮小)とともに,本質的メリットとして(1)標本誤差を確率的にではあるが,定量的に定めうること,(2)標本誤差をある範囲内に確率的におさめるのに必要な標本数を前もって定めることができることにみる。
社会集団に実際に標本調査が適用される場合,そこでの手続きの核心は社会集団の単位をn次元の点として変換することを前提とした一連の数学的論理である。「この転換が許されるならば,標本調査は非標本調査を除いて社会集団への適用なるがゆえの困難性はほとんど感じさせない」(p.73)。
標本調査の本質的メリットに対してなされた批判は,これも筆者の整理によれば,次のとおりである。
(イ)非標本誤差,(ロ)関連ある多数の標識をもった単位の構造をとらえる場合,(ハ)単位を標識の値にしたがって分類し,社会集団の構造をみようとする場合,(ニ)変質しつつある単位,変化しつつある社会構造をみる場合。(イ)以外は,社会集団から母集団を抽出する過程に生ずる問題である。
標本調査の本質は,上記のように社会集団の単位を空間上の点に,また標識の値を確率変数の値として翻訳することで成り立つ一連の数学的論理である。したがって,その社会集団への適用は,社会集団それ自体と異質なものに立脚する数学的手続きをいかに近似的に利用するかという問題である。換言すれば,標本調査は非標本誤差が考えられない,あるいは非標本誤差を非常に少なくしうる技術的手段が存在する調査対象に関して,調査目的にも合致する層別を行い,少数の標識に関する母平均などを確定しようとするときに,有効となる。筆者によれば,標本調査の本質的メリットに対してなされた批判は,近似的に社会集団に適用する際の「摩擦」であり,統計的推論の枠組みのなかでは回答が用意されている範囲のものである。しかし,社会集団の構造変化の把握に関しては,近似的利用という見地からみて,標本調査の適用は難しい。その本質的メリットを保証する条件がないからである。しかも社会科学的研究における統計利用は,そのほとんどがこの構造的変化の把握が目的なのである。
筆者は以上の指摘を,農林省農家経済調査で確認する。最初に,この統計調査の歴史を1961年まで,農家抽出の相違によって8期に区分している。「第1期:帝国農会農家経済調査(1913-1915)」「第2期:農林省農家経済調査(1921-1923)」「第3期:同(1924-1930)」「第4期:同(1931-1941)」「第5期:帝国農会経済調査(1942-1948)」。ここまでは調査方法は,有意選定であった。行論との関係で重要なのは,これ以降の調査である。戦後は,農家選定にみられた従来認識されていた偏倚を是正するため,層別二段抽出が導入された。すなわち「第6期:農林省農家経済調査(1949-1957)」「第7期:同(1957-1961)」。「第8期:同(1962- )」は,農業基本法による年次報告資料作成のため調査拡大がはかられ,抽出方法が前期(第7期)と変わった。第7期で第一次抽出単位は集落であったのが,第8期では数集落が併合された集団集落になっただけでなく,第一段で抽出された集団集落に従来の標本集落が含まれている場合には第二段抽出をランダムサンプリングで行うのをやめ従来の農家でもって第二次抽出単位の標本とされた。農家経済の動向の構造把握という観点から,また調査の継続性確保のためである。
農家経済調査の目的は,農業の再生産構造の解明,全国平均の農業所得,家計費の推定である。この目的のために,農家経済調査は,戦後,層別二段抽出を採用したが,筆者によれば次のような事情から,ランダムサンプリングの条件を失っているという。(イ)不完全な母集団リスト,(ロ)抽出農家による調査拒否,(ハ)業務量配分に規制された標本配分の調整,(ニ)農家記帳の不正確。
これらとは別に,標本調査の本質的メリットがどのように実現しているかを点検すると,農家経済調査の上記の目的の後者についてみれば一応有効といえるが,前者に関しては無力であったと判断されている。第8期の調査では,後者の目的を実現するために,正確な推定を期してランダムサンプリングを徹底化させ,調査農家を約2.2倍に増やしたが(12,300戸),農家経済の動向の構造把握という目的が同一農家の継続調査を要求するので,上記のように,農家選定の方法が基本的に従来の農家に協力継続を依頼し,追加分のみランダムに抽出するという代物になってしまった。
「ここに,農家経済調査は1949年以来のランダムサンプリングによる農家選定の原則を意識的に放棄した(。)・・・構造的変化を標本調査で把握しようとする矛盾が具体的にあらわれたとみるべきである」というのが筆者の結論である(p.82)。
標本調査論の意義と限界をユニークな視点で,批判的に考察している。この視点は社会統計学の側から標本論批判の到達点の確認のもとで,しかし現実の各種の社会調査に適用された標本調査の結果からその有効性を一概に否定できない事実をおさえての議論展開ということである。
筆者によって確認されている標本調査の評価は,以下のとおりである。(p.71,以下ページの表記は単行本のもの)
(イ)実在の社会集団に関して,全数調査をもとにした母集団リストがあるとき,ランダムに抽出されたサンプルの標本平均値で構成される純解析的集団の確率的安定性を利用して,その社会集団の特性値の平均を推定することは可能である。
(ロ)しかし,それは確率的操作にもとづいてくみ立てた純解析的集団を媒介するという迂回的把握であるから,直接的把握である全数調査に比して種々の制約があり,その制約が社会集団の認識には致命的な場合もある。
筆者が本稿で試みているのは,(ロ)でいう制約を明確にすることである。その論点はほぼ出尽くしていたが,(イ)の否定と連動させた議論が多く,混乱した状況がみられるので,整理が必要という(本稿の第一の目的)。この整理を踏まえ,農林省農家経済調査を例に標本調査の問題点を検討するというのが本稿の第二の目的とされている。
筆者は標本調査のメリットについて,その技術的なメリット(迅速性,経済性,誤差の縮小)とともに,本質的メリットとして(1)標本誤差を確率的にではあるが,定量的に定めうること,(2)標本誤差をある範囲内に確率的におさめるのに必要な標本数を前もって定めることができることにみる。
社会集団に実際に標本調査が適用される場合,そこでの手続きの核心は社会集団の単位をn次元の点として変換することを前提とした一連の数学的論理である。「この転換が許されるならば,標本調査は非標本調査を除いて社会集団への適用なるがゆえの困難性はほとんど感じさせない」(p.73)。
標本調査の本質的メリットに対してなされた批判は,これも筆者の整理によれば,次のとおりである。
(イ)非標本誤差,(ロ)関連ある多数の標識をもった単位の構造をとらえる場合,(ハ)単位を標識の値にしたがって分類し,社会集団の構造をみようとする場合,(ニ)変質しつつある単位,変化しつつある社会構造をみる場合。(イ)以外は,社会集団から母集団を抽出する過程に生ずる問題である。
標本調査の本質は,上記のように社会集団の単位を空間上の点に,また標識の値を確率変数の値として翻訳することで成り立つ一連の数学的論理である。したがって,その社会集団への適用は,社会集団それ自体と異質なものに立脚する数学的手続きをいかに近似的に利用するかという問題である。換言すれば,標本調査は非標本誤差が考えられない,あるいは非標本誤差を非常に少なくしうる技術的手段が存在する調査対象に関して,調査目的にも合致する層別を行い,少数の標識に関する母平均などを確定しようとするときに,有効となる。筆者によれば,標本調査の本質的メリットに対してなされた批判は,近似的に社会集団に適用する際の「摩擦」であり,統計的推論の枠組みのなかでは回答が用意されている範囲のものである。しかし,社会集団の構造変化の把握に関しては,近似的利用という見地からみて,標本調査の適用は難しい。その本質的メリットを保証する条件がないからである。しかも社会科学的研究における統計利用は,そのほとんどがこの構造的変化の把握が目的なのである。
筆者は以上の指摘を,農林省農家経済調査で確認する。最初に,この統計調査の歴史を1961年まで,農家抽出の相違によって8期に区分している。「第1期:帝国農会農家経済調査(1913-1915)」「第2期:農林省農家経済調査(1921-1923)」「第3期:同(1924-1930)」「第4期:同(1931-1941)」「第5期:帝国農会経済調査(1942-1948)」。ここまでは調査方法は,有意選定であった。行論との関係で重要なのは,これ以降の調査である。戦後は,農家選定にみられた従来認識されていた偏倚を是正するため,層別二段抽出が導入された。すなわち「第6期:農林省農家経済調査(1949-1957)」「第7期:同(1957-1961)」。「第8期:同(1962- )」は,農業基本法による年次報告資料作成のため調査拡大がはかられ,抽出方法が前期(第7期)と変わった。第7期で第一次抽出単位は集落であったのが,第8期では数集落が併合された集団集落になっただけでなく,第一段で抽出された集団集落に従来の標本集落が含まれている場合には第二段抽出をランダムサンプリングで行うのをやめ従来の農家でもって第二次抽出単位の標本とされた。農家経済の動向の構造把握という観点から,また調査の継続性確保のためである。
農家経済調査の目的は,農業の再生産構造の解明,全国平均の農業所得,家計費の推定である。この目的のために,農家経済調査は,戦後,層別二段抽出を採用したが,筆者によれば次のような事情から,ランダムサンプリングの条件を失っているという。(イ)不完全な母集団リスト,(ロ)抽出農家による調査拒否,(ハ)業務量配分に規制された標本配分の調整,(ニ)農家記帳の不正確。
これらとは別に,標本調査の本質的メリットがどのように実現しているかを点検すると,農家経済調査の上記の目的の後者についてみれば一応有効といえるが,前者に関しては無力であったと判断されている。第8期の調査では,後者の目的を実現するために,正確な推定を期してランダムサンプリングを徹底化させ,調査農家を約2.2倍に増やしたが(12,300戸),農家経済の動向の構造把握という目的が同一農家の継続調査を要求するので,上記のように,農家選定の方法が基本的に従来の農家に協力継続を依頼し,追加分のみランダムに抽出するという代物になってしまった。
「ここに,農家経済調査は1949年以来のランダムサンプリングによる農家選定の原則を意識的に放棄した(。)・・・構造的変化を標本調査で把握しようとする矛盾が具体的にあらわれたとみるべきである」というのが筆者の結論である(p.82)。