goo blog サービス終了のお知らせ 

社会統計学の伝統とその継承

社会統計学の論文の要約を掲載します。

吉田忠「標本調査による構造的変化の把握-農林省農家経済調査におけるランダムサンプリングをめぐって-」『統計学』第10号,1962年7月

2016-10-06 10:50:36 | 3.統計調査論
吉田忠「標本調査による構造的変化の把握-農林省農家経済調査におけるランダムサンプリングをめぐって-」『統計学』(経済統計研究会)第10号,1962年7月,(『数理統計の方法-批判的検討-』農林統計協会,1981年)

標本調査論の意義と限界をユニークな視点で,批判的に考察している。この視点は社会統計学の側から標本論批判の到達点の確認のもとで,しかし現実の各種の社会調査に適用された標本調査の結果からその有効性を一概に否定できない事実をおさえての議論展開ということである。
筆者によって確認されている標本調査の評価は,以下のとおりである。(p.71,以下ページの表記は単行本のもの)

(イ)実在の社会集団に関して,全数調査をもとにした母集団リストがあるとき,ランダムに抽出されたサンプルの標本平均値で構成される純解析的集団の確率的安定性を利用して,その社会集団の特性値の平均を推定することは可能である。
(ロ)しかし,それは確率的操作にもとづいてくみ立てた純解析的集団を媒介するという迂回的把握であるから,直接的把握である全数調査に比して種々の制約があり,その制約が社会集団の認識には致命的な場合もある。

筆者が本稿で試みているのは,(ロ)でいう制約を明確にすることである。その論点はほぼ出尽くしていたが,(イ)の否定と連動させた議論が多く,混乱した状況がみられるので,整理が必要という(本稿の第一の目的)。この整理を踏まえ,農林省農家経済調査を例に標本調査の問題点を検討するというのが本稿の第二の目的とされている。

筆者は標本調査のメリットについて,その技術的なメリット(迅速性,経済性,誤差の縮小)とともに,本質的メリットとして(1)標本誤差を確率的にではあるが,定量的に定めうること,(2)標本誤差をある範囲内に確率的におさめるのに必要な標本数を前もって定めることができることにみる。
社会集団に実際に標本調査が適用される場合,そこでの手続きの核心は社会集団の単位をn次元の点として変換することを前提とした一連の数学的論理である。「この転換が許されるならば,標本調査は非標本調査を除いて社会集団への適用なるがゆえの困難性はほとんど感じさせない」(p.73)。

 標本調査の本質的メリットに対してなされた批判は,これも筆者の整理によれば,次のとおりである。
(イ)非標本誤差,(ロ)関連ある多数の標識をもった単位の構造をとらえる場合,(ハ)単位を標識の値にしたがって分類し,社会集団の構造をみようとする場合,(ニ)変質しつつある単位,変化しつつある社会構造をみる場合。(イ)以外は,社会集団から母集団を抽出する過程に生ずる問題である。

 標本調査の本質は,上記のように社会集団の単位を空間上の点に,また標識の値を確率変数の値として翻訳することで成り立つ一連の数学的論理である。したがって,その社会集団への適用は,社会集団それ自体と異質なものに立脚する数学的手続きをいかに近似的に利用するかという問題である。換言すれば,標本調査は非標本誤差が考えられない,あるいは非標本誤差を非常に少なくしうる技術的手段が存在する調査対象に関して,調査目的にも合致する層別を行い,少数の標識に関する母平均などを確定しようとするときに,有効となる。筆者によれば,標本調査の本質的メリットに対してなされた批判は,近似的に社会集団に適用する際の「摩擦」であり,統計的推論の枠組みのなかでは回答が用意されている範囲のものである。しかし,社会集団の構造変化の把握に関しては,近似的利用という見地からみて,標本調査の適用は難しい。その本質的メリットを保証する条件がないからである。しかも社会科学的研究における統計利用は,そのほとんどがこの構造的変化の把握が目的なのである。

 筆者は以上の指摘を,農林省農家経済調査で確認する。最初に,この統計調査の歴史を1961年まで,農家抽出の相違によって8期に区分している。「第1期:帝国農会農家経済調査(1913-1915)」「第2期:農林省農家経済調査(1921-1923)」「第3期:同(1924-1930)」「第4期:同(1931-1941)」「第5期:帝国農会経済調査(1942-1948)」。ここまでは調査方法は,有意選定であった。行論との関係で重要なのは,これ以降の調査である。戦後は,農家選定にみられた従来認識されていた偏倚を是正するため,層別二段抽出が導入された。すなわち「第6期:農林省農家経済調査(1949-1957)」「第7期:同(1957-1961)」。「第8期:同(1962- )」は,農業基本法による年次報告資料作成のため調査拡大がはかられ,抽出方法が前期(第7期)と変わった。第7期で第一次抽出単位は集落であったのが,第8期では数集落が併合された集団集落になっただけでなく,第一段で抽出された集団集落に従来の標本集落が含まれている場合には第二段抽出をランダムサンプリングで行うのをやめ従来の農家でもって第二次抽出単位の標本とされた。農家経済の動向の構造把握という観点から,また調査の継続性確保のためである。

 農家経済調査の目的は,農業の再生産構造の解明,全国平均の農業所得,家計費の推定である。この目的のために,農家経済調査は,戦後,層別二段抽出を採用したが,筆者によれば次のような事情から,ランダムサンプリングの条件を失っているという。(イ)不完全な母集団リスト,(ロ)抽出農家による調査拒否,(ハ)業務量配分に規制された標本配分の調整,(ニ)農家記帳の不正確。

これらとは別に,標本調査の本質的メリットがどのように実現しているかを点検すると,農家経済調査の上記の目的の後者についてみれば一応有効といえるが,前者に関しては無力であったと判断されている。第8期の調査では,後者の目的を実現するために,正確な推定を期してランダムサンプリングを徹底化させ,調査農家を約2.2倍に増やしたが(12,300戸),農家経済の動向の構造把握という目的が同一農家の継続調査を要求するので,上記のように,農家選定の方法が基本的に従来の農家に協力継続を依頼し,追加分のみランダムに抽出するという代物になってしまった。

「ここに,農家経済調査は1949年以来のランダムサンプリングによる農家選定の原則を意識的に放棄した(。)・・・構造的変化を標本調査で把握しようとする矛盾が具体的にあらわれたとみるべきである」というのが筆者の結論である(p.82)。

内海庫一郎「ランダム・サンプリングに関する疑問」『北海道経済』第157号,1959年9月

2016-10-06 10:47:38 | 3.統計調査論
内海庫一郎「ランダム・サンプリングに関する疑問」『北海道経済』第157号,1959年9月(『社会統計学の基本問題』北海道大学図書刊行会,1973年,所収)

 ランダム・サンプリング(任意抽出標本調査法)に対する筆者の批判的論点を開陳したもの。構成は次のとおり。「1.サンプリングとランダム・サンプリングの区別」「2.ランダム・サンプリングの限界」「3.ランダム・サンプリングと統計誤差」。

最初に強調されているのは,「標本調査法」一般と「任意抽出による標本調査法」とを明確に区別しなければならないということである。標本調査とは一部調査のことであり,この形態の調査は類似統計法とか大量観察代用法のひとつであり,従来,その問題点が研究されてきた。それによると,一部調査=標本調査では,調査対象の数量的規定を全面的に反映する統計値の一体(大量の大いさ=統計欄の数字[例えば人口総数]と部分大量の大いさ=各欄の数字[例えば男女別の人口,年齢別の人口])は得られず,そのうちのどれか一つの数字の近似値,または数字と数字の関係を示す数字,ないしはその平均数字の近似値だけが得られるにすぎない,というようなことである。

 その一部標本の抜き出し方には次のような種々の方法がある。(1)調査するに一番便利なものを選ぶ。(2)調査に一番協力的な人を選ぶ。(3)その事柄に一番精通していると思われるものを選ぶ。(4)本当のことをよく話してくれる人を選ぶ。(5)どんな調査単位が典型的であるかの条件を決めてそれに従って選ぶ。(6)いわゆるコントロールを決めておいて,そのある標識の平均値が母集団と標本とで一致するように選ぶ(これが「有意抽出法」である)。(7)任意抽出調査法。

 筆者はここで注意しておかなければならない点を2つ挙げている。第一に,一般に「有意抽出」というとランダム・サンプリング以外の全部の標本抽出法を指しているかのような誤解があるが,ネイマンによって問題にされている「有意抽出の標本調査法」とは(6)のような特殊な数学的標本決定法で,それ以外の標本調査はここでは議論されていない。第二に,この場合に問題になっているのはすべて,どんな標本をどれだけの数だけ選ぶかであり,それ以外の調査過程の全手続きの指導理論が問題になっているわけではない。

 標本調査によっては,「大量の大いさ」「部分大量の大いさ」といった基本的数字は得られない。標本調査一般の決定的な欠点である。しかし,長所もあり,津村善郎によれば,全数調査に対する標本調査の利点は,①費用が少なくて済む,②結果を早く出せる,③より突っ込んだより正確な統計を出せる,である(筆者はこれらのうち③の点は意味が曖昧という)。

 筆者は関連して推計学ないし推測統計学によってもちあげられるウルトラ母集団について触れ,また任意抽出調査法について考えようとすると常に「群盲像を評す」という仏教の経典に出てくる寓話を想起すると述べている。さらに,対象が一つの集団として客観的に存在するかぎり,その対象をそのまま測定する方法は全数調査しかないことを主張している。換言すれば対象の性質から必然的に成立する唯一の可能な調査方法が全数調査である。標本調査は,全数調査と事例調査の中間形態として位置づけるべきである。

 任意抽出標本調査の任意抽出性が他の標本調査に比べ特に優秀であると主張される場合に,その根拠として挙げられるのは,この方式をとると統計の誤差がコントロールできるとされる点である。この点についての筆者による第一の指摘は,ここで言われる誤差は統計の信頼性,正確性とは全く無関係であること,任意抽出標本調査による抽出誤差のコントロールは後者の統計本来の誤差に対しては無力であること,である。誤差を標本誤差と非標本誤差とに分類すること自体が転倒である。もともと統計の誤差の本体は非標本誤差であり,それを「代用法」である標本調査法をとれば本来の統計の誤差の上に新たな誤差がつけたされると考えるべきである。

 第二の指摘は,標本誤差を管理するというのはその標本に関することではなく,諸標本の平均の平均-分散に関して,である。つまり当該の理論は統計の対象との関係における誤差,精度を全く問題にしていない。第三の指摘は,いうところの誤差をゼロにしようと思えば全数調査をすればよいことになるというものである。第四の指摘は,抽出された標本が典型的な標本が抜きだされようが例外中の例外である標本が抜きだされようが,いわゆる標本誤差の値(範囲)は全く変わらず,同じであることに注意すべきである。ひとつの標本平均の性格を詳しく具体的に検討する途は初めから閉鎖されている。最後に階層(ストラータム)の性格について流布されている誤解を解き明かしている。サンプル理論で階層分けを行うのは,平均の精度を高めるためで,各階層のそれぞれの代表値をもとめるためではない。

船木勝也「標本調査技術論の立場から」『経済論究』第2号,1957年9月

2016-10-06 10:46:20 | 3.統計調査論
船木勝也「標本調査技術論の立場から」『経済論究』第2号,1957年9月

 本稿の課題は,(1)戦後,日本の統計学界に流入した標本調査論の担い手であったW.E.デミング,F.F.ステファン,増山元三郎,北川敏男ら推計理論派の見解を批判しつつ,(2)その後の技術派といわれた津村善郎の見解を紹介し,さらに(3)技術派批判を行った森下二次也,広田純の見解に疑義を示すこと,そして(4)標本調査そのものに対する批判,である。筆者が若いころに執筆した論稿で,全体に粗削りな部分が目立つものの,主張したかったことは明確に伝わってくる。

 まず推計理論派の主張の問題点が指摘されている。この派と後の技術派との見解の相違は,確率の場をどこにもとめるかである。前者の解釈では,確率の場は母集団そのものにもとめられる。社会経済的集団の一断面を示す母集団は,その構成因子の確率論的組み合わせによって決定されたもので,時系列をとったこの母集団は確率論的過程を示す。したがって,一時点における標本はそのような超母集団から抜き取られたもので,このような標本を時間的に多数得ることでこの過程を貫く「法則」を把握できる。以上がデミング,ステファンの,そしてこの見解をそのまま受容した増山,北川の見解である。

 これに対し,筆者は(それは技術派の主張でもあるが)確率の場は標本の抽出手続きに,すなわち抽出単位を抜きだす際に人為的に与えられるとする。この考え方を明確に示したのは津村である。また大屋祐雪は,現実に推計学的方法の適用として行われている標本調査を分析し,その実施手続きを理論にまで高め,国勢調査における標本集計の論理を標本調査法の理論構造と規定した。同じ見解にたつ筆者によれば,推計派の見解は厳密性を欠いている。なぜなら,彼らの見解には,数学的な理論が具体的な標本調査のプロセスに普遍的に妥当することの論証がないからである。いくつかの事例にあてはめて,その正しさを主張しているにすぎないからである。

 この技術派の見解に疑義を呈したのは,森下,広田である。筆者は森下の議論,すなわち技術派がいう標本調査の論理は応用数学であり,調査の理論になっていないと主張した。この森下見解に対し,筆者が示す反論は次のとおりである。

 (1)応用数学で数理的展開として許された仮想的母集団の設定は,社会調査では認められない。両者を媒介するのは,調査対象リストの作成である。
 (2)社会調査では社会経済的集団それ自体が確率論的性質を有しているとは考えにくく,確率の場は抽出単位を行うその手続きにもとめられる。
 (3)この調査技術の性格は,アメリカで発展した「実際的サンプリング理論」に典型的にあらわれている。1940年のセンサス附帯標本調査は,資本主義経済体制のもとでの調査に不可避的に付随する制約や困難を回避する調査として試みられたものである。調査員に与える指示,調査組織の構成,標本集計の問題など,技術派の主張のよりどころとなった論点は,この時に形成された。

 筆者は,この他,森下の「標本調査は技術であるという『公理』から標本調査と全数調査との優劣は技術的なものであって,原則的なものではない,という『系』がみちびきだされる。しかしある手法が調査の技術たりうるか,その技術が他のものにくらべて優れているか,などの問題は対象の性質から原則的に答えられるべきものである」という見解,また広田の「統計調査の基本が悉皆調査であるというのは,社会認識の手段としての,統計の基本的な性格にかかわる問題であって,原則的なものである」という見解に,疑義を呈している。要するに現実を直視せず,抽象的,一般的な議論を振り回しているというのである。佐藤も同じである。他にも筆者は森下が逐条的に掲げたいくつかの設問にもひとつひとつ反論している。

 「むすび」として,次の2点を示している。すなわち,技術派の立場からみて,標本調査の理論構造に関して問題となる点は何もないが,問題があるとすれば,(1)標本調査に限らず,現行統計調査の全部に言えることであるが,その範疇規定(例えば就業者の定義)が形式的で,正しい経済的概念にもとづいていない,(2)標本調査することが不可能または必要がない所にまで,標本調査が実施されていることである,という。

佐藤博「典型調査の意義について」『経済学研究』第13号,1957年

2016-10-06 10:46:10 | 3.統計調査論
佐藤博「典型調査の意義について」『経済学研究』(北海道大学)第13号,1957年

戦後,標本調査論(任意標本抽出調査法)がはなやかだった頃,むしろ典型調査にこそ社会学的統計調査の意義があることを主張した論稿。本論稿のなかで,当時,標本調査の推奨者だった津村善郎が典型調査を質的調査であるとして,統計調査から除外する考え方をもっていたことが紹介され,筆者がこの見解に批判をくわえている。

本稿の課題は,典型調査の技術的細目を論じるのではなく,社会科学における典型認識の意義を明らかにし,次に調査論における典型調査の役割を規定し,さらに典型調査と統計調査の関連を明らかにすることである。全体をとおして,統計学における典型調査の意義が明らかにされる。

 典型とは,社会現象の本質,必然性を担うものである。複雑な社会現象のなかから本質的なものを取り出すには,分析的抽象的方法が必要となる。分析的抽象的方法によって,歴史的具体的存在から偶然的攪乱的要因を取り除いたものが「論理的なもの」である。くわえて,認識のプロセスはその進行において,法則性のもとでたえずその内容が修正される。したがって,典型は「論理的なもの」であるとともに「歴史的なもの」であり,その認識は両者を統一的に把握することで可能になる。

 このような典型は,それを反映する歴史的資料,およびそのひとつの形態である統計資料から得られる。しかし,統計資料はそのままで典型となるのではない。社会科学の理論によって,批判的に選別された歴史的資料,批判的に加工された統計資料だけが,典型の獲得のために役立つ。何が典型であるかの認識に到達するには,「仮説」が役立つ。「仮説」によって得られた典型を,理論的分析により歴史的経過の映像に合致した法則として得ることによって,「仮説」は証明されたものになる。典型認識はこのように,理論の獲得(実践的要請にもとづく研究の成果)とその検証のために大きな意義をもつ。

 調査とは一般に,現象の客観的把握のためにある。したがって,調査には目的が前提となる。調査目的が決まれば,調査対象も見当がつく。調査の対象は,調査担当者の社会科学上の知識と経験とによって規定される。次に調査方法が問題となる。調査方法には,量的調査法と質的調査法とがある。社会現象の数量的側面を客観的に把握することを目的とした調査方法には,対象を集団(大量)たる存在として統計調査方法が利用されるが,それには大量観察法と大量観察代用法とがある。

 典型調査は,大量観察代用法のひとつである。大量観察代用法は,大量観察の実施が困難か不可能な場合,また必要でない場合に実施される一部調査で,そのなかのひとつの形態が典型調査である。典型調査がそのように呼ばれるのは,調査が社会科学の理論によって典型的とみなされた集団を調査するからである。典型を選択し,その一般性を保証するのは,大数法則や確率論ではなく,社会科学の理論である。したがって,典型調査の信頼性を保証するものは,理論規定が正当であるかどうかにかかっている。

 以上の観点から評価すれば,統計調査法が問題とする集団を単なる集団(歴史的具体的な社会的集団現象でも自然的集団現象でもかまわないとする)とみ,典型調査が実態調査の一種であるから統計調査法からこれを排除するとする津村の見解は,根拠薄弱である。

上杉正一郎「統計調査の社会性」『経営研究』(大阪市大商学部)第30号,1957年,(『経済学と統計[改訂新版]』青木書店,1974年,所収)

2016-10-06 10:44:41 | 3.統計調査論
上杉正一郎「統計調査の社会性」『経営研究』(大阪市大商学部)第30号,1957年,(『経済学と統計[改訂新版]』青木書店,1974年,所収)

 標本調査論に対する批判的論文。直接,批判の対象にとりあげているのは,津村善郎(農林省統計調査部)による『調査の話』(1954年),『標本調査法』(1956年)である。これらの著作は,標本調査が調査技術の一つであり,社会調査に有効であることを主張する内容のもので,当時は標本調査論の基本テキストであった。

 批判のポイントは,津村が統計調査を集団測定(実測調査)と定義し,自然現象の実測で有効とされる標本調査を社会現象の認識のためにも活用できるとした点である。津村の認識は,統計調査・集団測定は社会の調査・測定にも,自然のそれにも共通に利用可能とする。

 筆者はこの見解に対し,実測調査(実測主義がとられている調査)は,自然を測定する自然科学的方法であることがまず確認される。そのうえで,同じ自然現象の測定といっても,牛乳,米,麦,大豆,鉱石の諸商品の検査もあれば,地理に限定を受ける資源調査もある。両者には調査方法に相違がある。前者では総量を知ることは問題にならないが,後者では総量はもとよりその地理的分布,対象となる自然の所有,占有関係が問題になる。実測調査にはこの他に,農産物作付面積および収量調査,茶の生産量,養蚕の収繭量,結核患者数などの統計調査があり,これらは固有の性格をもつ。すなわち,これらの対象は土地,労働生産物,医療という社会経済的要因をともなうが,そこでは社会的要因そのものが対象なのではなく,それと結びついた自然的側面が測定される。医療統計は社会科学に属するが,そうした規定は出生,疾病,死亡の現象が社会関係から切り離されずにとらえる限りでのことである。

 実測と調査は,異なるものとして理解されなければならない。それはデータを獲得する手段の相違(実測器具と調査票),また実測による誤差(測定誤差)と調査における誤差(回答誤差)の性質の差にあらわれる。

 津村調査論には,以上のような認識が不足している。津村は自然認識の方法である実測法と社会認識の方法である調査との原理的内容的相違を区別することなく,それらの形式的同一性を重視する。それらがいずれも集団測定であり,そのかぎりで統計調査であるとする。津村はこの理解の延長で標本調査を自然現象の測定にも,社会現象の調査にも適用可能とするのであるが,この場合,自然現象,社会現象そのものが対象になるのではなく,母集団概念が媒介となる。すなわち,統計調査の対象はある定義にしたがった農家の集団であったり,米粒の集まりであったりするが,標本調査の立場からは両者は母集団と想定できるとする。現実の母集団を簡略化するこの手続きを「母集団概念の簡略化」という。だがこのような「母集団概念の簡略化」という抽象は,はたして対象である社会集団の分析に役立つのだろうか,それによって対象の特質が捨象されることにならないのか,この点の議論こそが重要であるが,標本調査論はそれを問うことなく構成されたいわば方法先行の主観的議論である。

 筆者は津村調査論の問題点を以上のように指摘した後,そこでたちどまって津村による推計学批判の吟味に入る。その内容は,津村が「実際の標本調査」を強く意識し,理論分布では無限母集団が想定されるが,標本調査の実際では母集団がこれと異なるので,実験計画に関する全ての議論がそのまま標本調査に適用可能とするのは,誤りであるとしたことの検討である。津村によれば,標本調査は調査技術の一つであり,それ以外の標本調査(推計学的標本調査)を考えることはできないという。なぜなら推計学でいう数学的論理は,社会調査にそのまま適用できず,数学の論理をおしとおすと逆に統計調査における社会認識が制約を受けるからである。津村はそこに「厄介な問題」をみる。「厄介な問題」とは統計調査における社会性であり,具体的には母集団リスト作成段階での調査対象の拾い出しの困難性,面積調査及び収量調査における所有関係の存在,作付面積および収量調査での農民からの過小申告の可能性であった。

 筆者はこの後,津村が「厄介な問題」をクリアするためにあげている措置,すなわち作物生産高統計での標本実測調査,調査結果の「平板さ」を免れるために導入された分類(階層分け)と「平板さ」の他の一面である調査項目の少数制約を回避するために考案されたサンプル・センサスを逐一検討し,それらの問題点を摘出している。
 標本実測調査は被調査者の申告に信頼がおけないという状況下で,政府が「供出制度の資料とするに足る結果」を得るために編み出した方法である。津村は標本実測調査の実施によって,調査結果が正確になったと誇ったが,筆者によれば,それは実測によったがゆえの結果であり,任意抽出法が適用されたからではない。また標本実測調査による作物統計の正確さは,生産高に限定された「平板」なものであった。

その後,供出制度の役割が縮小し,土地および収穫物の実測を主な内容とする標本実測調査から本来の社会調査へとウェイトが移行するとともに,調査に分類(階層分け)を取り入れた標本調査が考案された。社会構造の重層的分析のための措置である。しかし,ここでも標本調査の数学的条件と実際の統計調査における社会科学的条件とは,矛盾する。この矛盾を避けるには,層別をあまり細かくしないことにするか,あるいは標本数を増やすかである。しかし,統計調査の実施に先立って,社会集団をあらかじめきめ細かく分類することは,それが絶えず歴史的に変動していることを考慮するだけでもわかるように不可能である。層別集計はその制約を取り払う目的で考えられたが,それによって分類が細かければ精度は保証されない。

 標本数を増やすというもう一つの抜け道として考えられたのは,サンプル・センサスであった。サンプル・センサスでは,サンプルの数が桁違いに大きくなる(たとえば昭和30年臨時農業基本調査では標本数約120万戸)。調査をこの方法にたよる場合,それは全数調査を基礎として実施される(農地統計調査抽出調査,世界農業センサス抽出調査,農業動態調査など)。全数調査がリスト作成のもととなる。また,サンプル・センサスは全数調査の代用という性格をもつ。さらに,サンプル・センサスは全数調査より非標本誤差が小さいと強調されるたりするが,一般的には必ずしもそうは言えない(リストの不完全,無回答による誤差)。
調査対象の社会性が問題であればあるほど,標本調査の適用に制約条件が加わる。そして標本調査はこの制約に対応する過程で,その数学的条件を後景におしやり,実際に則し対象の社会性に適合しようとした。サンプル・センサスは,標本調査の数学的条件と対象の社会性との妥協の一形態として,社会認識上一定の役割を果たしているが,難点を完全に払しょくしたわけではない(p.73)。これが筆者の結論である。