goo blog サービス終了のお知らせ 

社会統計学の伝統とその継承

社会統計学の論文の要約を掲載します。

吉田忠「(第11章)農業統計を利用する基本」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

2016-10-09 14:32:13 | 6.社会経済統計の対象・方法・課題
吉田忠「(第11章)農業統計を利用する基本」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

 記述統計の基礎的で主要概念である算術平均(代表値)の社会科学分野における位置づけと,この概念を分岐点とした2つのその利用方向について解説した論稿。

構成は次のとおり。「1.「中」と「代表値」「2.算術平均-代表としての「真中」①団体・集団を代表する構成要素,②数値の集合を「真中の値」で代表させる-算術平均」「3.算術平均の性質-「帰らざる河」か「戻りうる河」-;①算術平均は唯一無二の「真中」ではない,②算術平均と分散,③分岐点にたつ算術平均」「4.算術平均の使い方(1)-社会科学的実証分析へ-;①専兼業別農家を算術平均から見る,②専業農家は等質か-分類してから算術平均を見る-」「5.算術平均の使い方(2)-確率モデルと数理的利用-;①統計的規則性-その主要形態,②確率変数の平均と分散-確率モデルの導入-,③最良の推定量としての標本平均-「帰らざる河」への舟出-」

 社会には諸団体や諸集団があり,それぞれを代表するものがある。法人や団体の形をとる実在的存在がひとつ考えられるが,他に社会的集団をある構成要素で形式的に代表させる場合がある。筆者はこの代表者を定める4つの基準をあげている。第一はマックス基準(最大,最高,最強など),第二はベスト基準(条件付きの最良),第三はモースト基準(最多を占めるもの),第四はミッド基準(中位のもの)である。統計学で使われる平均ないし算術平均は,このうちのミッド基準を基礎に,その数学的精緻化をはかったものである。

 ミッド基準で代表を考えるときには,個性的要素からなる集団のなかの数値集団が前提となる。その位置づけの仕方を考慮すると,ミッド基準は「中ごろ」「中位」といった曖昧な表現ではすまず,「真中の数値」で代表させなければならない。しかし,「真中」といってもメジアンもあればモードもある。またある「真中」に関し,それを上回る分と下回る分とが相殺されるようにそれを決める方法もある。確認しておきたいのは,各数値の偏差和をゼロとする値が各数値の和を総度数で割った値,すなわち算術平均と一致することである。

 統計資料は社会的集団現象のある側面に関する数量的全体像を与えるだけでなく,形式論理的に厳密な比較や推論を可能にする数量的表現をもつ。また,統計資料が数値の集合の形をとっていることは,統計調査の前提である社会的集団現象や社会構造概念を棚上げし,数値の集合そのものへの算術的演算の導入,さらにはより高度な演算を可能にする。

 算術平均は,上記のように,数値の集合に関して「偏差和をゼロとする値」という数理的形式的約束事のもとに成立する概念である。ところがこの算術平均が唯一無二の指標に受けとられることがしばしばある。しかし,それは誤りである。筆者はその例証として幾何平均でなければ成立しない場合をあげ,このことを裏付けている。算術平均が普及しているのは,それが幾何学や力学上の重心と結びついているからであり,また数値の集合のバラツキを示す指標(分散や標準偏差)と関係づけることができるからである。

 筆者はここから算術平均を手掛かり(分岐点)に,数値の集合からその母胎である統計資料に,さらにその背後にある社会的集団現象へ遡っていくことができるとし,その方向を構想する。対極で,数理統計学の世界では,算術平均は確率モデル導入の前提としておかれ,その数理的利用がはかられている(「帰らざる河」)。

 筆者は前者の方向を農家・農業経営の諸特徴を示す数値の算術平均,とくに専兼業別のそれからスタートさせる。示されている統計資料は,「専兼業別に見た農家の諸特徴(1980年)」で専業農家,第一種兼業農家,第二種兼業農家,男子生産年齢人口有無別専業農家について,経営耕地面積,借入耕地面積,農業専従者数,農産物販売金額の算術平均を一覧した表である。筆者はその中に合点がいかない数値がある,と述べている。それは第一種兼業農家の経営耕地面積が専業農家のそれより広いことである。このような数値の矛盾にぶつかったときには,表示単位の定義,表示事項とその分類基準,さらに調査単位や調査事項を見直さなければならない。

筆者がここで強調するのは,算術平均の組み合わせで農家のような,構造をもつものの集団を代表させるさい重要な前提があり,それは集団が均質な要素からなっていること,かつ変異を示す特徴に関してできるだけ中位に集中していること,である。前掲の表の例で言うと,専業農家には男子生産年齢人口がいる世帯といない世帯,すなわち高齢専業農家(一部母子世帯を含む)とがある。専業農家のなかのこの区分は,この種の実証分析で不可欠である。事実,経営耕地面積の算術平均はこの高齢者専業農家を考慮して見直すと,男子生産年齢人口がいる専業農家,第一種兼業農家,第二種兼業農家,高齢専業農家の順に広大きく,納得のいく資料になる。1980年からの専業農家数を第一種兼業農家数が上回ったという逆転現象は,この高齢者専業農家数の増加によるものである。関連して筆者は高齢者専業農家をめぐる顕著な事実として,その地域分布に偏りがあること(西日本で比較的高い),離農の温床としてこの高齢者専業農家があることを指摘している。

 算術平均のもうひとつの使い方は,その数理的利用である。単一あるいは複数の統計資料の数値を配列するとそこに形式的秩序があらわれ,それは統計的規則性と呼ばれる。統計的規則性の現れ方の主要形態として,度数分布の形態にあらわれるもの,時系列や場所的系列(地理的系列)にあらわれるものとがある。

算術平均は,中位集中型の統計的規則性を前提としている。数値の集合が算術平均によって代表される根拠は,偏差和ゼロというミッド基準で説明できるが,その集合では算術平均こそが本来の数値であることになる。このことを示すために,筆者は誤差理論の説明から入り,測定値の集合の各数値と偶然誤差の和とみなすことが確率モデル導入の契機となるとが,測定値とみなせない場合にはこれを確率モデルの仮定的擬制と呼ぶとし,こうした場合に算術平均をもとめることがその真値を知る最良の手続きであることが数学的に証明できると述べている。

証明のために必要とされるのは,離散的確率変数の確率分布,平均,分散についての知識であるが,それはわかっているとして,筆者は「一個の歪んだサイコロを5回投げた結果をもとに,この確率分布の平均をもっともありうるべきものとして推定する」という問いを,いる。推定の基準は,標本に関する線形の関数型で,かつ不偏であるもののうち最良のものになるが,この基準を充たす関数型は最良線形不偏推定量(BLUE)と呼ばれる。上記の問いに対する解答は,「標本に関するBLUEがその算術平均」であるということになる。

数値の集合にみられる統計的規則性を拡大解釈して確率モデルを擬制し,そこに想定された母集団の平均を,最良を意味する最良線形不偏推定量という基準で推定しようとすると,算術平均がまさにそれにあたる。この場合の算術平均は,偏差和ゼロを「真中」とするミッド基準から一歩進んで,最良線形不偏推定量という基準に関するかぎり,算術平均が唯一無二のものである,と解釈される。しかし,人はこのように踏み出された数理統計学的論証の道から社会的事実の論理や社会諸科学の理論を導きの糸として実証分析の道に戻ることは不可能である。数理解析の道が「帰らざる河」(オットー・プレミンジャー監督,ロバート・ミッチャム・マリリン・モンロー主演,1954年)である所以である。(p.280)


吉田忠「(第10章)統計資料の長所と短所-農業統計を利用する前に-」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

2016-10-09 14:29:32 | 6.社会経済統計の対象・方法・課題
吉田忠「(第10章)統計資料の長所と短所-農業統計を利用する前に-」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

 筆者は本稿で,農業統計の真実性(信頼性,正確性)について論じている。農業統計を実際に利用するに際し,どうしても押さえておかなければならない統計資料の長所と短所に関して,である。構成は次のとおり。「1.統計資料のメリットを見る」「2.統計資料の誤差とは何か:①「農業統計が間違っている-農家戸数統計をめぐる論争-,②農家戸数統計は連続か-農家戸数の把握率-,③農業構造と農家戸数統計-農家戸数統計のとらえ方-」「3.統計資料の誤差を分析する:①統計調査の過程と統計資料の信頼性・正確性,②統計調査の二面性と統計資料の信頼性・正確性」「4.標本統計資料の誤差を見る:①標本誤差とは何か,②標本統計資料の信頼性と正確性」。

 最初に統計資料の優れた点の説明がある。統計資料は,個別社会科学の概念である社会構造や方法論的に構成された統計集団および統計調査集団をもとに,社会的集団現象を全体的に数量的にとらえたものである。メリットの第一は,各種の社会的集団現象に関して数量的全体像を与えてくれることである。また標識,分類を組み合わせて構成を立体的に浮かび上がらせる。第二は統計資料が統計図表という数量的表現をとっているので,その数値の比較で厳密な推論が可能となる。関連して統計資料利用のひとつに統計的規則性の把握があるが,得てしてそれが拡大解釈され,精緻で複雑な数式的表現をとったものだけを統計的規則性と見做す誤った立場があり,筆者はこれに釘をさしている。

 統計資料は,セカンドハンドの社会的事実資料である。統計資料と社会的集団現象との間には溝がある。一般に統計の誤差と言われるものがこれである。ひとことで誤差といっても,その内容はさまざまである。この誤差をめぐる説明のために,筆者は経営規模拡大による農業近代化の対極で進む農家数の減少の統計的検証をめぐって展開された論争を紹介している。この論争は具体的には,1960年の世界農林業センサスで農家減少率が以外にも低かった(1950-55年で2.2%だったのが,55-60年で0.3%であった)ことの評価に関して,畑井義隆が農林省統計の農家戸数統計が不正確,としたことに対する農林省統計課(当時)の関英二の反論である。また論争は別にあり,畑井は農林省統計調査部(当時)の農家戸数統計の調査戸数について,1951年と52年,57年と60年に逆転がみられるが,これが農家戸数統計の誤差によるとしたのに対し,農林省サイドから津村善郎によってなされた反論である。筆者は論争の主要論点を紹介しながら,これらの論争に対して積極的判断を行える根拠がないと言明している。しかし,米供出制度の変更が農林省の農家戸数統計における農家把握率に大きな影響を及ぼしたこと,およびその影響の方向に関し,調査をする側からみるか,される側から見るかで正反対の見解があらわれた事実は重要であるとして,この点に注意を喚起している。

論争から学ぶべきこととして,(1)問題(ここでは日本農業のあり方と方向づけ)を捉える立場や姿勢からあらわれる種々の農業構造のとらえ方が農業統計利用の重要な前提となること,(2)農業構造のとらえ方,農家の定義にはじまる統計調査集団の構成のズレに対する慎重な考慮が農業統計利用の重要な前提になる,ことが列挙されている。この指摘を行って,筆者は統計の正確性,信頼性の検討に移る。

蜷川虎三によって整理された統計の正確性,信頼性に関しては,周知のことなので,ここで詳しく立ち入ることはしない。ただ,筆者はこれら両概念を次のようにまとめているので引用しておく。「統計の信頼性は,統計資料が示そうとしている社会的諸現象と,調査主体が統計調査の対象として規定したもの=統計調査集団のくいちがいの問題であり,統計の正確性は,調査主体が統計調査の対象として規定した統計調査集団と実際に調査によって把握された統計資料とのくいちがいの問題である。・・・統計資料における広義の誤差の問題を,その部品(統計調査のこと-引用者)が装置(認識過程-引用者)のなかに正しく位置づけられているかという問題と,部品そのものが正しく作動しているかという問題とに分けて見ることである」と(241-2頁)。

 筆者によれば,先の2つの論争のうち畑井と津村の論争は統計の正確性をめぐるもので,畑井と関のそれは統計の信頼性をめぐるものであったと,している。いずれにしても,統計の誤差を単に統計資料そのものに含まれているものとして見るのではなく,統計調査の過程の各段階から生ずる統計の信頼性,正確性としても見なければならず,加えて統計調査がもつ歴史的社会的側面と方法的技術的側面の両側面を反映したものとして見なければならないことになる。したがって統計の真実性の問題は,次の4種に分けられる。(イ)統計調査の歴史的社会的側面に規定された統計の信頼性の問題。(ロ) 統計調査の方法的技術的側面に規定された統計の信頼性の問題。(ハ) 統計調査の歴史的社会的側面に規定された統計の正確性の問題。(ホ) 統計調査の方法的技術的側面に規定された統計の正確性の問題。

 筆者は最後に標本調査による統計資料(標本統計資料)をとりあげ,標本誤差を中心にその誤差の問題を検討している。当該問題について整理すると,まず基本的なものとして統計調査一般の真実性の問題がある。標本調査のときは,これに標本誤差が相互依存の形で加わる。それ以外にも,標本調査なるがゆえに生じる統計の真実性欠落の問題がある。したがって,標本調査は統計調査一般の過程に位置づけ,標本調査で行われる統計調査の真実性の問題として考察されなければならない。

標本誤差は統計調査における統計集団と統計調査集団との間にくい違いをもたらす一要因であるので,統計の信頼性の問題に属する。くい違いの大きさは標本を抽出する母集団リストが標本調査の統計集団から導出される調査単位を完全に網羅しているとき,かつ標本抽出が教科書通りに実施されるとき,信頼区間と信頼水準との理論的枠組みを通して確率的にとらえられる。しかし,実際にはそれが前提している条件どおりにはいかない。なぜなら,そこには,母集団リストの確保の難しさ,標本抽出を理論どおりに行うことの困難性,標本平均の分布を正規分布で近似させ,あるいは母分散を不偏分散で代理させる方法をとることによる実際の標本誤差の理論的乖離などが介在するからである。信頼水準の確保に関しても,そこに前提とされているのは統計調査としての標本誤差を同じ条件のもとで無限回繰り返すといった非現実的想定である。 

 標本調査の信頼性には他に,その歴史的社会的側面に規定されてもたらされるものがある。標本調査の社会的機能が標本調査の信頼性にもたらす影響を理解するために,筆者は複雑で込み入った聞き取り調査を迅速に繰り返し実施する農業調査や農家経済調査,あるいは世論調査とくに選挙予測調査における誤差について指摘している。また標本調査であるがゆえに実査・集計過程で生じる正確性の問題が事例をとおして説明されている(調査員問題,調査不能場合,パネル調査の場合)。さらに,統計調査としての標本調査は,何らかの社会的役割を果たす形で行われ,歴史的社会的側面をもつ。この側面からの規定を受け,実査の過程に誤差が生じたり,拡大されたりする。

 標本統計資料は以上のように独自の真実性問題をはらみ,その慎重な検討が利用の前提となる。

吉田忠「(第9章)農業・農村の実態調査はどう行われるか」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

2016-10-09 14:26:05 | 6.社会経済統計の対象・方法・課題
吉田忠「(第9章)農業・農村の実態調査はどう行われるか」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

 農業統計に関する筆者の基本認識は,(1)それが社会的集団現象としての農民層分解過程や農産物の生産・流通・消費の過程などを対象に実施された統計調査の結果であり,社会的集団現象をその数量的全体像においてとらえたものであること,(2)農業構造の経済的分析における統計資料の利用はまずその数量的全体像の把握という基礎的作業において,さらに問題をとらえその本質へ肉薄する際の方向づけで必要不可欠な役割を果たすことの2点に集約される。
しかし,実際に農業構造を把握しようとするとき,統計資料だけでは十分でない。実態調査資料との併用が必要である。農業の実態調査は明治中期から始まり,農業とその経済学的研究のなかに定着したのは昭和初期であった。

農業・農村問題の実態調査が広く行われるようなった背景として,大正中期以降の農業・農村問題がある。この問題は寄生地主制の矛盾として,小作争議の形で顕在化に始まり,昭和に入ってからの金融恐慌のもとでの自・小作農民の窮乏化として総括できる。またこうした事情を契機に,大学などの研究調査機関における農業経済研究者の主体的調査活動があった。(イ)東大の農業経済学教室によって静岡,愛知など6県で行われた農村社会生活調査(昭和3-5年),(ロ)農林経済学教室によって京都,滋賀の両県下で行われた農村社会生活調査(昭和5-8年),(ハ)宇都宮高農の磯辺俊秀によって栃木県逆川で行われた農村調査(昭和5年),(ニ)静岡県が京大農林経済学教室の協力の下に県下の5ケ村で実施させた農村計画樹立のための農村調査(昭和2-3年),(ホ)(財)協調会が埼玉県井泉村で農村自力更生計画樹立を目的に行った農村調査(昭和7年)などが有名である。

留意すべきは,これらのうち(ニ)(ホ)などは,官公庁の委託調査であり,主たる目的は農村構成樹立計画のためであった。これらの農業・農村実態調査は実態調査の本来的な姿,すなわち農産物の生産・流通・消費の過程をめぐる経済的諸関連や農家が構成する農業構造を理論的に把握する過程に位置づけるひとつの実証方法という観点に無関心で,調査方法に理論的前提を欠いていた。筆者はこれを実態調査の「歪み」と呼んでいる。この「歪み」は,第二次大戦後も続いた。

 実態調査と統計調査とは,どう違うのだろうか。筆者はそれを調査の対象と方法とで検討している。まず対象に関して,統計調査ではそれを社会的集団現象とするが,実態調査では特定の個体的存在や地域的集団現象とする。また,方法に関しては,統計調査では,確定された調査事項とその分類をもとに,集計・表示を考慮に入れつつ質問と回答肢を定め,その画一的調査票をあらかじめ確定されている調査単位に配布,回収し,それを図表の形に集計・製表する。重要なことはここで,調査単位,調査事項があらかじめ確定されているだけでなく,質問と回答肢も固定されていることである。これに対し,実態調査では統計資料の利用,記録資料・測定資料などの利用,精通者聞き取り,統計的な集団的聞きとり調査など方法は多様であり,それらが適宜組み合わされて実施される。

次に,実態調査の過程の内容で問題になることが指摘される。この過程には,「前提段階」「準備・企画段階」「実査・とりまとめの段階」がある。実態調査でも,統計調査同様,「前提段階」が重要である。実態調査でもその主体は社会的歴史的規定性を免れないが,統計調査のような公的制度的制約を受けないものが多い。くわえて実態調査の場合には,調査に先立って前提とされる社会問題が社会的集団現象にではなく,個体的現象または地域的集団現象にかかわる点で統計調査と異なる。大学のような研究調査機関に所属する者は,自らの責任で調査費を調達し,調査を企画し実施する。したがって,社会の構造と発展形態に関する理論的仮説の形成に調査主体がより積極的に関与する。

 「準備・企画段階」は,社会の構造と発展形態に関する理論仮説,調査主体における調査目的,調査主体による調査費調達などを前提に始められる。このうち理論仮説は,実態調査の内容と対象の確定を可能とする作業仮説(内容と対象の確定)に具体化される。筆者はこの理論仮説と作業仮説を峻別し,前者は収集された社会的事実の基本部分が理論的概念によって構成された社会の構造と発展形態として把握しなおされ,かつ各種の社会的事実によって検証されたものを個別社会科学の理論と呼び,事実の総合と検証,概念の構成で不十分,不完全なものを残したまま「理論」として把握されるとき,これを理論仮設と呼んでいる。これに対し,そこで不足している,あるいは不完全な部分に必要な社会的事実資料を仮説的に組み込んで再構成したものが作業仮説である。社会構造と発展形態に関する作業仮説が形成されたとき,同時に各種事実資料収集と聞き取り内容の確定,調査地・調査対象の確定,実査・とりまとめ方式の確定が可能となる。準備・企画段階でもっとも重要なのは,調査地・調査対象の選定である。

 「実査・とりまとめの段階」では,統計調査のような社会的方法論的制約は少なく,専門的調査研究者を中心にかなり自由に行われる。もっとも,公的制度的性格が薄い分だけ,調査協力体制の確立がより重要となる。

筆者は最後に統計調査と実態調査の以下の3点にわたる共通点を確認している。(イ)両者とも社会問題の発生,調査主体とその調査目的の形成などの局面で,歴史的社会的規定性のもとにあり,また個別社会科学に属する仮説的な理論(社会構造,理論的仮説)の成立を基軸とする前提段階をもつ。(ロ)両者ともこの仮説的理論を具体的な実査・集計(とりまとめ)が可能となるような作業仮説的枠組みに組み替える,ないし再構成する準備・企画段階をもつ。(ハ)両者とも,実査・集計(とりまとめ)の過程が,この作業仮説的枠組みにもとづいて進められる。

吉田忠「(第8章)標本調査はどう行われるか」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

2016-10-09 14:20:56 | 6.社会経済統計の対象・方法・課題
吉田忠「(第8章)標本調査はどう行われるか」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

戦後,流行した標本調査の意義と限界,その役割を理論的に,具体的に論じた論稿。
敗戦後,農林省は標本調査導入レースの先頭集団に属していたという。現在(本稿,執筆当時)標本調査で行われている農業統計は,(イ)農業動態調査(農業センサスの中間年で行われる),(ロ)農業生産統計(作物統計調査,家畜基本調査など),(ハ)農業経済統計(農家経済調査,米生産費調査など)。

 標本調査のメリットは,(イ)実査だけでなく集計,公表を迅速に行える,(ロ)したがって,調査を繰り返し行える,(ハ)少数を精密に調査することで誤差を少なくできる,などである。これだけのことであれば,わざわざ標本調査でなくともよい。他に理由がある。それは,標本調査が一部調査であるがゆえに生じる誤差=標本誤差の大きさを確率的に推定できるからである。多くの政府統計が標本調査にたよっているが,その明確な説明を行っているものは少ない(総務省「労働力調査」「就業構造基本調査」にはある)。筆者は本稿で農業調査における標本調査をとりあげ,標本調査のプロセスとその数理を明らかにしている。

 農業調査での標本調査は,層別二段抽出法がとられている。第一次抽出単位は,農業センサスで設定された調査区である。これらの調査区は,地域階層,経済地帯階層,調査区の性格階層により三段で階層区分される。階層分けされた各階層のそれぞれに抽出すべき標本数が割り当てられる。都道府県別の標本調査区数は,都道府県別に割り当てられた標本農家数(調査農家数)と,標準的に与えられている一調査区当り標本農家数にもとづいてもとめられる。次にこの標本調査区数がそれぞれの階層に属する農業センサス結果の農家数に比例するよう配分され,最後に階層ごとに系統抽出法によって割り当てられた数の調査区が抽出される。

第二次抽出単位は,農家である。ここでは,抽出された標本調査区に属する農家を,経営耕地規模別に3ないし4の階層(標本区分)に分け,大規模階層ほど高く定めた抽出率によって階層ごとに系統抽出法を適用して抽出する。農業調査ではさらに,サンプルローテーション(標本輪番制)がとられている。その理由は標本調査での標本設計が悉皆調査を前提とするが毎年独立に標本を抽出して標本調査を行うことは事実上不可能なので,センサス年だけ新規標本を抽出し,それを次回センサスまで継続して調査するという方式を取らざるをえないからである。

 筆者は次に標本調査論の解説に入る。標本調査は有限母集団と母集団リストからスタートする。ここに,大きさnの標本の非復元抽出を無限に繰り返すという仮定を持ち込む。抽出を繰り返すたびに,標本平均を計算する。標本の大きさがある程度大きい場合,標本平均の度数分布は正規分布に近づく。この証明は,中心極限定理(平均値 ,標準偏差 の母集団から抽出した 個の無作為標本の平均値を とした場合,抽出した標本平均 の分布は次の重要な性質をもつ。① の分布は,母集団の分布がどのようであれ正規分布に近似する。② の分布の平均値は母集団の平均値 に一致する。③ の分布の標準偏差は,母集団の標準偏差 を で除した値に近似する。④これらの性質は, が大きければ大きいほど正規分布に近似する)によるが,筆者はその証明を省略し,肉豚の体重増加の例でその中身を解説している。結論だけ述べれば,標本平均の度数分布は,それが近似する正規分布の平均と分散と一定の関係をもち,この関係にもとづいて標本平均から母平均の推定を行う。  
          
例えば実査のすんだ標本調査の結果に対し,「有限母集団の平均=母平均μは,得られた標本平均にその標準偏差の2倍をプラスマイナスした範囲のなかに入る」と95.45%の確率でいえるという判断は,ここから出てくる。
  
 一般に母分散の値は未知である。したがって,この値は抽出した標本の値から母分散の推定値で代用する。母分散に代わる推定値は,不偏分散としてもとめられるのが一般的である。標準誤差はこの不偏分散でもとめた標本平均の標準偏差である。

 筆者はさらに,層別抽出法の場合,有限母集団が層別によってそれぞれ小さなバラツキ(分散)をもつ部分母集団に分割されたとき,その標準偏差が小さくなること,各部分母集団への標本数の配分を部分母集団の大きさ(調査単位数)だけでなく,そこでの分散にも比例させると標準偏差はより小さくなること,二段抽出法の場合には,一般的にそれをとらないときよりも標準偏差が大きくなることに注意を喚起している。二段抽出の導入は理論的・本質的な要因によるのではなく,単に技術的なメリットによる。サンプルローテーションの導入に関しても事情は同じである(サンプルローテーションの導入によって標準偏差が小さくなるわけではない)。

 問題はこのような標本調査が社会的統計調査にどのように取り込まれ,位置づけられるかである。筆者は最後に,この点に触れている。結論は次のようである。(イ)統計調査として行われるときは,標本調査にも社会的集団現象に始まり統計調査集団の構成に至る準備・企画段階があり,それがきわめて重要な役割を果たしている。(ロ)この標本調査の統計調査集団の構成を特徴づけるものは,主としてその技術的メリットにかかわる標本調査の方法的条件であり,標本誤差の確率的推定というその本質的メリットにかかわる任意抽出は,実査すべき調査単位の確定をもたらすだけであること,(ハ)この母集団リストからの標本抽出は,事前の統計調査の実査・集計段階における調査区設定や照査表作成を前提としていること,すなわち,標本誤差の準備・企画段階で生じる誤差は,事前の統計調査の実査・集計段階における誤差をも包含している。(p.213)

吉田忠「(第7章)農業の統計調査はどう行われるか」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

2016-10-09 14:19:00 | 6.社会経済統計の対象・方法・課題
吉田忠「(第7章)農業の統計調査はどう行われるか」『農業統計の作成と利用(食糧・農業問題全集 20)』農山漁村文化協会,1987年

構成は次のとおり。「1.わが国最初の農業センサス:①全国農家一斉調査の歴史的前提,②全国農家一斉調査の企画と実施」「2.農業統計調査の過程:①統計調査の前段階,②統計調査の準備・企画段階,③統計調査の実査・集計段階」「3.統計調査の構造について」。
本論稿の内容は,筆者の統計調査論であるが,抽象論ではなく,農業分野における具体的統計調査にそった議論なので興味深く説得力がある。

 冒頭,日本の最初の農業センサスである全国農家一斉調査(1938年)の紹介がある。この統計調査はそれまで実施されていた農会農事統計が「時局の要請」に応える調査になっていなかったこと,調査方法が曖昧であったことなどに対する官庁内部の不満を背景に,企画されたものである。農会農事統計に対しては,官庁の外部からも批判があり,彼らはこの統計によらず独自の実態調査を開始していた。栗原百寿の研究(『日本農業の基礎構造』1942年)などがそれである。これらの不満と批判を背景に企画されたのが,全国農家一斉調査である。その意図は「農家調査要綱」に詳しいとして,筆者は[調査の時期][調査の範囲][調査の事項][調査の手続き]からなるこの「調査要綱」を紹介している。

 農業統計の作成過程は,統計調査の前提段階,統計調査の準備・企画段階,統計調査の実査・集計段階の3段階をふむ。

統計調査の前提段階では,調査主体の問題意識が問われる。筆者はこれを社会によって生み出され,その打開策がもとめられている問題(対象を理論的に把握した概念としての社会構造)への関心と表現している。全国農家一斉調査が構想された時点では,これは次のようなものであった。すなわち,農業生産を個々の農家によって担われる社会的生産力としてとらえ,その農家が土地所有関係や労働力利用関係を通して農業構造を形づくる,そしてその農業構造は階級構成や地域類型をもってあらわれている,という認識である。もっともこの社会的諸現象の理論的把握としての社会構造には種々のもの(それぞれの社会構造概念には対象を正しく理論的に反映した部分,誤ってとらえた部分,未解明のまま暫定的に組み込まれた部分がある)がある。同時に社会構造概念を基礎とした社会集団現象のより正確な実証がもとめられる。

 次いで本来の統計調査過程である。その前段の統計調査の準備・企画段階には,統計集団を方法的に構成する過程(統計集団の4要素の確定)と統計調査の実査・集計が実際に行えるような技術的規定を具体的に与え,統計調査集団に組み替える過程とがある。単位の確定,標識の選択・確定に際して主導的な役割を果たすのは,調査主体の調査目的,社会構造概念である。調査集団の構成は,統計調査実施のための前提的手続きである。その実施のためには実際に調査を可能にするように統計集団を組み替えなければならない。この具体的に構成された集団が,統計調査集団である。

 関連して筆者は,統計調査集団の4要素の構成という観点から,これを統計集団(単位,標識,時間,場所)の4要素との対比で解説している。[単位]では,統計集団を構成する単位と統計調査集団を構成する単位とが異なるケース(国勢調査),単位の確定と表示形式の確定との関連などが論じている。[標識]では,これを調査票に反映する場合の問題点,質問項目とその回答肢と統計表における表示項目とその階層区分の確定との関連が説明されている。[時間]では,調査スケジュールが主要因となる。[場所]では,統計集団の規定要因との関連では属地主義と属人主義のどちらをとるか,領土係争と地理的範囲の確定の問題が,統計調査集団のそれとの関連では調査区の設定,表示のための地域区分について解説されている。
この段階では他に,統計調査集団の構成と並行して進められる調査票の設計および実査・集計方式と表示方式の確定の問題がある。実査・集計方式の確定は,(イ)実査組織,(ロ)配布・回収方式,(ハ)記入方式,(ニ)集計組織と集計方式の確定などからなる。上掲の全国農家一斉調査の「農家調査要綱」は,この準備・企画段階での統計調査集団および実査・集計方式と表示形式の

概略を文章表現したもので,農家調査に必要な単なる約束事ではない。
準備・企画段階に続くのは,統計調査の実査・集計段階である。この過程は調査票の印刷に始まり,実査・集計組織の確立,準備的実際で終わる。実査・集計組織の確立の内容の大部分は調査区設定と調査員配属が,準備的実査のそれは照査票の作成と改訂である。統計調査の実査・集計段階におけるこれらの過程の意義と役割は非常に大きいとのことである(ここをおろそかにすると重大な誤差が生まれる危険性が高い)。調査区設定,調査員配属,照査票作成が順調に進めば,続く過程もスムースに運びやすい。

 最後に筆者は,統計調査の構造の解明が蜷川虎三によって理論的に構築されたと述べ,それにしたがって上記の調査過程の説明をおこなったことを明かしている。しかし,疑問も呈している。それは蜷川統計学がなぜ統計調査の準備・企画段階を理論的過程,実査・集計段階を技術的過程としたのか,という点である。大量の4要素と大量観察の4要素とを与える過程は,大量に固定化形式化の手続きをくわえ,それを調査可能なものにすることで,この意味では大量観察の理論的過程も技術的手続きである。筆者は大量観察の理論的過程に歴史的社会的側面(「理論的」性格)と方法的技術的側面(「技術的」性格)とがあり,大量観察の技術的過程も両面をもつ,と指摘している。統計調査は理論的過程と技術的過程,および歴史的社会的側面と方法的技術的側面という,部分的には相互浸透を示しながら基本的には対立関係にある四極構造をもつ,としている。