社会統計学の伝統とその継承

社会統計学の論文の要約を掲載します。

長屋政勝「K.ピアソンと記述統計学­有意性検定前史­」高崎禎夫・長屋政勝編『統計的方法の生成と展開(経済学と数理統計学Ⅰ)』産業統計研究社, 1982年3月

2016-10-17 15:36:50 | 4-3.統計学史(英米派)
長屋政勝「K.ピアソンと記述統計学­有意性検定前史­」高崎禎夫・長屋政勝編『統計的方法の生成と展開(経済学と数理統計学Ⅰ)』産業統計研究社, 1982年3月

 本稿の課題を筆者は, 次のように述べている。まずピアソン(1857‐1936)の記述統計学の性格をつきとめること, この記述の中からどのように推測と呼ばれる統計的解析法が生まれてきたのか, さらにピアソンのアイデアは統計的推論(とりわけ郵政検定)とどのような関係にあるのか, ピアソンはそのために何を用意したのかを検討することである。端的に言えば, 統計による記述がいかにして有意性検定へ推移していったかの究明である。副題「有意性検定前史」の含意は, ピアソンの統計方法論に現れた数理的思考を考察し, そのことでピアソン段階の統計学とスチューデント, フィッシャー段階のそれとの相違を明らかにすることである。

 この課題に筆者はどのように接近し, 回答を与えているのだろうか。本稿は中身が濃く, 情報量も多いが, 学んだことを要約すると以下のようになる。

 筆者は本論を, 19世紀の90年代にピアソンが統計学研究に入った動機の説明から説きおこしている。それによると, ピアソンを統計学研究に駆り立てた動機は, 彼がゴールトンによる遺伝子の実証的研究に自然を忠実に記述する概念と手法を見出したこと, そしてダーウィン進化論を信奉するウェルドンの生物進化の研究であった。とくに後者の契機が, ピアソンが統計学者としてのスタートにとって大きかったようである。

 ピアソンにあっては, 統計学の目的は資料の記述(資料をできる限り簡潔な記号や公式, 関数で表現し, 要約すること), ピアソンの言葉で換言すれば, 等級化(graduatiosn)を施すことであった。等級化は現象の記述であり, 与えられた資料を母集団からランダムに発生した標本とみなし, それを分類にかけ, 誤差のより少ない曲線をあてはめることである。

 ピアソン統計学の本領は, その統計分布論にある。等級化がその中心概念であるが, ピアソンはこれを二段階で行なった。一つは非対称な測定値集合を2つの正規分布に解体すること(古典的なガウスの誤差論に立脚), もう一つは非対称な分布をそのまま受け入れ, その型を分類することである。前者ではピアソンには正規分布への依存が残存していたが, 後者で正規分布の拘束から脱皮した。ここでピアソンが意図していたものは何だったのだろうか。筆者によると, それは資料の背後にあるはずの現実世界の法則性の究明, そのために作用するはずの認識の抽象化でなく, 事象の数理的な関連の要約であった。したがって, 上記の二段階といっても, ピアソンの意図としてあったものは確率数理によった母型と分布関数による分類で, 分布関数こそ要約のひろがりを数学的に提示する図式に他ならないと, 考えた。

 したがって, 「適合」という用語は, ピアソンの解析法の在り方を説明するのに適したものである。すでに確立されている真理であるいくつかの分布の型が, ある具体的資料にあてはめられ, そのなかのどれかがうまく適合したとすると, そこに法則が確証されたことになる。適合は法則の確証であり, 経験の確証である。分布関数の類別とその経験事象への適合, これがピアソンの統計学を記述統計学として特徴づける最大の要因である。

 ところで, ピアソンは大標本をもとにした記述統計学のように, しばしば特徴づけられる。初期の段階のピアソンにあっては, 標本は大抵の場合, 大標本であった(ユニバシティ・カレッジの彼の研究室, ゴールトン以来の優生学記録室でのデータの蓄積)。標本への分布関数へのあてはめは, とりもなおさず母集団の記述であった。その限りで, 母集団と標本との間には確率的関係が入り込む余地はない。それゆえに母集団と標本の近似を前提として, 分布の適合を考えるという制約を抜けきれなかった。

 しかし, 論理的に考えれば大標本でも, それは母集団ではないので, 標本が果たして母集団を代表するのかという問題を避けることはできない。ピアソンンがこの課題に直面したとき, 彼は問題の所在を標本のランダム性の査定に定め, そこから生まれたのがχ2適合度検定(ただし, 今日のようにそれを有意性検定一般とあるいは仮説の棄却や採択と結び付ける考えはなく, あくまでも分布の適合という次元でとらえられていた)と確率誤差論である。狙いは, 標本につきまとう偶然誤差の大きさを基準に, 良好な標本と, そうでない標本を識別する基準を定めることである。ピアソンの有意性検定がこれである。ことの順序でいえば, χ2検定で示された母集団と標本, そしてそのなかをとりもつ標本分布の関連は確率誤差論で確かなものとなる。この図式のもとで, 既知の母集団から良好な標本を判定する有意性検定と, 既知の標本から未知の母集団についての知識を得る区間推定が成立した。

 ところで, 標本分布が正規分布でなく非対称である場合ピアソンは, 推定をどのように行おうとしたのだろうか。ピアソンは, この難問を標本分布の非対称性のいかんで, その都度推論形式を変える不統一な接近法をとり, 体系的な解決に成功しなかった(ラプラス的な19世紀の誤差論, ベイズ定理の制約)。この難問を, 正規母集団を任意標本と対置させ, 非対称ではないが正規でもない統計量zの分布を導くことで解決したのがスチューデントである。スチューデントによって, この問題の解決が可能になったのは, 彼自身が小標本を日常の研究資料としていたこと, ピアソンにとっては例外でしかなったものが例外でなかった事情があったからである。χ2適合度検定と確率誤差論に示されたピアソンの統計的推論はベイズ逆確率を契機としていたが, スチューデント, フィッシャーはこの種の推論にベイズ逆確率をもちこむことを拒否し, 経験値だけを手掛かりに母集団特性値の帰納的推論を考えようとした。いわば発想の転換があったとうことになる。

 しかし, 筆者によれば, ピアソンからスチューデント, そしてフィッシャーに至るにおよんで, 統計的推論が古典的な意匠をとりはらい, 現代的なものへと推移したかのようにみえるが(フィッシャー革命と唱える論者も少なくない), 推測は記述の一局面を拡大したところに措定されるものであり, この推測も標本分布が正規な場合から非正規なものを含んだ場合への移行にすぎず, そのことによって何かあたらしい統計利用様式が開拓されたとはいえない。記述によっても推測によっても, 獲得されるものはせいぜい分布の形式的属性要約したものにすぎない。

 本稿は, ピアソンの統計学が詳しい。主な小見出しを列挙する。分布の理論(正規分布と非対称分布), 分布の要約方法, 分布の母型と類別, 分布関数の二重の意義, 適合度の査定, 査定の構図, 頻度定数(標本特性値のこと)の確率誤差, 母集団・標本・標本分布の構図, 標本の有意性, 母数の推定, 比率の推定, 非対称標本分布など。また, 詳細な数学注もあり, 理解を助けている。(モメントによる頻度分布の解体, ピアソンの微分方程式, 分布関数群, χ2分布, ラプラスの指数定理と比率の古典的推定図式, ベイズの逆確率, ピアソンのC・その1と2)

ジャンル:
ウェブログ
コメント   この記事についてブログを書く
この記事をはてなブックマークに追加
« 近昭夫「H.L.ムーアと統計的... | トップ | 高崎禎夫「スチューデントの... »

コメントを投稿


コメント利用規約に同意の上コメント投稿を行ってください。

数字4桁を入力し、投稿ボタンを押してください。

あわせて読む