蜷川虎三「統計の概念(第1章)」『統計利用に於ける基本問題』岩波書店,1932年
筆者は本稿執筆当時の統計の対象と方法に関する論議の状況にみられた混乱を整理し,概念の定義づけを行い,学としての統計学の構築を目指している。前段は「集団」に関する議論,後段は「統計」概念の定義に関する議論である。
まず統計とは何か,という素朴な疑問から出発している。一般的には,統計は集団現象の数量的記述結果と言われる。集団に関しては,その大きさ,強度(恒常性,安定性),種類などいろいろなことが語られるが,重要なのは集団に2つの異なる性質があることである。
ひとつは存在としての集団(大量),もうひとつは意識的に構成された集団(解析的集団)である。大量は社会的存在としての集団である。統計はこの大量を語る数字である。もっとも単に集団と言った場合には,社会集団の他に自然集団がある。しかし,後者を反映した数字は統計とは呼ばれず,観測値である。両者は明確に区別されなければならない。もう一つの集団,すなわち意識的に構成された集団は,安定的な強度(集団性)を測ることを目的に構成されたものである。この集団にも社会的なものと自然的なものとがありうるが,統計とよばれるのは大量の解析的集団である。
統計が語る数字は,根本的な意味で大量である。大量を統計たらしめる過程は,大量観察(今日で言う統計調査)であり,大量観察の方法的規定が大量観察法である。その意味で,統計は大量観察の結果としての一群の数字である。
統計が当時,曖昧に理解され,本質的意味が捉えられなかったのは,大量と解析的集団の上記の区別がつけられず,また解析的集団に2つの区別があることを見過ごしていたからである。そのような混乱した結果になってしまった理由は,社会科学的認識の不足である。
関連して,「統計的」という用語があるが,この意味は「統計によって」という意味はなく,解析的集団によって集団研究を行うという意味である。「統計方法」と「統計的方法」とでは,意味が異なる。数理統計学では統計学の内容は,統計的方法の研究である。そこでは「統計的方法」が語られても,なんら統計の存在が前提とされていない。
意識的に構成された集団は大量の解析的集団であるので,そこで使用される統計的方法は厳密には統計解析法である。大量の解析的集団を統計値集団と呼ぶとすると。統計解析法は統計値集団によってその集団性をもとめること,すなわち統計解析の方法規定である。この場合,統計値集団は統計の存在を前提とし,統計は大量が数量的に認識されてはじめて存在するのであるから,統計解析は大量観察を前提していることになり,両者は不可分の関係にある。
筆者は両者の方法規定である大量観察法と統計解析法とをあわせて統計方法と呼んでいる。この限りで,統計方法は社会科学における研究方法であり,統計学は社会科学の領域に属する一つの学問である。筆者はこのこととの関係で,自然科学者あるいは数理統計学者のいわゆる統計学の理解との相違,統計解析法と統計方法との区別を強調し,方法としての統計学があらゆる科学に適用可能であるという説の誤解を糺している。
筆者は最後に,改めて統計の概念規定を行っている。要約すると,統計は大量を語る数字で,大量を数量的に把握することを大量観察というならば,統計は大量観察の結果としての一群の数字である。大量はその存在が社会的に規定された集団である。集団の構成要素としての個別的存在は,単位である。大量は集団であるから,集団としての性質すなわち集団性をもつ。集団性の方向を,統計学では標識という。大量は特定標識によって部分に分割される。この分割された部分を,部分大量という。部分大量と大量の大きさの比は,集団性の強度を示す。大量は社会的存在なので,特定の存在の時と存在の場所をもつ。大量の単位,標識,存在の時,存在の場所を「大量の4要素」という。大量観察の結果としての一群の数字すなわち統計は統計値という。
統計値は,個体を測定した結果としての測定とも,複数の統計値から算出された計算値,すなわち誘導統計値(比率,代表値)とも区別されなければならない。また,大量の構成を数列として記述する形式は,「大量の構成を示す統計系列=構成的統計系列」と名付けられる。構成的統計系列は,部分大量の大きさを示す統計値をその項とする数列である。構成的統計系列の表示形式を構成的統計表という。とくに図形で示される場合,それは構成的統計図表である。このように特徴づけられる統計は,事実を正確に語るものでなければならない。大量観察法が統計学の重要な問題とならざるをえない所以である。
筆者は本稿執筆当時の統計の対象と方法に関する論議の状況にみられた混乱を整理し,概念の定義づけを行い,学としての統計学の構築を目指している。前段は「集団」に関する議論,後段は「統計」概念の定義に関する議論である。
まず統計とは何か,という素朴な疑問から出発している。一般的には,統計は集団現象の数量的記述結果と言われる。集団に関しては,その大きさ,強度(恒常性,安定性),種類などいろいろなことが語られるが,重要なのは集団に2つの異なる性質があることである。
ひとつは存在としての集団(大量),もうひとつは意識的に構成された集団(解析的集団)である。大量は社会的存在としての集団である。統計はこの大量を語る数字である。もっとも単に集団と言った場合には,社会集団の他に自然集団がある。しかし,後者を反映した数字は統計とは呼ばれず,観測値である。両者は明確に区別されなければならない。もう一つの集団,すなわち意識的に構成された集団は,安定的な強度(集団性)を測ることを目的に構成されたものである。この集団にも社会的なものと自然的なものとがありうるが,統計とよばれるのは大量の解析的集団である。
統計が語る数字は,根本的な意味で大量である。大量を統計たらしめる過程は,大量観察(今日で言う統計調査)であり,大量観察の方法的規定が大量観察法である。その意味で,統計は大量観察の結果としての一群の数字である。
統計が当時,曖昧に理解され,本質的意味が捉えられなかったのは,大量と解析的集団の上記の区別がつけられず,また解析的集団に2つの区別があることを見過ごしていたからである。そのような混乱した結果になってしまった理由は,社会科学的認識の不足である。
関連して,「統計的」という用語があるが,この意味は「統計によって」という意味はなく,解析的集団によって集団研究を行うという意味である。「統計方法」と「統計的方法」とでは,意味が異なる。数理統計学では統計学の内容は,統計的方法の研究である。そこでは「統計的方法」が語られても,なんら統計の存在が前提とされていない。
意識的に構成された集団は大量の解析的集団であるので,そこで使用される統計的方法は厳密には統計解析法である。大量の解析的集団を統計値集団と呼ぶとすると。統計解析法は統計値集団によってその集団性をもとめること,すなわち統計解析の方法規定である。この場合,統計値集団は統計の存在を前提とし,統計は大量が数量的に認識されてはじめて存在するのであるから,統計解析は大量観察を前提していることになり,両者は不可分の関係にある。
筆者は両者の方法規定である大量観察法と統計解析法とをあわせて統計方法と呼んでいる。この限りで,統計方法は社会科学における研究方法であり,統計学は社会科学の領域に属する一つの学問である。筆者はこのこととの関係で,自然科学者あるいは数理統計学者のいわゆる統計学の理解との相違,統計解析法と統計方法との区別を強調し,方法としての統計学があらゆる科学に適用可能であるという説の誤解を糺している。
筆者は最後に,改めて統計の概念規定を行っている。要約すると,統計は大量を語る数字で,大量を数量的に把握することを大量観察というならば,統計は大量観察の結果としての一群の数字である。大量はその存在が社会的に規定された集団である。集団の構成要素としての個別的存在は,単位である。大量は集団であるから,集団としての性質すなわち集団性をもつ。集団性の方向を,統計学では標識という。大量は特定標識によって部分に分割される。この分割された部分を,部分大量という。部分大量と大量の大きさの比は,集団性の強度を示す。大量は社会的存在なので,特定の存在の時と存在の場所をもつ。大量の単位,標識,存在の時,存在の場所を「大量の4要素」という。大量観察の結果としての一群の数字すなわち統計は統計値という。
統計値は,個体を測定した結果としての測定とも,複数の統計値から算出された計算値,すなわち誘導統計値(比率,代表値)とも区別されなければならない。また,大量の構成を数列として記述する形式は,「大量の構成を示す統計系列=構成的統計系列」と名付けられる。構成的統計系列は,部分大量の大きさを示す統計値をその項とする数列である。構成的統計系列の表示形式を構成的統計表という。とくに図形で示される場合,それは構成的統計図表である。このように特徴づけられる統計は,事実を正確に語るものでなければならない。大量観察法が統計学の重要な問題とならざるをえない所以である。
※コメント投稿者のブログIDはブログ作成者のみに通知されます