日々の由無し事に反応しているうちにこのコーナーは間が開いてしまった。
統計に関して勉強する方向で行きたいのですが、拙い国語力だけが頼りだから、心もとない。
小学生時代に若返って、基礎事項を復習しよう。
男女の人口構成比であるとか、ある学年の身長のばらつきを統計的に調査しようとする場合、まず『標本』を精査しなければならない。
仮に、大掛かりに国家的な規模の統計を取るのであれば、それなりに、サンプルをどう抽出するかという考察がいる。また、このサンプリング=標本となる範囲を『母集団』といいます。
標本は、いくつかの調査項目を含んでいて、各項目あたり何個の事象が存在するか『度数』を数えて表にしたものを『度数分布表』といいます。
例えば、40人のクラスがあって、各々の生徒が一番好きな学科は何か?という調査をして、下記の表のような結果が得られるとき、『項目』、『度数』、『累積度数』、『相対度数』、『累積相対度数』という用語と各々の関係がどのようなものか理解してください。
項目 人数(度数) 累積度数 相対度数 累積相対度数
国語 10 10 0.25 0.25
算数 6 16 0.15 0.40
理科 4 20 0.10 0.50
社会 9 29 0.225 0.725
体育 11 40 0.275 1.00
合計 40 1.00
一般的にこのような表を度数分布表といいます。また相対度数と累積相対度数は百分率(パーセント)表示されることもあります。これらのデーターを柱状グラフとか折れ線グラフにして視覚化したものを『ヒストグラム』といいます。
この例では、項目に(名称的)な分類が有っても、数値的(数量的)な価値はありません。
ところが、算数のテストをおこなってその結果を表示しようとする場合、100点満点のテスト結果を、10点間隔で分類区分けして、このような度数分布表を作成するとき、『項目』が10『階級』に分類されるので、『階級の幅』は10点ということになります。
それでは下記の度数分布表を見て下さい。
ある学級の算数のテスト結果の度数分布表:
階級 度数 累積度数 相対度数 累積相対度数 代表値 代表値*度数
~10 1 1 2.5 2.5 5 5
~20 1 2 2.5 5.0 15 15
~30 2 4 5.0 10.0 25 50
~40 4 8 10.0 20.0 35 140
~50 5 13 12.5 32.5 45 225
~60 10 23 25.0 47.5 55 550
~70 8 31 20.0 67.5 65 520
~80 4 35 10.0 77.5 75 300
~90 4 39 10.0 87.5 85 340
~100 1 40 2.5 100.0 95 95
合計 40 100% 100% 2240点
ここで『代表値』という用語が出てきたましたが、これは各階級の中央の数値をもって、その階級を代表する数値という意味です。
それでは、ここで問題を出そうと思います。・・・・63点取った生徒は、下のほうから数えて何パーセントの成績ですか?。
60点台を取った生徒の上限が47.5%あります。そして、70点台を取った生徒のパーセンテージの上限が67.5%あります。したがって、63点取った生徒のしたからの位置は47.5+(67.5-47.5)*3/10=47.5+6.7=54.2%ということになります。・・・累積相対度数の折れ線グラフ(ヒストグラム)を書いて、視覚的に確認してください。
平均値:
次に平均値ということを考えて見ましょう。
統計的手法により、このクラスの算数の平均点の算出方法は(代表値*度数の総和/度数)ということになり、2240/40=56点がこのクラスの算数の平均点であることが分ります。
・・・・で、この平均値とはどういうことかというと、平均値を境として、それ以下の得点の総和とそれ以上の得点の総和が『釣り合う点』である、ということです。
・・・・口で言うのは容易いことでありますが、数理学的実相を連想できる人は少ないと思いますので、私の独断=偏見を並べ立てたいと思います。
子供の頃、遊園地に行くとシーソーがあって、よく遊んだものですが、体重30キロの子が中心(支点)から3メートルのところに座ったとします。このとき体重40キロの子は中心(支点)から何メートルの反対側に座れば釣り合いが保たれるでしょうか?。
この計算式はとても簡単で、30kg*3m=40kg*xを解けば、x=2.25mという答えを出すことはいとも容易いことですが、その釣り合いが保たれるこのシーソーの支点が実は平均点であると言えば、songzhaoはいよいよアルコール性脳炎になったかと非難されそうである。しかし、「この自然の理屈が分らずして君たちの脳の進歩はない」と断言しておこう。
統計に関して勉強する方向で行きたいのですが、拙い国語力だけが頼りだから、心もとない。
小学生時代に若返って、基礎事項を復習しよう。
男女の人口構成比であるとか、ある学年の身長のばらつきを統計的に調査しようとする場合、まず『標本』を精査しなければならない。
仮に、大掛かりに国家的な規模の統計を取るのであれば、それなりに、サンプルをどう抽出するかという考察がいる。また、このサンプリング=標本となる範囲を『母集団』といいます。
標本は、いくつかの調査項目を含んでいて、各項目あたり何個の事象が存在するか『度数』を数えて表にしたものを『度数分布表』といいます。
例えば、40人のクラスがあって、各々の生徒が一番好きな学科は何か?という調査をして、下記の表のような結果が得られるとき、『項目』、『度数』、『累積度数』、『相対度数』、『累積相対度数』という用語と各々の関係がどのようなものか理解してください。
項目 人数(度数) 累積度数 相対度数 累積相対度数
国語 10 10 0.25 0.25
算数 6 16 0.15 0.40
理科 4 20 0.10 0.50
社会 9 29 0.225 0.725
体育 11 40 0.275 1.00
合計 40 1.00
一般的にこのような表を度数分布表といいます。また相対度数と累積相対度数は百分率(パーセント)表示されることもあります。これらのデーターを柱状グラフとか折れ線グラフにして視覚化したものを『ヒストグラム』といいます。
この例では、項目に(名称的)な分類が有っても、数値的(数量的)な価値はありません。
ところが、算数のテストをおこなってその結果を表示しようとする場合、100点満点のテスト結果を、10点間隔で分類区分けして、このような度数分布表を作成するとき、『項目』が10『階級』に分類されるので、『階級の幅』は10点ということになります。
それでは下記の度数分布表を見て下さい。
ある学級の算数のテスト結果の度数分布表:
階級 度数 累積度数 相対度数 累積相対度数 代表値 代表値*度数
~10 1 1 2.5 2.5 5 5
~20 1 2 2.5 5.0 15 15
~30 2 4 5.0 10.0 25 50
~40 4 8 10.0 20.0 35 140
~50 5 13 12.5 32.5 45 225
~60 10 23 25.0 47.5 55 550
~70 8 31 20.0 67.5 65 520
~80 4 35 10.0 77.5 75 300
~90 4 39 10.0 87.5 85 340
~100 1 40 2.5 100.0 95 95
合計 40 100% 100% 2240点
ここで『代表値』という用語が出てきたましたが、これは各階級の中央の数値をもって、その階級を代表する数値という意味です。
それでは、ここで問題を出そうと思います。・・・・63点取った生徒は、下のほうから数えて何パーセントの成績ですか?。
60点台を取った生徒の上限が47.5%あります。そして、70点台を取った生徒のパーセンテージの上限が67.5%あります。したがって、63点取った生徒のしたからの位置は47.5+(67.5-47.5)*3/10=47.5+6.7=54.2%ということになります。・・・累積相対度数の折れ線グラフ(ヒストグラム)を書いて、視覚的に確認してください。
平均値:
次に平均値ということを考えて見ましょう。
統計的手法により、このクラスの算数の平均点の算出方法は(代表値*度数の総和/度数)ということになり、2240/40=56点がこのクラスの算数の平均点であることが分ります。
・・・・で、この平均値とはどういうことかというと、平均値を境として、それ以下の得点の総和とそれ以上の得点の総和が『釣り合う点』である、ということです。
・・・・口で言うのは容易いことでありますが、数理学的実相を連想できる人は少ないと思いますので、私の独断=偏見を並べ立てたいと思います。
子供の頃、遊園地に行くとシーソーがあって、よく遊んだものですが、体重30キロの子が中心(支点)から3メートルのところに座ったとします。このとき体重40キロの子は中心(支点)から何メートルの反対側に座れば釣り合いが保たれるでしょうか?。
この計算式はとても簡単で、30kg*3m=40kg*xを解けば、x=2.25mという答えを出すことはいとも容易いことですが、その釣り合いが保たれるこのシーソーの支点が実は平均点であると言えば、songzhaoはいよいよアルコール性脳炎になったかと非難されそうである。しかし、「この自然の理屈が分らずして君たちの脳の進歩はない」と断言しておこう。