昨日今日明日

きのうを思い、きょうを実感し、あすに想いを馳せよう。
若年性或いは老人性痴呆症にならない為にもね?

songzhaoのボケ封じ数学講座第32講

2007年05月11日 | Weblog
 日々の由無し事に反応しているうちにこのコーナーは間が開いてしまった。

 統計に関して勉強する方向で行きたいのですが、拙い国語力だけが頼りだから、心もとない。

 小学生時代に若返って、基礎事項を復習しよう。

 男女の人口構成比であるとか、ある学年の身長のばらつきを統計的に調査しようとする場合、まず『標本』を精査しなければならない。
 
 仮に、大掛かりに国家的な規模の統計を取るのであれば、それなりに、サンプルをどう抽出するかという考察がいる。また、このサンプリング=標本となる範囲を『母集団』といいます。

 標本は、いくつかの調査項目を含んでいて、各項目あたり何個の事象が存在するか『度数』を数えて表にしたものを『度数分布表』といいます。

 例えば、40人のクラスがあって、各々の生徒が一番好きな学科は何か?という調査をして、下記の表のような結果が得られるとき、『項目』、『度数』、『累積度数』、『相対度数』、『累積相対度数』という用語と各々の関係がどのようなものか理解してください。

 項目  人数(度数) 累積度数  相対度数  累積相対度数
 国語   10      10      0.25    0.25
 算数    6      16      0.15    0.40
 理科    4      20      0.10    0.50
 社会    9      29      0.225   0.725
 体育   11      40      0.275   1.00
 合計   40              1.00
 
 一般的にこのような表を度数分布表といいます。また相対度数と累積相対度数は百分率(パーセント)表示されることもあります。これらのデーターを柱状グラフとか折れ線グラフにして視覚化したものを『ヒストグラム』といいます。

 この例では、項目に(名称的)な分類が有っても、数値的(数量的)な価値はありません。
 ところが、算数のテストをおこなってその結果を表示しようとする場合、100点満点のテスト結果を、10点間隔で分類区分けして、このような度数分布表を作成するとき、『項目』が10『階級』に分類されるので、『階級の幅』は10点ということになります。
 
 それでは下記の度数分布表を見て下さい。

 ある学級の算数のテスト結果の度数分布表:

階級 度数 累積度数 相対度数 累積相対度数 代表値 代表値*度数
~10   1    1     2.5     2.5      5       5
~20   1    2     2.5     5.0     15      15
~30   2    4     5.0    10.0     25      50
~40   4    8    10.0    20.0     35     140
~50   5   13    12.5    32.5     45     225
~60  10   23    25.0    47.5     55     550
~70   8   31    20.0    67.5     65     520
~80   4   35    10.0    77.5     75     300
~90   4   39    10.0    87.5     85     340
~100  1   40     2.5   100.0     95      95
合計   40        100%   100%            2240点

 ここで『代表値』という用語が出てきたましたが、これは各階級の中央の数値をもって、その階級を代表する数値という意味です。

 それでは、ここで問題を出そうと思います。・・・・63点取った生徒は、下のほうから数えて何パーセントの成績ですか?。

 60点台を取った生徒の上限が47.5%あります。そして、70点台を取った生徒のパーセンテージの上限が67.5%あります。したがって、63点取った生徒のしたからの位置は47.5+(67.5-47.5)*3/10=47.5+6.7=54.2%ということになります。・・・累積相対度数の折れ線グラフ(ヒストグラム)を書いて、視覚的に確認してください。


 平均値:

 次に平均値ということを考えて見ましょう。

 統計的手法により、このクラスの算数の平均点の算出方法は(代表値*度数の総和/度数)ということになり、2240/40=56点がこのクラスの算数の平均点であることが分ります。

 ・・・・で、この平均値とはどういうことかというと、平均値を境として、それ以下の得点の総和とそれ以上の得点の総和が『釣り合う点』である、ということです。

 ・・・・口で言うのは容易いことでありますが、数理学的実相を連想できる人は少ないと思いますので、私の独断=偏見を並べ立てたいと思います。

 子供の頃、遊園地に行くとシーソーがあって、よく遊んだものですが、体重30キロの子が中心(支点)から3メートルのところに座ったとします。このとき体重40キロの子は中心(支点)から何メートルの反対側に座れば釣り合いが保たれるでしょうか?。

 この計算式はとても簡単で、30kg*3m=40kg*xを解けば、x=2.25mという答えを出すことはいとも容易いことですが、その釣り合いが保たれるこのシーソーの支点が実は平均点であると言えば、songzhaoはいよいよアルコール性脳炎になったかと非難されそうである。しかし、「この自然の理屈が分らずして君たちの脳の進歩はない」と断言しておこう。