どうだったでしょう。第39講は気に入って頂けましたか?。
それにしても、私などボケ封じの前にアルコール封じすべきだとつくづく思います。・・・29と39に区別が付かないのだから、アルコールほど恐ろしいものはありません。また、酩酊故のプログラムの記述の不備なところは修正しておきましたので悪しからず。
さて、今日は前講の続きです。
標準化の変数、『SQR(N*0.21)の素性とは何か?』を話題にしたいと思います。
本来、二項分布とは以前にもお話したように、例えば10個のボールがあって、そのうちの3個が白、7個が赤だった場合、そこから無作為に取り出されるn個の標本のうち、x個の白を含む数は、3個の白からx個を取り、7個の白から(n-x)個を取り出す組み合わせの数の積に等しくなるから、確率変数P(x)=3Cx*7Cn-x/10Cnとなる。(ただし、0<=x<=3)
ところで、母集団(標本の数)が十分に大きいとき、30%が白、70%が赤である場合には、1個を取り出すとき白の確率はいつも0,3とみなすことができます。したがって、n個取り出す試行を試みても白である確率は常に0.3である。
これを反復試行の確率という。(こういうのを、数学的詭弁と言うのだろうと思います)・・・・この様にして、本来の二項分布の数式をP(x)=nCx*0.3^x*0.7^n-x・・(nからx個を取り出す組合せ掛ける0.3のx剰掛ける0.7のn-x剰)という数式に近似させ、それを二項分布と呼んでいる。
一般的に、P(x)=nCx*p^x*q^n-xと表記され、q=1-p(事象pと非事象pの全体は1);x=0,1,2,・・・・nである。
ここで、絶対に頭に叩き込んで置かなくてはならない重要事項があります。
(1):xが0からnまで変化したときの総和nCx*p^x*q^n-x=(p+q)^n=1となる。・・・これはガウス曲線を積分した値が1といわれる根拠です。
(2):二項分布の平均値(期待値とも言う)はn*pである。
(3):二項分布の標準偏差はSQRn*p*qである。
以上(2)~(3)については微分という数学分野の話となりますので、ここでは説明を省きますが、興味のある向きは図書館にでも出かけて数学の専門書を読んで研究していただきたいと思います。
前講で、二項分布を『標準化』するにあたり標準化の補正値としてSQRN*0.21という変数を使いましたが、これは私が勝手に、『p=0.3』、『q=0.7』としたために、X軸方向の数値をSQRN*0.21で割り、Y軸方向の数値にSQRN*0・21を掛けて、グラフを調整し、Nの変化にかかわらず一定の形が得られるようにしたためです。
それにしても、私などボケ封じの前にアルコール封じすべきだとつくづく思います。・・・29と39に区別が付かないのだから、アルコールほど恐ろしいものはありません。また、酩酊故のプログラムの記述の不備なところは修正しておきましたので悪しからず。
さて、今日は前講の続きです。
標準化の変数、『SQR(N*0.21)の素性とは何か?』を話題にしたいと思います。
本来、二項分布とは以前にもお話したように、例えば10個のボールがあって、そのうちの3個が白、7個が赤だった場合、そこから無作為に取り出されるn個の標本のうち、x個の白を含む数は、3個の白からx個を取り、7個の白から(n-x)個を取り出す組み合わせの数の積に等しくなるから、確率変数P(x)=3Cx*7Cn-x/10Cnとなる。(ただし、0<=x<=3)
ところで、母集団(標本の数)が十分に大きいとき、30%が白、70%が赤である場合には、1個を取り出すとき白の確率はいつも0,3とみなすことができます。したがって、n個取り出す試行を試みても白である確率は常に0.3である。
これを反復試行の確率という。(こういうのを、数学的詭弁と言うのだろうと思います)・・・・この様にして、本来の二項分布の数式をP(x)=nCx*0.3^x*0.7^n-x・・(nからx個を取り出す組合せ掛ける0.3のx剰掛ける0.7のn-x剰)という数式に近似させ、それを二項分布と呼んでいる。
一般的に、P(x)=nCx*p^x*q^n-xと表記され、q=1-p(事象pと非事象pの全体は1);x=0,1,2,・・・・nである。
ここで、絶対に頭に叩き込んで置かなくてはならない重要事項があります。
(1):xが0からnまで変化したときの総和nCx*p^x*q^n-x=(p+q)^n=1となる。・・・これはガウス曲線を積分した値が1といわれる根拠です。
(2):二項分布の平均値(期待値とも言う)はn*pである。
(3):二項分布の標準偏差はSQRn*p*qである。
以上(2)~(3)については微分という数学分野の話となりますので、ここでは説明を省きますが、興味のある向きは図書館にでも出かけて数学の専門書を読んで研究していただきたいと思います。
前講で、二項分布を『標準化』するにあたり標準化の補正値としてSQRN*0.21という変数を使いましたが、これは私が勝手に、『p=0.3』、『q=0.7』としたために、X軸方向の数値をSQRN*0.21で割り、Y軸方向の数値にSQRN*0・21を掛けて、グラフを調整し、Nの変化にかかわらず一定の形が得られるようにしたためです。