ならおうは穏やかに語る

Fly Fishingを中心に難しい話からヨタ話まで支離滅裂な雑文。
(09/08/23カウンターを付けました。)

倍半分と標準偏差

2012-02-25 01:29:08 | Weblog
測定バラツキの一つの基準として倍半分という概念がある。正規分布における標準偏差との違いについて考えてみた。

倍半分
測定値Mに対して最小値min=0.5M、最大値2Mとなる状態。
桁違いほど離れていないので、測定結果はまずまず信頼がありそうな時に使う。
実感覚としては100円に対する50円と200円。最小値と最大値の比が2である時も使えない事は無い。


標準偏差
統計学では標準偏差と平均値が判れば正規分布に従って存在確率を見積もることが出来る。
MS ExcelではNORMADIST関数を使う。区間X1とX2に存在する確率は下記式を使う。
NORMDIST(X1,平均値,標準偏差,TRUE)-NORMDIST(X2,平均値,標準偏差,TRUE)
累積分布を使うのでTRUEを選ぶ。FALSEでは確率密度関数となる。

これは標準偏差=σとした時のある範囲内外の確率を計算できる。(正規分布としてだが)
±σにある確率=68.3%
±2σにある確率=95.45%
±3σにある確率=99.73%
±4σでない確率=63ppm
±5σでない確率=0.57ppm
±6σでない確率=20ppb

上の計算はExcelが普及する迄は標準正規分布表(Standard Normal Distribution)を使うか、自分でこの辺のページに書いてある式を解くしかありませんでした。便利になったものです。

さて、MS-Excelの使い方が判ったところで、一般に測定結果は平均値を典型値(Typical)とする。
これは正規分布の最大頻度を示す値が平均値であることだけではなく、一般的な概念とも合致する。


測定バラツキ
もう一つの重要な概念を追記する。
バラツキはプラスマイナス20%という言葉を聞く。測定値Mに対する最小値が0.8M、最大値が1.2Mという状況を示す。
80円から120円ってとこだね。


おおよそ、バラツキに対する概念を示す事ができた。本論はココからだ。

倍半分を示す時の標準偏差
Max=2M=M+2σ, min=0.5M=M-2σとする。
バラツキが95.45%内に入っている
(M+2σ)/(M-2σ)=2/0.5=4
M+2σ=4M-8σ
10σ=3M
σ=0.3M

Max=2M=M+3σ, min=0.5M=M-3σとする。
バラツキが99.73%内に入っている
(M+3σ)/(M-3σ)=2/0.5=4
M+3σ=4M-12σ
15σ=3M
σ=0.2M


これはサンプリングから推測される危険度の判断に使う。
通常測定で検出されるMax/minは2σの範囲に入っている。3σの範囲を検出する為にはサンプリング数が1000になる。
N=1000のサンプリングから得られるMax/minは3sigmaと考えられるだろう。
だが、一般的にはN<100であるので、検出範囲は2σとなる。
そしてこの2σの範囲が倍半分であるようなとき、σ=0.3Mとなるので、範囲外が0.57ppmとなる5σは1.5Mとなる。
つまり、倍半分の測定数が100程度であると範囲外が0.57ppmとなるのはM±5σ⇒M±1.5Mとなる。

一億分の57が範囲外となる可能性がこれで判る訳だ。

倍半分ではなく±α%の時はどうなるか。
上記と同じくばらつきを2σとするか3σとするかで異なる。
バラツキをδとすると

Max=(1+α)M=1+δ, min=(1-α)0.8M=1-δ
→Mα=δ=2σ or 3σ

あとは上と同じ様に計算すれば良い。






最新の画像もっと見る

コメントを投稿

ブログ作成者から承認されるまでコメントは反映されません。