統計技術 第Ⅲ部:第6章 要約統計量(Summary)による検定法
統計技術 第Ⅲ部では、Free Online Caluclator として「Wessa.net」紹介してきた.
統計事例によっては原(生)データ(Raw data)ではなく、要約統計量(データ数、平均値、標準偏差・・など)から平均値差の検定や効果量(effect size)などを知りたい場合がある.その様なときに役立つ" Free Online Caluclator "の事例を紹介しておこう.
第6章-1:独立2標本の t-検定の方法(2-sample t-test for summary data)
例題として、下記URLの「統計技術:第Ⅰ部第7章」の統計量を用いてやってみよう.http://toukei.sblo.jp/article/187281663.html
Summary data は次の通りである.
--------------------------
.........................x............y
平均値......10.65......13.92
分散.............4.69......18.32
標準偏差....2.166......4.28
データ数......19..........19
---------------------------
利用する「Free Online Caluclator」(URL)にアクセスしてみよう.
# EPITOOLS の事例
https://epitools.ausvet.com.au/twosamplettest
図1-1:Summary data の入力画面(1)
図1-2:Summary data の入力画面(2)
図2:Summary data の出力画面(Excelへの出力を編集したもの)
「Download Excel file of result」をクリックすればよい.
図3:Summary data の95%CI グラフ
最近の学会発表や学術誌への投稿などでは、効果量(ES:effect size)の記載が求められることが多くなっている.ESについては、当該Gooブログで紹介しているが、代表的な" ES Caluclator "を紹介しておこう.
# Psychometrica の事例
https://www.psychometrica.de/effect_size.html
Top ページ
↓
Effect Size
↓
1. Comparison of groups with equal size
[+]をクリック
↓
図5 入力と出力画面
ここで、
Effect Size d_Cohen = 0.964 である.
これは、次式によって求められる(サンプル数が同じとき).
d=(mean_1 - mean_2)/sample SD pooled
sample SD pooled=sqrt((SD1^2 + SD^2)/2)
従って、
d=abs(10.65-13.92)/sqrt((2.199^2 + 4.28^2)/2)=3.27/3.392=0.964
となる.
サンプル数が異なるときは、sample SD pooled の計算が異なるので、次の例題を試してみょう.
統計のコツのこつ(31)
https://blog.goo.ne.jp/k-stat/e/3ce0391051242c38d99a3a925be39d22
----------------------------------------------------------------------
(A) 年齢 30~39才, 30名の平均値 Xa=122.5 mmHg, 標準偏差 SDa= 10.85 mmHg
(B) 年齢 40~49才, 20名の平均値 Xb=133.4 mmHg, 標準偏差 SDb= 12.24 mmHg
----------------------------------------------------------------------
# Psychometrica の事例
Top ページから次の項目を選択する.
2. Comparison of grouos with different sample size (Cohen's d, Hedges'g)
↓
図6 Summary data の入力と出力結果の画面
ここでの、
Effect size = 0.954 は"Hedges's g" の値と一致する.
これは、次式によって求められる(サンプル数が異なるとき).
g=(mean_1 - mean_2)/sample SD pooled
sample SD pooled=((n1-1)*SD1^2 + (n2-1)*SD^2)/(n1+n2-2)
従って、
g=10.9/11.4247=0.954073
となる.
また、
図6 の[*][**]については欄外に注釈があり、大雑把に言うと次のようである.
-------------------------------------------------------------------------------
[* ]:これは単純に dCohen または gHedges と呼ばれ、修正された測定値であることを示す.
[**]:あるグループのサンプルが別のグループのサンプルよりも大きい確率である.
-------------------------------------------------------------------------------
通常なら、Effect Sizeとして「Cohen's d 」を採用すれば良いだろう.
しかし、
Hedges'g は"unbiased Cohen's d" と呼ばれるように、求める計算式が違っており、今だ混乱しているので、「Cohen's d 」か「Hedges’g」を明確しておくことをお勧めする.