裏 RjpWiki

Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学

二次データのt検定

2010年07月14日 | ブログラミング
R の t.test は,元データがないと使えないと思っている人がいる。でも,裏技(?)がある。
ヒントは,指定されたサンプルサイズで,指定された平均値と標準偏差を持つデータが作れるということ。t検定は本質的にはサンプルサイズと平均値と標準偏差しか使わない。個々のデータがどういう値を取るかとか分布は正規分布かなどということを問わないのだ。
ということで,サンプルサイズが n1, n2,平均値がm1, m2,標準偏差がs1, s2 ということしか分かっていないときに t.test を使うには,,,
t.test(scale(rnorm(n1))*s1+m1, scale(rnorm(n2))*s2+m2) これだけでよいのだ~~っ。

> t.test(scale(rnorm(31))*3.212+154.546, scale(rnorm(16))*4.387+153.698)

Welch Two Sample t-test

data: scale(rnorm(31)) * 3.212 + 154.546 and scale(rnorm(16)) * 4.387 + 153.698
t = 0.6843, df = 23.547, p-value = 0.5005
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-1.712228 3.408228
sample estimates:
mean of x mean of y
154.546 153.698

念のために書いておくと,何もわざわざ架空のデータベクトルなど作らなくても,各群のサンプルサイズ,平均値,標準偏差の,合計6つの引数からt検定を行う関数を作ればよいのだよ。
コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« *apply関数一族 | トップ | 紅一点 »
最新の画像もっと見る

コメントを投稿

ブログラミング」カテゴリの最新記事