裏 RjpWiki

Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学

2 個の時系列データの相関を考えるときは...

2014年09月11日 | 統計学

http://abrahamcow.hatenablog.com/entry/2014/09/11/024924
時系列データの相関係数はあてにならない……のか? 教えて下さい」なんだけど...

私のコメントが気に触ることが多いようなのですが(特に悪意はないつもりなんですけど,すみませんね)

私は,経済学とか時系列についてはよく知らないのですが,「これは「見せかけの相関(擬似相関;spurious correlation)」の例だ」ということならば,偏相関係数を考えればよいのではないでしょうかね??社会学などでは当たり前のように使われていると思うのですが。

> set.seed(1)
> x = cumsum(rnorm(100))
> set.seed(2)
> y = cumsum(rnorm(100))

# x,y の単相関係数
> (r_xy = cor(x, y))
[1] -0.3813307

# 時間の変数
> t = 1:100

# t,x の単相関係数
> (r_tx = cor(t, x))
[1] 0.9237727

# t,y の単相関係数
> (r_ty = cor(t, y))
[1] -0.4157964

# t を制御(固定)したときの x,y の 偏相関係数
> (r_xy.t = (r_xy-r_tx*r_ty)/sqrt(1-r_tx^2)/sqrt(1-r_ty^2))
[1] 0.00795554

ほとんど相関がないということが分かる。
検定をする場合は,通常の単相関係数の検定の計算式で検定統計量を計算し,t 分布の自由度を「サンプルサイズ - 3」にするだけ。

コメント    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« 行列の各行から指定した要素... | トップ | 2 個の時系列データの相関を... »
最新の画像もっと見る

コメントを投稿

統計学」カテゴリの最新記事