星空研究Memo

ここは某天文屋の外部記憶装置である。

pvclust

2012-02-09 00:58:56 | R言語

クラスター分析のパッケージ pvclust に関するメモ。

# データの用意(ダミー)

 name | weight | height
 Tom
 Jim

こんな感じでデータを用意したとする。
下に何行続くかは任意。

 data <- read.csv("hoge.csv",header=T, row.names=1)

data に格納。行と列の名前を指定しておく。

 z <- scale(data)

単位が異なるデータ(weight, height)扱うので標準化を行う。
この変換値は Z-score ともいうらしい。 計算は以下の通り。



 z <- as.data.frame(t(z))

上記のように t() で列と行を入れ替えておく。念のため data.frame に変換もかましておく。
あとは pvclust パッケージを呼び出しておいて、以下のように入力。

 
result<-pvclust(z, method.dist="euclidean", method.hclust="ward", nboot=1000)

ここではユークリッド距離、ウォード法を指定。nboot=1000 が推奨とのこと(デフォルト)。
計算が終わったら result をプロットするとデンドログラムが出る。


最新の画像もっと見る

post a comment