クラスター分析のパッケージ pvclust に関するメモ。
# データの用意(ダミー)
name | weight | height
Tom
Jim
こんな感じでデータを用意したとする。
下に何行続くかは任意。
data <- read.csv("hoge.csv",header=T, row.names=1)
data に格納。行と列の名前を指定しておく。
z <- scale(data)
単位が異なるデータ(weight, height)扱うので標準化を行う。
この変換値は Z-score ともいうらしい。 計算は以下の通り。
z <- as.data.frame(t(z))
上記のように t() で列と行を入れ替えておく。念のため data.frame に変換もかましておく。
あとは pvclust パッケージを呼び出しておいて、以下のように入力。
result<-pvclust(z, method.dist="euclidean", method.hclust="ward", nboot=1000)
ここではユークリッド距離、ウォード法を指定。nboot=1000 が推奨とのこと(デフォルト)。
計算が終わったら result をプロットするとデンドログラムが出る。
最新の画像[もっと見る]
- 近況報告 11年前
- 惑星の偏平率 11年前
- 惑星の偏平率 11年前
- PASJ の投稿用アカウントを作る 11年前
- Muniwin を使ってみた 11年前
- Muniwin を使ってみた 11年前
- Muniwin を使ってみた 11年前
- Muniwin を使ってみた 11年前
- Muniwin を使ってみた 11年前
- Muniwin を使ってみた 11年前