コメント(10/1 コメント投稿終了予定)
 
 
 
bob3 (bob3)
2005-10-27 13:09:48
 pseudo F はCalinskiさん(とHarabaszさん)が提唱したので、Rでは Calinki index と呼ばれているようです。

 あと、SASだとCCC(立方クラスター基準)というのがよく使われるようです。SASは使ったことが無いのでどんなものかわからないですけど。



 先ほどのデンドログラムはRで以下のようにして描きました。



# ↓データを読み込んで階層型クラスタ分析を実行

hca <- hclust(dist(USArrests),"average")

# ↓デンドログラムを描く

plot(hca,hang=-1)

# ↓三つのクラスタに分けることにして、赤で線を引く

rect.hclust(hca, k=3, border="red")



 分野によって手法が異なるのもクラスタ分析の面白いところで、マーケティングの世界では専らウォード法なのですが、生物学の世界では群平均法が主流だそうです。
 
コメントを投稿する
 
名前
タイトル
URL
コメント
コメント利用規約に同意の上コメント投稿を行ってください。

数字4桁を入力し、投稿ボタンを押してください。