統計ブログはじめました!

各専門分野の統計技術、方法、テクニックなどを気ままに分かり易く例題をもとに解説します。

統計のコツのこつ(64)

2018-03-07 19:40:58 | 日記・エッセイ・コラム
前前回(62)と前回(63)では、アンケートの語句を一まとめにしてクラスター分析と主成分分析の「R」による手法をご紹介しました。しかし、
前前回(62)のデータは、入院1週間から3週間に渡ってアンケートをとっています。
実際のアンケートでは、回答(語句の頻度)が1~3週間でどの様になっているかを知りたいと思うでしょう。
クラスター分析や主成分分析の有効な活用法を知ったうえで、類似性のデータマップを作りたいと思います。
その1つの方法として、
・多次元尺度構成法 ・対応分析
 
などの方法があります。
ここで取り上げる手法は「対応分析」であり、カテゴリー変数間の関連性を対応分析布置図として表現します。
なお、
多次元尺度構成法や対応分析は「すぐに役立つ統計のコツ」(オーム社)でご紹介していませんので、詳細は専門書やwebサイトなどを参考にして下さい。
それでは、
「R」による対応分析(多次元尺度構成法をカイ二乗距離に適用したものと言える)の手法を記しておきます。
 
***
dat<- read.delim("clipboard", header=T, row.names=1) # Excel などからコピー&ペースト
head(dat)
library(MASS) # library(MASS)が必要
cores<- corresp(dat, nf=2)
biplot(cores) # 布置図の作成
***
出力結果:
図1 対応分析布置図
 
 
図1の布置図から、入院経過(1週目~3週目)と語句の変化が読み取れる様です。
すなわち、
入院1週目は家族や友達の励ましがあって、看護師など周囲に感謝の気持ちが表れているように思われます。入院2週目になると、不安な気持ちになりがちで、それを払拭するように努めて明るく振る舞っているのかも知れません。入院3週目になると、顔色の悪さなどから病状を実感し悲観的になっているのでしょうか? この例題はあくまでも実データの一部に過ぎません。
この様に、
対応分析ではクラスター分析や主成分分析で見られなかった時間経過(変数間)での心情を推しはかることが出来るかも知れません。
 
情報統計研究所はここから!