統計モデル その4 パス解析
http://blog.goo.ne.jp/xmldtp/e/883ff50a30dc1d864e9b0acd12b78e85
の続き。「統計モデル」の授業のメモメモ
■前回の復習
モデルの修正
・適合度を上げる
→数値で示すこと可能
→理論的に妥当な修正
・モデルを当てはめた結果=Σ
SとΣの差を求める
→大きいところ
残差間(誤差間)の相関をいれてみる
・修正指数
mi→カイ2乗の減少量予測
・パス解析
関係の強さ
因果の方向を知るのは難しい
・直接効果の解釈
他の影響が一定/排除
・間接効果の解釈
パス係数の掛け算
・総合効果
直接効果+間接効果
標準化の使い分け
単位に意味あり→標準化しない
・潜在変数間のパス解析
合計得点間のパス解析より、係数・相関大きくなる
→希薄化の修正
因子を使うと、飽和モデルでなくなることも
・等値制約
複数のパス係数が等しい量であるとする制約
・誤差分散・誤差間共分散
誤差分散を明示的に書くもの/書かないもの
→lavvanは後者(勝手にやる)
amosは前者
誤差間共分散は書く
誤差分散を等しくする場合はlavvanでも書く
・等値制約の影響
標準化推定値が等値になるとは限らない
→まず等値にならない
・修正係数
誤差の共分散
・分散を1に固定
f1~~1*f1
因子負荷量を推定 NA*
おなじにするequal
<HR>
■探索的因子分析(いわゆる因子分析)
・構成概念が定義することが難しい場合
→名前を後からつける
・例:ビッグファイブ理論
→おおよそ5つ
・信頼性と妥当性
信頼性:同じ値が得られる
妥当性:意図した構成概念を測定できているか
・探索的因子分析でわかること
因子数がはじめわからない→決定する
因子負荷量
・因子分析的考え方
・因子分析の言葉
寄与
回転
・寄与
各因子が観測変数のすべての分散のうちの
どれだけを説明するか
各因子に注目
→%で表現したり・・
・共通性
寄与と混同しやすい
共通性:観測変数に注目
Rによる探索的因子分析の手順
何回も行う
・固有値のスクリープロットを作成して
(これ以外も見る)
因子数を決定
→変数削除も
・初期解と共通性を求める
・因子軸の回転
→結果変換
・因子の解釈
因子分析における解の不定性
・因子分析:変数間の相関を利用して、
変数を少数の因子にまとめる
・同じ相関行列から複数の解
→解の不定性
・まずは、初期解をもとめ、説明しやすいものを
不定性をとめる
・二次のせきりつ(二次のもーめんと)
---------------------------------
三次のせきりつ(三次のもーめんと)
<HR>
■Rでの操作
library(psych)
# けっそく値を削除
bfi2<-na.omit(bfi[,1:25])
# とりあえずnfactorを1、fmはml(最尤法)
fa(bfi2,nfactors=1,fm="ml")
# スクリープロット
plot(fa(bfi2)$e.values,type='o')
# 大きく下がる手前を選ぶ。固有値1以上
# 因子数を5に,回転しない
fa(bfi2,nfactors=5,fm="ml",rotate="none")
# 回転させるライブラリ
library(GPArotation)
# プロマックス回転
fa(bfi2,nfactors=5,fm="ml",rotate="promax")
# バリマックス回転
fa(bfi2,nfactors=5,fm="ml",rotate="varimax")
<HR>
■結果の見方
・h2共通性
・u2独自性
→回転しても同じ
・ML1,ML2・・因子
■削除する項目
・平均が極端な項目を削除
→みんなが同じ回答
・因子負荷量(0.4未満)、共通性(0.3未満)を削除
・複数の因子から影響を受けている
・SEMのように残差を見て削除
・項目を削除すると、適切な因子数が変わることも!
<HR>
■項目削除のR操作
#1項目抜く
fa(bfi2[, -1], nfactors = 5, fm = "ml", roteto = "promax")
#2つ抜く
fa(bfi2[,c(-1,-24)], nfactors = 5, fm = "ml", roteto = "promax")
#1個ずつ抜いて、確認すること
<HR>
■バリマックス回転結果
・値が固まってきて、因子の内容わかる
→単純構造
・一般にバリマックス回転よりも、プロマックス回転の方が明確になる
・なぜ、「バリマックス」というのか?
因子負荷量の9ばりあんす(分散)をMAXに
→最近あんまり使われなくなった
因子と因子の間の相関を0に固定してるので
・プロマックス
因子間の相関を許容している
プロマックスの寄与、寄与率には2つの考えがあるが、
そちらではなく、初期解のプロマックスの寄与、寄与率
<HR>
■Rの因子得点
round(fa(bfi2[,-1],nfactors=5,fm="ml",roteto="promax")$scores[1:10,],2)
#1:10つけないと、いっぱい出てくる
#確認的因子分析でもpredictを使ってできる
<HR>
■手順のまとめ
・因子数:固有値、解釈できるか
・因子負荷量/共通性で観測変数を減らす
・報告すべき結果:プロマックス回転の結果
・各因子が何を表しているか:因子の命名
<HR>
■信頼性
・構成概念を測定するための測定道具の性能を示す指標の1つ
→もうひとつが妥当性
・信頼性:測定値の安定性
・測定値=真値+測定誤差
→平均的にみれば、誤差0?
→そこで、分散を求める
信頼性=真値の分散/測定値の分散
信頼性が高い
誤差の分散0に近い=測定が安定
真値の分散=測定値の分散→信頼性1
信頼性が低い
信頼性の値は低くなる
決定係数などと同じようなもの
・大問題
でも、測定値は求められるが、
真の値や誤差は求められない
→別のテストを考える
2つのテストとの相関:信頼性
・信頼性
再検査信頼性:別の時期の、同一のテスト
平行検査信頼性:別バージョン
・大問題
2回求める・・・1回で
折半信頼性→2個でなく4個に・・
=α係数:すべての分け方の平均
n 相関の合計
--------------------------
n-1 項目数+相関の合計
・α係数の問題点
同じように測定しているという仮定:
むずかしい。
→因子分析では、誤差は違うと仮定した
・因子分析の枠組みで信頼性を考える
→ω係数
・Rでは、alphaで求められる
・α係数=内的整合性の指標
・他の信頼性とは、違う概念の指標
→一番妥当なのは、再検査信頼性
・一致係数:評定者間の整合性の指標
■妥当性
・本当に測りたいものが、測れているか?
→測定値の解釈に対する適切性
信頼性が高く、妥当性が低いときがある
適切性を保証するための証拠を提示する
→一般化可能性の側面の証拠:信頼性
妥当性を示す証拠のひとつが信頼性
→外堀を埋めていく