統計モデルその５　探索的因子分析（いわゆる因子分析）／信頼性と妥当性

2013-12-13 09:11:28 | AI・BigData

統計モデルその４　パス解析
http://blog.goo.ne.jp/xmldtp/e/883ff50a30dc1d864e9b0acd12b78e85

の続き。「統計モデル」の授業のメモメモ

■前回の復習

モデルの修正
・適合度を上げる
　→数値で示すこと可能
　→理論的に妥当な修正
・モデルを当てはめた結果＝Σ
　SとΣの差を求める
　　→大きいところ
　残差間（誤差間）の相関をいれてみる
・修正指数
　mi→カイ２乗の減少量予測
・パス解析
　関係の強さ
　因果の方向を知るのは難しい

・直接効果の解釈
　他の影響が一定／排除

・間接効果の解釈
　パス係数の掛け算

・総合効果
　直接効果＋間接効果
　標準化の使い分け
　　単位に意味あり→標準化しない

・潜在変数間のパス解析
　合計得点間のパス解析より、係数・相関大きくなる
　　→希薄化の修正
　因子を使うと、飽和モデルでなくなることも

・等値制約
　複数のパス係数が等しい量であるとする制約

・誤差分散・誤差間共分散
　　誤差分散を明示的に書くもの／書かないもの
　　　→lavvanは後者（勝手にやる）
　　　　amosは前者
　　誤差間共分散は書く
　　誤差分散を等しくする場合はlavvanでも書く

・等値制約の影響
　標準化推定値が等値になるとは限らない
　　→まず等値にならない

・修正係数
　誤差の共分散

・分散を１に固定
　　f1~~1*f1
　因子負荷量を推定　NA*
　おなじにするequal

<HR>

■探索的因子分析（いわゆる因子分析）
・構成概念が定義することが難しい場合
　　→名前を後からつける

・例：ビッグファイブ理論
　　→おおよそ５つ

・信頼性と妥当性
　　信頼性：同じ値が得られる
　　妥当性：意図した構成概念を測定できているか

・探索的因子分析でわかること
　　因子数がはじめわからない→決定する
　　因子負荷量

・因子分析的考え方

・因子分析の言葉
　　寄与
　　回転

・寄与
　各因子が観測変数のすべての分散のうちの
　どれだけを説明するか
　各因子に注目
　　→％で表現したり・・

・共通性
　寄与と混同しやすい
　　共通性：観測変数に注目

Rによる探索的因子分析の手順
何回も行う
・固有値のスクリープロットを作成して
　（これ以外も見る）
　因子数を決定
　　　　→変数削除も
・初期解と共通性を求める
・因子軸の回転
　　　　→結果変換
・因子の解釈

因子分析における解の不定性
・因子分析：変数間の相関を利用して、
　変数を少数の因子にまとめる
・同じ相関行列から複数の解
　　→解の不定性
・まずは、初期解をもとめ、説明しやすいものを

不定性をとめる
・二次のせきりつ（二次のもーめんと）
---------------------------------
　三次のせきりつ（三次のもーめんと）

<HR>

■Rでの操作

library(psych)
#　　　　けっそく値を削除
bfi2<-na.omit(bfi[,1:25])
#　　　　とりあえずnfactorを１、fmはml（最尤法）
fa(bfi2,nfactors=1,fm="ml")
#　　　　スクリープロット
plot(fa(bfi2)$e.values,type='o')
#　　　　大きく下がる手前を選ぶ。固有値１以上
#　　　　因子数を５に,回転しない
fa(bfi2,nfactors=5,fm="ml",rotate="none")

#　　　　回転させるライブラリ
library(GPArotation)
#　　　　プロマックス回転
fa(bfi2,nfactors=5,fm="ml",rotate="promax")
#　　　　バリマックス回転
fa(bfi2,nfactors=5,fm="ml",rotate="varimax")

<HR>
■結果の見方
・h2共通性
・u2独自性
　　→回転しても同じ
・ML1,ML2・・因子

■削除する項目
・平均が極端な項目を削除
　　　→みんなが同じ回答
・因子負荷量（０．４未満）、共通性（０．３未満）を削除
・複数の因子から影響を受けている
・SEMのように残差を見て削除
・項目を削除すると、適切な因子数が変わることも！

<HR>

■項目削除のR操作

#1項目抜く
fa(bfi2[, -1], nfactors = 5, fm = "ml", roteto = "promax")

#2つ抜く
fa(bfi2[,c(-1,-24)], nfactors = 5, fm = "ml", roteto = "promax")

#１個ずつ抜いて、確認すること

<HR>

■バリマックス回転結果
・値が固まってきて、因子の内容わかる
　　　→単純構造

・一般にバリマックス回転よりも、プロマックス回転の方が明確になる

・なぜ、「バリマックス」というのか？
　　因子負荷量の９ばりあんす（分散）をMAXに
　　→最近あんまり使われなくなった
　　　因子と因子の間の相関を０に固定してるので

・プロマックス
　　因子間の相関を許容している

　　プロマックスの寄与、寄与率には２つの考えがあるが、
　　そちらではなく、初期解のプロマックスの寄与、寄与率

<HR>

■Rの因子得点

round(fa(bfi2[,-1],nfactors=5,fm="ml",roteto="promax")$scores[1:10,],2)

#1:10つけないと、いっぱい出てくる
#確認的因子分析でもpredictを使ってできる

<HR>

■手順のまとめ
・因子数：固有値、解釈できるか
・因子負荷量／共通性で観測変数を減らす
・報告すべき結果：プロマックス回転の結果
・各因子が何を表しているか：因子の命名

<HR>

■信頼性

・構成概念を測定するための測定道具の性能を示す指標の１つ
　　→もうひとつが妥当性

・信頼性：測定値の安定性

・測定値＝真値＋測定誤差
　→平均的にみれば、誤差０？
　→そこで、分散を求める

　信頼性＝真値の分散／測定値の分散

　信頼性が高い
　　　誤差の分散０に近い＝測定が安定
　　　真値の分散＝測定値の分散→信頼性１

　信頼性が低い
　　　信頼性の値は低くなる

　決定係数などと同じようなもの

・大問題
　でも、測定値は求められるが、
　真の値や誤差は求められない

　→別のテストを考える
　　　
　２つのテストとの相関：信頼性

・信頼性
　　再検査信頼性：別の時期の、同一のテスト
　　平行検査信頼性：別バージョン

・大問題
　　２回求める・・・１回で
　　折半信頼性→２個でなく４個に・・
　　　　＝α係数：すべての分け方の平均

　　ｎ　相関の合計
--------------------------
　n-1　項目数＋相関の合計

・α係数の問題点
　同じように測定しているという仮定：
　　むずかしい。
　→因子分析では、誤差は違うと仮定した

・因子分析の枠組みで信頼性を考える
　　→ω係数

・Rでは、alphaで求められる
・α係数＝内的整合性の指標
・他の信頼性とは、違う概念の指標
　　→一番妥当なのは、再検査信頼性
・一致係数：評定者間の整合性の指標

■妥当性
・本当に測りたいものが、測れているか？
　　→測定値の解釈に対する適切性

　信頼性が高く、妥当性が低いときがある

　適切性を保証するための証拠を提示する
　　→一般化可能性の側面の証拠：信頼性
　　　妥当性を示す証拠のひとつが信頼性
　　→外堀を埋めていく

ランキングに参加中。クリックして応援お願いします！

日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

アクセス
閲覧	892	PV
訪問者	605	IP
トータル
閲覧	34,478,100	PV
訪問者	8,502,224	IP
ランキング
日別	904	位
週別	400	位

	ブログを読むだけ。毎月の訪問日数に応じてポイント進呈
	gooブロガーの今日のひとこと
	訪問者数に応じてdポイント最大1,000pt当たる！
	goo blogは20周年を迎えました！

ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです（たま～にコンピューター関係も）