ウィリアムのいたずらの、まちあるき、たべあるき

ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も)

統計モデル その5 探索的因子分析(いわゆる因子分析)/信頼性と妥当性

2013-12-13 09:11:28 | AI・BigData

統計モデル その4 パス解析
http://blog.goo.ne.jp/xmldtp/e/883ff50a30dc1d864e9b0acd12b78e85

の続き。「統計モデル」の授業のメモメモ




■前回の復習

モデルの修正
・適合度を上げる
 →数値で示すこと可能
 →理論的に妥当な修正
・モデルを当てはめた結果=Σ
 SとΣの差を求める
  →大きいところ
 残差間(誤差間)の相関をいれてみる
・修正指数
 mi→カイ2乗の減少量予測
・パス解析
 関係の強さ
 因果の方向を知るのは難しい

・直接効果の解釈
 他の影響が一定/排除

・間接効果の解釈
 パス係数の掛け算

・総合効果
 直接効果+間接効果
 標準化の使い分け
  単位に意味あり→標準化しない

・潜在変数間のパス解析
 合計得点間のパス解析より、係数・相関大きくなる
  →希薄化の修正
 因子を使うと、飽和モデルでなくなることも

・等値制約
 複数のパス係数が等しい量であるとする制約

・誤差分散・誤差間共分散
  誤差分散を明示的に書くもの/書かないもの
   →lavvanは後者(勝手にやる)
    amosは前者
  誤差間共分散は書く
  誤差分散を等しくする場合はlavvanでも書く

・等値制約の影響
 標準化推定値が等値になるとは限らない
  →まず等値にならない

・修正係数
 誤差の共分散

・分散を1に固定
  f1~~1*f1
 因子負荷量を推定 NA*
 おなじにするequal

<HR>

■探索的因子分析(いわゆる因子分析)
・構成概念が定義することが難しい場合
  →名前を後からつける

・例:ビッグファイブ理論
  →おおよそ5つ

・信頼性と妥当性
  信頼性:同じ値が得られる
  妥当性:意図した構成概念を測定できているか

・探索的因子分析でわかること
  因子数がはじめわからない→決定する
  因子負荷量

・因子分析的考え方

・因子分析の言葉
  寄与
  回転

・寄与
 各因子が観測変数のすべての分散のうちの
 どれだけを説明するか
 各因子に注目
  →%で表現したり・・

・共通性
 寄与と混同しやすい
  共通性:観測変数に注目

Rによる探索的因子分析の手順
何回も行う
・固有値のスクリープロットを作成して
 (これ以外も見る)
 因子数を決定
    →変数削除も
・初期解と共通性を求める
・因子軸の回転
    →結果変換
・因子の解釈

因子分析における解の不定性
・因子分析:変数間の相関を利用して、
 変数を少数の因子にまとめる
・同じ相関行列から複数の解
  →解の不定性
・まずは、初期解をもとめ、説明しやすいものを

不定性をとめる
・二次のせきりつ(二次のもーめんと)
---------------------------------
 三次のせきりつ(三次のもーめんと)


<HR>

■Rでの操作

library(psych)
#    けっそく値を削除
bfi2<-na.omit(bfi[,1:25])
#    とりあえずnfactorを1、fmはml(最尤法)
fa(bfi2,nfactors=1,fm="ml")
#    スクリープロット
plot(fa(bfi2)$e.values,type='o')
#    大きく下がる手前を選ぶ。固有値1以上
#    因子数を5に,回転しない
fa(bfi2,nfactors=5,fm="ml",rotate="none")

#    回転させるライブラリ
library(GPArotation)
#    プロマックス回転
fa(bfi2,nfactors=5,fm="ml",rotate="promax")
#    バリマックス回転
fa(bfi2,nfactors=5,fm="ml",rotate="varimax")

<HR>
■結果の見方
・h2共通性
・u2独自性
  →回転しても同じ
・ML1,ML2・・因子

■削除する項目
・平均が極端な項目を削除
   →みんなが同じ回答
・因子負荷量(0.4未満)、共通性(0.3未満)を削除
・複数の因子から影響を受けている
・SEMのように残差を見て削除
・項目を削除すると、適切な因子数が変わることも!

<HR>

■項目削除のR操作

#1項目抜く
fa(bfi2[, -1], nfactors = 5, fm = "ml", roteto = "promax")

#2つ抜く
fa(bfi2[,c(-1,-24)], nfactors = 5, fm = "ml", roteto = "promax")

#1個ずつ抜いて、確認すること

<HR>

■バリマックス回転結果
・値が固まってきて、因子の内容わかる
   →単純構造

・一般にバリマックス回転よりも、プロマックス回転の方が明確になる

・なぜ、「バリマックス」というのか?
  因子負荷量の9ばりあんす(分散)をMAXに
  →最近あんまり使われなくなった
   因子と因子の間の相関を0に固定してるので

・プロマックス
  因子間の相関を許容している

  プロマックスの寄与、寄与率には2つの考えがあるが、
  そちらではなく、初期解のプロマックスの寄与、寄与率

<HR>

■Rの因子得点

round(fa(bfi2[,-1],nfactors=5,fm="ml",roteto="promax")$scores[1:10,],2)

#1:10つけないと、いっぱい出てくる
#確認的因子分析でもpredictを使ってできる

<HR>

■手順のまとめ
・因子数:固有値、解釈できるか
・因子負荷量/共通性で観測変数を減らす
・報告すべき結果:プロマックス回転の結果
・各因子が何を表しているか:因子の命名

<HR>

■信頼性

・構成概念を測定するための測定道具の性能を示す指標の1つ
  →もうひとつが妥当性

・信頼性:測定値の安定性

・測定値=真値+測定誤差
 →平均的にみれば、誤差0?
 →そこで、分散を求める

 信頼性=真値の分散/測定値の分散

 信頼性が高い
   誤差の分散0に近い=測定が安定
   真値の分散=測定値の分散→信頼性1

 信頼性が低い
   信頼性の値は低くなる

 決定係数などと同じようなもの

・大問題
 でも、測定値は求められるが、
 真の値や誤差は求められない

 →別のテストを考える
   
 2つのテストとの相関:信頼性

・信頼性
  再検査信頼性:別の時期の、同一のテスト
  平行検査信頼性:別バージョン

・大問題
  2回求める・・・1回で
  折半信頼性→2個でなく4個に・・
    =α係数:すべての分け方の平均

  n 相関の合計
--------------------------
 n-1 項目数+相関の合計

・α係数の問題点
 同じように測定しているという仮定:
  むずかしい。
 →因子分析では、誤差は違うと仮定した

・因子分析の枠組みで信頼性を考える
  →ω係数

・Rでは、alphaで求められる
・α係数=内的整合性の指標
・他の信頼性とは、違う概念の指標
  →一番妥当なのは、再検査信頼性
・一致係数:評定者間の整合性の指標

■妥当性
・本当に測りたいものが、測れているか?
  →測定値の解釈に対する適切性

 信頼性が高く、妥当性が低いときがある

 適切性を保証するための証拠を提示する
  →一般化可能性の側面の証拠:信頼性
   妥当性を示す証拠のひとつが信頼性
  →外堀を埋めていく

この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« NEC、パナは撤退したのに、な... | トップ | Wordファイル内の画像の解像... »
最新の画像もっと見る

AI・BigData」カテゴリの最新記事