goo blog サービス終了のお知らせ 

共分散構造分析

( ゜д゜) ふらふらー

ただ今,共分散構造分析を勉強中。
雪本さん的には「多変量解析の王様」と位置づけておりますので,従来の多変量解析である重回帰分析やら因子分析などを包括したものだという点を強調して学習を進めております。

んで,この共分散構造分析なるものは,それまでの多変量解析における「計算式の制約」を自在にいじくるものなので,共分散構造分析をきちんと理解するためには,数式展開で学習しなければならないなぁ,と痛感しております。

んで,数式展開などを学習中……正直涙が出そうです(T_T)

ひとまず,「RAM構造による数式表現」で学習を進めて,とっかかりはつかんだ感じではありますが……

ふぅ……大変です。
コメント ( 0 ) | Trackback ( 0 )

Tukey型多重比較(分散等質)

( ゜д゜) Tukey!

Tukey型の多重比較(等分散)についてです.

Tukey型の多重比較とは,単純なt検定の繰り返しは「甘い」ので,t分布の代わりに「厳しく」する「Student化された範囲q」分布を使おうというタイプの手法です.
※実際には誤差項を修正するなどありますが,それほど本質的ではありませんので略.

さて,一言でTukey法といっても,様々な種類があります.しかも面倒なことに,名前が一つ一つ異なっているので大変です.

最初に作られた(かどうかは確認を取っていませんが,発想としては基本的なので,かなり初期だろうと推測されます)のが<Tukey HSD(a)法>です.q分布を使って,多重比較をするときに,とにかく一番厳しい基準を【一律】で適用しようという発想です.これは悪くありません.今でも適切な方法として認められています.

さて,この厳しすぎるという点を何とか改善しようとして,多くの手法が考案されていくことになります.修正案の基本発想は,「多重比較のペアに応じて,厳しさを緩やかにすればいいんじゃない?」です.実際,以降のTukey型の多くはこのような発想で改善されています.「平均値の差が大きいペアは元々差があるのだから,平均値の差が小さいペアよりも,『【本当に】差があるかどうか』を厳しめに判定する必要がある」というように,「平均値の差」の情報を使うことになります.

<Student-Newman-Keuls法(SNK法)>もその一つです.「平均値」を順位化して,その「順位の差」をステップ数とみなして,基準を緩くしていこうというものです.雪本的には納得できるものであり,実際,【一昔】は認められていた方法です.ただし,雪本には分からない何らかの基準で調べてみると,この方法は,どうやら「ちょっと緩すぎる」というものらしいです.このため,今では不適切な手法と考えられています.

ただし,SNK法はおしかった手法なので,現在認められている多重比較でも,多少修正されて使われています.例えば,「ちょっと緩すぎる」SNK法を,「厳しすぎる」Tukey HSD法と組み合わせればいいのでは? こうして両者を平均化することで誕生したのが<Tukey WSD(b)法>です.この方法は現在でも認められていますが,ただし,あまり使われていません.

以上は,q分布をなるべく利用する方向で,Tukey HSD法を改良していった多重比較です.しかし,別の発想を使って改良したTukey型の多重比較があります.むしろ,現在ではこちらの方が良いとされているようです.

雪本的には,多重比較として「厳しく」するには三つの方法がある,と主張しています.すなわち,(1)統計量を厳しく,(2)分布を厳しく,そして,(3)有意水準を厳しくするです.別の発想の改良とは,(3)有意水準によって調整を行うというものです.

まあ,今,既に厳しい「Tukey HSD」方を「適切に緩くしていこう」と考えているわけですから,有意水準を調整することで「緩め」にするわけですね.

こうして開発された手法として,Duncan法があります.有意水準を以下の式で調整していきます.

 比較ペアpにおける有意水準α(p)=1-(1-全体α)^(p-1)

ただし,この修正式によるDuncan法は,よくわかりませんが認められていないそうです.
続いて別の修正式,Sidak不等式に基づく有意水準の調整を行うものが開発されました.

 比較ペアpにおける有意水準α(p)=1-(1-全体α)^(p/ペア総数)

この方法による多重比較法が<Tukey-Welch法(Q範囲量に基づく)>と呼ばれるものです.

(´-`).。oO(おそらくは,SPSSのREGWQとはこれだと思っています)

こんなふうに,一言で,Tukey法といってもとってもたくさんの手法があったりするわけですよ.
コメント ( 1 ) | Trackback ( 0 )

SPSSの多重比較

( ゜д゜) 周囲が頑張っているのに,雪本さんはマイペース…

多重比較の勉強で,SPSS搭載の多重比較をにらめっこ……
これまでは,SPSSの多重比較は種類が多すぎて,どのように違うかを整理できなかったのですが……

何となく,違いが分かってきたような気がします.

無論全部が全部ではないのですが……7割方は多少のコメントを出せるようになると思います……

(´-`).。oO(確実に,多重比較の知識が増えてゆくゆく)
コメント ( 0 ) | Trackback ( 0 )

対比

( ゜д゜) うっしっ!

ただ今,多重比較の勉強進行中なのですが,対比について,あれこれ資料を調べた結果,当初予定していたScheffe型だけでなく,Tukey型でも,そしてBonferroni型でも「対比」ができることがわかりました.

この場合の○○型というのは……

Scheffe型………算出された統計量を「変数の数-1」で割るタイプ
Tukey型…………「Student化された範囲の分布」を使うタイプ
Bonferroni型 …有意水準を検討ペア数で割った名義水準を使うタイプ

…という意味です.

そして,「対応あり」対応の対比の計算式がやっとわかりました.どうやら,この計算式を使えば,Scheffe型でも,Bonferroni型でも「対応なし」「対応あり」の両方で使えそうですな.

(´-`).。oO(ようするに,多重比較のまとめ図を修正する必要があるということです)
コメント ( 0 ) | Trackback ( 0 )

Holm法

( ゜д゜) コメント返しー

前回のBonferroni法に対するbobさんのコメントに刺激されて,書いちゃったりする雪本さん.

多重比較はたくさんの手法が開発されていますが,原理的に非常にシンプルで納得できるものは,文句なくBonferroni法でしょう.
統計法入門の教科書で多重比較を説明していても,Tukey法やらScheffe法など「著名度・効率性の良さ」の観点から,原理が難しい多重比較の手法から説明されています.これはだめだよー,というのが雪本さんの主張です.

最初は,非常に「分かり易い」Bonferroni法から初めよ! 私はそう問いつめたいっ!

さて,Bonferroni法で多重比較を理解してもらった後に,もう少し高度な多重比較を勉強されるのがベストなのであり,Bonferroni法の発展版であるHolm法を紹介したりします.

んと,その前にBonferroni法のやり方です.

Bonferroni法の手順
(1)全体の有意水準α,比較するペア数kを設定

(2)調整された有意水準α'を計算
  計算式:α'=α/k

(3)【全ての】ペアの有意差検定に対して,【一律に】α'を適用

(´-`).。oO(It's Simple !)

Holm法の手順
(1)全体の有意水準α,比較するペア数kを設定

(2)調整された有意水準α'を計算.計算式は以下の通り.
  一番厳しいα'=α/k
  次に厳しいα'=α/(k-1)
  次の次に厳しいα'=α/(k-2)
  (略)
  最後に厳しい(一番やさしい)α'=α

(3)ペアの有意性検定に基づく確率を計算.その確率の大きさに応じてα'を適用.
  「pが一番目に小さい有意性検定」に「一番厳しいα'=α/k」
  「pが二番目に小さい有意性検定」に「次に厳しいα'=α/(k-1)」
  「pが三番目に小さい有意性検定」に「次の次に厳しいα'=α/(k-2)」
   (略)
  「pが一番大きい有意性検定」に「最後に厳しい(一番やさしい)α'=α」

  たーだーしっ! 適用していく過程で「p<α'」で【なくなった】時に中断する!

こんな感じに,「できるやつ(pが小さいやつ)には厳しく応じ,あんまりできないやつには手心加える」と人情味あふれるのがHolm法の発想なのですよ……
ちなみにBonferroni法の場合「できるやつにも,あんまりできないやつにも,厳しく指導する」となります.

ちょっと,かっこいいやつなんです……Holm法ってやつは……

Θ・)ノ「その後に作られたやつも,これを継承しているんですけどね」

コメント ( 5 ) | Trackback ( 0 )

Bonferroni法の調整された有意水準

( ゜д゜) 暑いよー

有意水準調整型の多重比較の最も基本形「Bonferroni型」が実際に統制をしている証拠です.

 変数 総ペア数  各α	各(1-α)  同時(1-α)
  3    3   0.0167  0.9833   0.9508
  4    6   0.0083  0.9917   0.9510
  5   10   0.0050  0.9950   0.9511
  6   15   0.0033  0.9967   0.9511
  7   21   0.0024  0.9976   0.9512
  8   28   0.0018  0.9982   0.9512
  9   36   0.0014  0.9986   0.9512
  10   45   0.0011  0.9989   0.9512
  15   105   0.0005  0.9995   0.9512
  20   190   0.0003  0.9997   0.9512
  25   300   0.0002  0.9998   0.9512
コメント ( 2 ) | Trackback ( 0 )

尺度構成法

( ゜д゜) いろいろあるある

量的データ解析法(統計法)だけに限らず,量的or質的なデータ収集法(研究法)&解析法にどんどんと興味対象を広げている雪本さん.まあ,広い意味では,「研究orデータをどのように『評価』するか?」という,私の研究テーマ「評価」に含まれているので問題なしなのですよ?

で.

統計の教科書に普通に解説されているような統計手法だけではなく,精神物理学的測定法(尺度構成法含む)などを勉強しています.

( ゜д゜) いろいろあります

楽しいもんですな.

さて.

尺度構成法はどうやら大雑把に三つに分けて考えるとよろしげです.

1)総比較タイプ
 順位法の改良型

2)一対比較(method of paired comparison)タイプ
 Thurstone法による一対比較
 Scheffe法による一対比較

3)単一刺激タイプ
 (刺激項目【間】の情報を考慮しない)
   サーストンの等現間隔法(method of equal-appearing interval)
   リッカートの尺度算出法(簡易版「評定加算法」含む)
 (刺激項目【間】の情報を考慮する)
   サーストンのカテゴリ判断の法
   エドワード&サーストンの系列間隔法

幸い,計算式があるので,久々にExcelテンプレート作成に燃える雪本さんがここにいますっ!

以前こっそりと,bobさんからメールで「サーストン流の一対比較法」のテンプレートをもらっていました.あまりの使い勝手の良さに,同じくExcelテンプレート作成をしている雪本さんは随分とへこんでしまったものです(笑

でも,今回,そのリベンジ……というわけでもないですが,「シェッフェ流の一対比較」のテンプレート作成にがんばりますよ,ええ(実は途中まで作ってたりします).
コメント ( 1 ) | Trackback ( 0 )

判別分析の種類

( ゜д゜) SPSSで遊ぶー

判別分析なるものを自分の中で整理しているのですが,どうやら一言で判別分析と言っても計算手法で種類があるようです.

(1)Fisherの線形判別分析
(2)マハラノビス距離を使った判別分析
(3)正準相関分析を使った正準判別分析
etc

最初に開発されたのは,(1)です.Fisherさんは,統計学ではかの有名な「分散分析」を開発した人です.この分散分析の原理を使って判別分析を行ったものが(1)なわけです.最初に作られたので,まあ,それなりに説明はすっきりしています.
(1)にしろ,(3)にしろ,群を判別する場合に「直線」状の判別基準があると想定しています.でも,データによってはこのような想定は不適切な場合があります.そこでそのような想定を置かないものとして(2)が開発されました.
(3)SPSSに登載されている判別分析です.いや,まあFisherの判別関数もオプションで出せるそうですが…….正準相関分析といういささかマイナーは多変量解析を応用しているので,少しばかり結果解釈にコツがいります.

 判別基準が直線状であると仮定する  → Fisherの線形判別分析,正準判別分析
 判別基準が直線状であると仮定しない → マハラノビス距離による判別分析

……ただ,ちょっと面白いというか,奇妙なことに,SPSSでは,正準判別分析はあるのに,その元となっている正準相関分析が実行できない……みたいです……

(´-`).。oO(へんなの)
コメント ( 0 ) | Trackback ( 0 )

多変量解析の整理図

( ゜д゜) 週末の勉強成果

暫定版ですのでひっそりと修正するかもしれません.
しかし,大分頭をひねって整理してみた図です……

 ┏━━━━━━━━━≪因果追求型多変量解析≫━━━━━━━━━┓
 ┃┌──────(相関係数がベースの統計解析法)──────┐┃
 ┃│ 【原因が量的変数】  【原因が質的変数】        │┃
 ┃│┌────────┐ ┌────────┐【結  果】 │┃
 ┃││  判別分析  │⇒│ 数量化理論Ⅱ類 │【  が  】 │┃
 ┃│└────────┘ └────────┘【質的変数】 │┃
 ┃│    ↓↑         ↓↑           │┃
 ┃│┌────────┐ ┌────────┐【結  果】 │┃
 ┃││  重回帰分析  │⇒│ 数量化理論Ⅰ類 │【  が  】 │┃
 ┃│└────────┘ └────────┘【量的変数】 │┃
 ┃│    ↓↑              ┌──┐    │┃
 ┃│    ↓↑      (諸々の手法)─┘  ↓    │┃
 ┃│┏━━━━━━━━┓        ┏━━━━━━━━┓│┃
━╋┿┫ 正準相関分析 ┣━━━━━━━━┫ 共分散構造分析 ┣┿╋━
 ┃│┗━━━━━━━━┛        ┗━━━━━━━━┛│┃
 ┃│    ↓↑      (諸々の手法)─┐  ↑    │┃
 ┃│    ↓↑              └──┘    │┃
 ┃│┌────────┐ ┌────────┐       │┃
 ┃││  主成分分析  │⇒│ 数量化理論Ⅲ類 │       │┃
 ┃│└────────┘ └────────┘       │┃
 ┃│    ↓↑       【質的変数】         │┃
 ┃│┌────────┐                  │┃
 ┃││  因子分析  │                  │┃
 ┃│└────────┘                  │┃
 ┃│  【量的変数】                     │┃
 ┃└────────────────────────────┘┃
 ┃┌───── <類似性の分析結果を空間的に表現> ─────┐┃
 ┃│      ┌────────┐            │┃
 ┃│      │ クラスター分析 │【類型論的に空間表現】 │┃
 ┃│      └────────┘            │┃
 ┃│      ┌────────┐            │┃
 ┃│      │多次元尺度構成法│            │┃
 ┃│      ├────────┤【特性論的に空間表現】 │┃
 ┃│      │ 数量化理論Ⅳ類 │            │┃
 ┃│      └────────┘            │┃
 ┃└──── (相関係数がベースではない統計解析法) ────┘┃
 ┗━━━━━━━━━≪構造探索型多変量解析≫━━━━━━━━━┛

コメント ( 0 ) | Trackback ( 0 )

有意水準調整型の多重比較

( ゜д゜) 自分自身に送るメモ書き~

心理学専攻生にとって必須の学習統計知識・技能の一つに「多重比較」が挙げられます.多重比較,そして分散分析は,t検定の改良版であり,いわゆる「差異の統計法」の分類されるものです.

間隔尺度における多重比較法がt検定の改良版であるという意識はあまり浸透していないようですが,この考えは重要なので是非知っておくと良いと思います.

そして多重比較法がt検定の改良版であるとして,【どのように改良したか?】が問題となるでしょう.結論を先に言えば,(1)統計量の観点から(Scheffe法など),(2)分布の観点から(Tukey法など),そして(3)有意水準の観点から(Bonferroni法など),の三つの観点から改良を行っており,多数の多重比較が開発されています.

雪本自身は,最後の(3)の多重比較が好きです.むしろ,愛していると言っても良い!

さて,そんな愛すべき「有意水準調整型の多重比較法」ですが,微妙に複数のタイプがあります.どんな風に有意水準を調整するかという話なのですが,難しい話はわかりません.ともかく,有意水準を調整する場合に,いくつかの発想の仕方があるそうです.

○ボンフェローニ(Bonferroni法)の不等式:Bonferroniの方法,Holmの方法,Schafferの方法
 ※Ryanの方法もここに分類されるのかな?
 「対応なし/あり」データのいずれでも使える優れもの.

○シダック(Sidak)の不等式:Sidakの方法,Holladn-Copenhaverの方法
 対応なしデータには成立することは証明されているが,対応ありデータの場合には,シダックの不等式が必ずしも成立しないことが明らかになっている.

○シムズ(Simes)の不等式:Hochbergの方法,Hommelの方法,Romの方法
 各p値が独立である場合にしか数学的に成立することが証明されていない.つまり「対応なし」データには適用できることは証明されているが,「対応あり」データにも成立するかどうかは証明されていない(適用できるかもしれないし,できないかもしれない).

実は,対応なしデータの多重比較法には,この他にも優れたものがあるのですが,対応ありデータの多重比較は,上記の検定法ぐらいしか使えません(その他の方法は基本的に「対応なし」を前提にして開発されています).
しかし,シダック不等式,シムズ不等式は「対応あり」データに対して使うには,いまいち不安なので,ボンフェローニの不等式に基づく多重比較法をおすすめします.

(´-`).。oO( I love Ryan procedure ... )
コメント ( 0 ) | Trackback ( 0 )

二要因χ2検定

( ゜д゜) GWあけました.おひさしー

すごい久しぶりの投稿です.
早速本題ですが,雪本さん的には,名義尺度(三カテゴリ以上)における二要因の差異の統計法は「対数線型モデル分析」を使用すべきだと以前説明しています.

でも……

対数線型モデル分析というのは,χ2検定の改良版統計法なのです.χ2検定が適用できるデータに対数線型モデル分析が適用されます.
そうすると,対数線型モデル分析が適用可能な「二要因三カテゴリ以上データ」も,逆にχ2検定が適用できるのではないか? と考えるのは結構普通だと思います.

で,調べてみました.χ2検定が使えるかどうか,を.

結論を言えば,ちょっと無理っぽいと言う感じでした.

いえ,χ2検定を適用することはできるんです.問題なのは,下位検定ができないということです.
三カテゴリ以上の場合,従属変数は「比」として表現されています.名義尺度三カテゴリ以上データの分析法とは,比の差異の統計法を意味します.その場合,分散分析と同様に,「大雑把な全体の有意性→詳細な下位検定」という分析の流れが必要になるのですが,χ2検定では,「大雑把な全体の有意性」を検討することはできるのですが,「詳細な下位検定」を調べることができません.

二要因なので,A要因の主効果,B要因の主効果,A×Bの交互作用が影響因となります.一応,【Lancaster法によるχ2検定】を使えば,上記の影響因の有意検定を行えます.

ただし,有意であった場合,その後の下位検定がつながりません……と教科書などでは書かれています.主効果は多重比較を行えば良いのでしょうが,問題は交互作用の下位検定です.比データの場合,交互作用をどのように考えるかが議論となっているようです.

一応,要因を落としてχ2検定を行う,という案が浮かびましたが,この方法が適切かどうかは不明です.

(´-`).。oO(でも,この方法はだめなんじゃないかなぁ?)

というわけで,χ2検定を使って,二要因三カテゴリ以上データを分析すると,中途半端になってしまいます.
コメント ( 0 ) | Trackback ( 0 )

分散分析系の整理図(中級編)

( ゜д゜) お久しぶり~

今回は,初学者編の整理図の一部を拡張してみることにしましょう.
初学者レベルの統計法学習者に「差異を調べる統計法とは何か?」と質問すると……

<初級者の差異統計法の整理図>

    (基本)(拡張)
(量的)t検定 分散分析(+多重比較)
(質的) χ2検定(+残差分析)

という,「量的/質的」,「基本/拡張」の二視点から構成される整理図を描くようになるのではないでしょうか?
しかし,これだけでは,分析法としては十分ではないと考える人は,分散分析系の統計法を学習することになります.これまた,非常に多くの統計手法が開発されているのですが,それらを使い分ける「視点」を明確化することが必要になります.

<中級者の分散分析系の整理図>

            (一要因二水準)    (一要因三水準以上)
(間隔尺度 (対応なし)対応なしt検定     一要因(対応なし)分散分析
 比率尺度)(対応あり)対応ありt検定     一要因(対応あり)分散分析
               (二要因)
      (対応なし×なし)二要因(対応なし×なし)分散分析
      (対応なし×あり)二要因(対応なし×あり)分散分析
      (対応あり×あり)二要因(対応あり×あり)分散分析

            (一要因二水準)    (一要因三水準以上)
(順序尺度)(対応なし)マン・ホイトニー検定  クラスカル・ウォリス検定
      (対応あり)符号検定        フリードマン検定
               (二要因)
      (対応なし×なし)×
      (対応なし×あり)×
      (対応あり×あり)×

            (一要因二水準)    (一要因三水準以上)
(名義尺度 (対応なし)百分率の差の検定    χ2検定
 2カテ  (対応あり)マクニマー検定     コクランQ検定
   ゴリ)         (二要因)
      (対応なし×なし)逆正弦変換法によるχ2分散分析
      (対応なし×あり)×
      (対応あり×あり)×

            (一要因二水準)    (一要因三水準以上)
(名義尺度 (対応なし)χ2検定         χ2検定
 3カテ  (対応あり)(×)         ×
 ゴリ以上)         (二要因)
      (対応なし×なし)対数線形モデル分析
      (対応なし×あり)×
      (対応あり×あり)×

視点としては,「間隔・比率尺度/順序尺度/名義尺度(2カテゴリ/3カテゴリ以上)」,「対応なし/対応あり」,「一要因二水準/一要因三水準以上/二要因以上」であり,これを組み合わせることで適切な統計法を選択することができるでしょう.
コメント ( 0 ) | Trackback ( 0 )

整理図の応用例

(´-`).。oO(朝に投稿する癖をつけたいなぁ)

統計法を勉強する場合には、個別の道具を知るとともに、使い分けの視点も学習する必要がある。その視点とは、①記述/推測、②量的/質的、③差異/類似、④基本/拡張、(⑤対応無/有)である……

まあ、この辺まではすらすらと言えるようになって下さい。その視点が具体的にどのようなものなのかですが、すでに私のホームページのここで説明しています。というより、基礎部分はここでおおよそ説明しているんですが……

今回は少し先の話をしましょう。上記のページの学習が済んだ、つまりは初学者の第一段階が終わったとします。
それで満足できる人はそこで終わっても構いませんが、他の道具を体系的に勉強したいというのであれば、学習した統計基礎を土台として、次の段階に進みましょう。
実は、いくつかの方向性があります。

①<差異の統計法>学習の発展:分散分析系の道具を勉強します
②<類似の統計法>学習の発展:相関・連関や、偏○○などのオプションを勉強します
③<多変量解析>の学習の発展:重回帰分析や因子分析と関連させながらその他を勉強します
④<分布論>の学習の発展:基礎では省略していた分布論を実務の観点から勉強します
⑤<クロス表分析>の学習の発展:χ2検定と関連させながらその他を勉強します。

当たり前ですが、すでに学習した知識を利用しながら勉強を進めるべきですね。学習の発展を行うことによって、新しい統計法を学べるとともに、それとの対比によって、すでに自分の知っている統計法の特徴が浮き彫りになっていきます。

例えば、多変量解析の「因果追求型」の手法として、重回帰分析をはじめとして、判別分析、数量化理論一類、数量化理論二類の手法があげられます。これらの手法を勉強した人は、それなりにいるかもしれませんが、その人たちの中で、重回帰分析と関連させながら、各手法を説明することができる人はどのぐらいでしょうか?

重回帰分析は「量的→量的」の分析法です。これに対して判別分析は「量的→質的」の分析法です。この辺から、判別分析とは、目的変数が質的データにおける重回帰分析のようなものだ、と説明する人は、それなりにいると思います(多変量解析の初学者であれば、このアナロジーができることが目標レベルとなります)。このアナロジー的発想は僕も好んで使っており、この説明には文句がありません。しかし、重回帰分析との関連を述べるならば、これだけではないのです。

判別分析では、目的変数のカテゴリデータを分類するための直線を設定するのですが、判別分析とは、この判別直線を重回帰分析で求めることになります。なので、重回帰分析のプログラムがあれば、判別分析を「なんとか」できるのです(簡単にできるとは言いませんが)。

この辺の数理的側面に踏み込むのは、初学者にとっては「過分の領域」ですが、ともあれ、新しい道具も、既存の道具との関連性から学習を進めるべきでしょう。
コメント ( 0 ) | Trackback ( 0 )

整理図における「視点」

統計法学習を始める場合には「整理図」を土台とすることをおすすめする、というのが前回の主張でした。

整理図には、いろいろなデータ解析の道具が書かれています。統計法初学者の方は、表に書かれている道具をまずは勉強して下さい。その際に注意してほしいことは、不必要に過分な知識を学習しないことです。

統計法(学)は、学問として体系化されており、初学者がちょっと勉強したからといって、それほど簡単に学べるほど甘くありません。その時々の自分のレベル・関心に応じて、「最低限知っておきたい水準」を設定して、その水準を過分に超えて無理に勉強しないようにしましょう。
その過分知識の代表が正規分布をはじめとした「分布論」です。数理的立場の統計学の教科書などでは、この分布論を基礎としてたっぷりと綿密な説明がされています。がっ! 実用家の立場にとっては、この分布論の知識は難しい割には、実用上はそれほど有用ではなかったりします。分布論は、統計学という学問体系の中では非常に重要なのですが、学問的に価値がある=実用的に価値がある、とは言えません。(このため、整理図には分布論に関する道具をばっさりと削っています)

さて、整理図で個々の道具を勉強してもらうわけですが、それと同時に身につけなければならないのが、整理図に示されている4つの視点です。すなわち……

①記述/推測:記述だけか、あるいは推測もするのか?
②質的/量的:数量データか、あるいはカテゴリデータか?
③差異/類似:差異を調べるのか、類似性を調べたいのか?
④基本/拡張:データの変数の数は2だけか、それよりも多いのか?

統計法を理解するためには、これらの視点を意識化させながら、個別の道具がこの視点でどのように位置づけられるかを考えていく必要があります。
例えば、t検定という道具は、①推測+②量的+③差異+④基本、として位置づけられるようになります。また、分散分析は、、①推測+②量的+③差異+④拡張となり、t検定と分散分析とは、2変数に対して使われるものか(t検定)、あるいは3変数以上に対して使われるものか(分散分析)と道具同士の関係をきちんと理解することができるようになります。

※実際には、もう一つの視点「対応無/有」というものがありますが、今は省略です。
コメント ( 0 ) | Trackback ( 0 )

統計法初学者の整理図

( ゜д゜) あい、おはようござーい。

実用家が道具としての統計法を勉強する場合は、体系的な枠組みを使って学習を進めるのがよい、というのが前回のお話でした。

ただし、この場合の学習には条件が付きます。つまり、「統計法について特別十分な納得ができなくとも構わない。ひとまず個別の統計解析法がある程度使えるようになりさえすればよい」という考えの人であるならば、これからダラダラと説明する学習法をおすすめしません。「自分で納得して、体系的に統計法を自分のものとしたい」、という人に対して、奨める学習方法です。

雪本的な統計法学習法のポイントとして、実用家の観点から考える、「体系的な枠組み」考える、スモールステップ(ゆっくり着実に)考える……などがあげられます。

あんまり引っ張るのも何なので、「体系的な枠組み」を紹介します。この枠組みは、必ずしも統計法教育で公認というものではなく、雪本フィルターがかかったものではありますが、大いに役立つものだと自信はあります。

――――――――――― 「統計tool」統計法整理図 ―――――――――――

     ≪記述≫          ≪推測≫
              <基本>       <拡張>

 【量的尺度】
  (代表)平均値     (差異)t検定   ⇒⇒ 分散分析+多重比較
  (散布)分散(標準偏差) (類似)相関係数  ⇒⇒ 多変量解析
                          因果追求:重回帰分析
                          構造探索:因子分析
       ※【量×質】(類似):相関比

 【質的尺度】
  (代表)最頻度(比率)  (差異)χ2検定+残差分析
  (散布)情報量     (類似)連関係数

――――――――――――――――――――――――――――――――――――

(´-`).。oO(「統計tool」と書いてあるのは、今は気にしない)

上記整理図に、いろいろなデータ解析の道具(統計法)が書かれています。「平均」「分散(標準偏差)」「最頻値(比率)」「情報量」「t検定」「相関係数/分析」「分散分析」「多重比較」「重回帰分析」「因子分析」「χ2検定」「残差分析」「連関係数/分析」「相関比」がそうです。

本屋に行って、統計法の教科書などを見てみると、これを含めてたくさんの道具が紹介・説明されています。数理的立場の統計学の教科書では、分布に関する様々な説明が丁寧にされていたりします。コンピュータ統計的立場のハウトゥーものであれば、さらにたくさんの道具の解析がされています。

にもかかわらず、なぜ、上記の道具だけに絞って、この整理図を用意したのか?

一つは、ここに挙がっている道具は非常に代表的なものといえるからです。ひとまずこれだけ知っていれば、データ解析をする場合に「なんとか」なります。

二つ目に、この整理図には、統計解析の道具を使い分ける上で重要な「選別基準」が盛り込まれています。(これはいずれ話します)

三つ目に、ここに挙がっている道具がその他の道具を理解するために、必要となる前提知識、あるいは非常に参考となる知識の道具だからです。

体系的に勉強する機会がない実用家の場合、どのように学習を進めていけば、体系的な知識を得られるかわからないと思いますが、上記枠組みを使った体系的な統計法学習法をみなさんに、これからちまちまと紹介していこうと思います。
コメント ( 0 ) | Trackback ( 0 )
« 前ページ 次ページ »