現在【いろいろな意味で余裕があれば】の条件で公開相談を受付中。即効性のある相談にはのれないので注意。
独学のすスめ
効果的な統計学習・教授法とは?
( ゜д゜) 日本人は醤油味
今週末に,私的な研究会でちろっと発表をすることになっております。
その研究会の趣旨からすると,正直相応しくないテーマだと思うのですが,発表の機会を与えて下さったので,自分なりに精一杯やりたいと思います。
テーマは「効果的な統計法の教授・学習についての考察」みたいなものです。
僕のホームページやブログを見ている人にとっては「バカの一つ覚えみたいに…」と思われるかもしれませんが。すみません。
( ゜д゜) 雪本はまだまだ統計法というものが好きなのです。
最近は,量的分析法としての統計法だけではなく,それと対比されることが多い「質的分析法」についても関心を広げつつあります。
KJ法やグラウンデッド・セオリーなど比較的体系化されたものであっても,なかなか難しいです。
分析法を学習するという場合,雪本流には,三つのポイントに注意する必要があります。
①分析法そのものの知識・使い方
②分析法全般の中での位置づけ(他の分析法と比べての共通点・相違点について)
③その分析法が適用できるまでのデータの加工法
一般に統計解析法などの量的分析法を学習するといった場合,①の観点に力点を置かれ過ぎている気がします。よく「統計ソフトで○○という分析法は使えるようになった。どんな時に使えばいいかある程度わかる」といったレベルの人が,発展的な勉強を行う場合の多くは,②や③のポイントを勉強しようとするのではなく,①の深化,すなわち数学的な理解に【のみ】こだわってしまうことです。
決して,数学的理解をすることは悪くありませんが,実践的に統計法を使うという場合は①・②・③を全般的に勉強しなければなりません。①をどれだけ深化して学習しようとも,②や③の知識が不足していたのでは,統計法の実務家としては優秀とは言えないのです。
……とまあ,こんな話を下敷きにして,多重比較法を題材にして統計学習・教授法について少しばかり語っちゃおうと思っているわけです。
(´-`).。oO(やっぱり自分は「教える」という行為が好きなことを実感します)
今週末に,私的な研究会でちろっと発表をすることになっております。
その研究会の趣旨からすると,正直相応しくないテーマだと思うのですが,発表の機会を与えて下さったので,自分なりに精一杯やりたいと思います。
テーマは「効果的な統計法の教授・学習についての考察」みたいなものです。
僕のホームページやブログを見ている人にとっては「バカの一つ覚えみたいに…」と思われるかもしれませんが。すみません。
( ゜д゜) 雪本はまだまだ統計法というものが好きなのです。
最近は,量的分析法としての統計法だけではなく,それと対比されることが多い「質的分析法」についても関心を広げつつあります。
KJ法やグラウンデッド・セオリーなど比較的体系化されたものであっても,なかなか難しいです。
分析法を学習するという場合,雪本流には,三つのポイントに注意する必要があります。
①分析法そのものの知識・使い方
②分析法全般の中での位置づけ(他の分析法と比べての共通点・相違点について)
③その分析法が適用できるまでのデータの加工法
一般に統計解析法などの量的分析法を学習するといった場合,①の観点に力点を置かれ過ぎている気がします。よく「統計ソフトで○○という分析法は使えるようになった。どんな時に使えばいいかある程度わかる」といったレベルの人が,発展的な勉強を行う場合の多くは,②や③のポイントを勉強しようとするのではなく,①の深化,すなわち数学的な理解に【のみ】こだわってしまうことです。
決して,数学的理解をすることは悪くありませんが,実践的に統計法を使うという場合は①・②・③を全般的に勉強しなければなりません。①をどれだけ深化して学習しようとも,②や③の知識が不足していたのでは,統計法の実務家としては優秀とは言えないのです。
……とまあ,こんな話を下敷きにして,多重比較法を題材にして統計学習・教授法について少しばかり語っちゃおうと思っているわけです。
(´-`).。oO(やっぱり自分は「教える」という行為が好きなことを実感します)
コメント ( 2 ) | Trackback ( 0 )
名義尺度データは「対応あり」に弱い
( ゜д゜) 後期が始まっての一週間
やはり,日常業務が増えてくるなぁ……
それはそれとしての「拡張マクニマー検定」についてです。
統計toolシリーズのどれに組み込もうかと悩んだのは先日ですが,選択肢としては,以下のもの。
①統計tool
②+分散分析tool
③クロス表分析tool(未公開)
まあ,「+分散分析tool」に組み込むのは普通なので,現在組み込み作業中です。どの部分に組み込むかというと,「二水準の検定法」(名前うろ覚え)の部分です。
※マクニマー検定とは,従属変数が「名義尺度【2】カテゴリ」の場合の【二】水準の有意差の分析法です。そして拡張マクニマー検定とは「名義尺度が【2以上】カテゴリ」の【二】水準の有意差の分析法です。従属変数のカテゴリ数は増えますが,二水準の有意差検定である点は変わりません。
クロス表分析にも組み込む予定です。
しかし,基本形である「統計tool」には組み込まない方針です。質的データ分析法は「対応ありデータの分析法が不十分」であるという現実があります。なので,安易に基本形に組み込んでしまうと「なーんだっ! 名義尺度データでも「対応あり」も普通に分析できちゃうんだ。だったら,名義尺度とか間隔尺度とかにこだわらずにデータ収集をしちゃえ」などと思いこまれるととんでもないことになります。
名義尺度データの分析法は「対応あり」には弱いっ!
この現実を認識する必要があります。
というわけで。「統計tool」には組み込まない予定なのですな。
やはり,日常業務が増えてくるなぁ……
それはそれとしての「拡張マクニマー検定」についてです。
統計toolシリーズのどれに組み込もうかと悩んだのは先日ですが,選択肢としては,以下のもの。
①統計tool
②+分散分析tool
③クロス表分析tool(未公開)
まあ,「+分散分析tool」に組み込むのは普通なので,現在組み込み作業中です。どの部分に組み込むかというと,「二水準の検定法」(名前うろ覚え)の部分です。
※マクニマー検定とは,従属変数が「名義尺度【2】カテゴリ」の場合の【二】水準の有意差の分析法です。そして拡張マクニマー検定とは「名義尺度が【2以上】カテゴリ」の【二】水準の有意差の分析法です。従属変数のカテゴリ数は増えますが,二水準の有意差検定である点は変わりません。
クロス表分析にも組み込む予定です。
しかし,基本形である「統計tool」には組み込まない方針です。質的データ分析法は「対応ありデータの分析法が不十分」であるという現実があります。なので,安易に基本形に組み込んでしまうと「なーんだっ! 名義尺度データでも「対応あり」も普通に分析できちゃうんだ。だったら,名義尺度とか間隔尺度とかにこだわらずにデータ収集をしちゃえ」などと思いこまれるととんでもないことになります。
名義尺度データの分析法は「対応あり」には弱いっ!
この現実を認識する必要があります。
というわけで。「統計tool」には組み込まない予定なのですな。
コメント ( 0 ) | Trackback ( 0 )
拡張マクニマー検定
( ゜д゜) まにまに~
拡張マクニマー検定を勉強しました。
感想は,「まさにマクニマー検定の拡張版だ!」と思いました。
さて,これをどの統計toolシリーズに組み込もうかな?
拡張マクニマー検定を勉強しました。
感想は,「まさにマクニマー検定の拡張版だ!」と思いました。
さて,これをどの統計toolシリーズに組み込もうかな?
コメント ( 1 ) | Trackback ( 0 )
種々の割合データの統計法の関連性
( ゜д゜) 愛と憎しみと割合と(謎w
うん.次回の大学紀要ネタですが,名義尺度版の「多重比較」に限定するのではなく,もう少し広く,多重比較を含めて「差異の検定法」について触れること決めました.
少なくとも現在の構想では.
今のところ「逆正弦変換法によるχ2分散分析」を勉強していますが,これとχ2検定や,0/1値データの分散分析と,何が違うのか,その関連性について考えてみたいと思います.
以前から心がけていることですが,今の統計教育は,個別の統計法の説明はするのですが,その他の統計法との関連性あまり意識化しません.
そのため「割合データを与えられたときに,χ2検定をすればよいのか,逆正弦変換法のχ2分散分析をすればよいのか,あるいは0/1データの分散分析をすればよいのか? どんなときにそれを使い分けるようにすべきなのかの『使用上の注意』が分からない」と悩んでしまうでしょう.
とりあえず,これら三種類の統計法の関係性について調べてみることにします.そして,その関連性をどのように学習者に教授すればよいか,その方法を考えることにしましょう.
うん.次回の大学紀要ネタですが,名義尺度版の「多重比較」に限定するのではなく,もう少し広く,多重比較を含めて「差異の検定法」について触れること決めました.
少なくとも現在の構想では.
今のところ「逆正弦変換法によるχ2分散分析」を勉強していますが,これとχ2検定や,0/1値データの分散分析と,何が違うのか,その関連性について考えてみたいと思います.
以前から心がけていることですが,今の統計教育は,個別の統計法の説明はするのですが,その他の統計法との関連性あまり意識化しません.
そのため「割合データを与えられたときに,χ2検定をすればよいのか,逆正弦変換法のχ2分散分析をすればよいのか,あるいは0/1データの分散分析をすればよいのか? どんなときにそれを使い分けるようにすべきなのかの『使用上の注意』が分からない」と悩んでしまうでしょう.
とりあえず,これら三種類の統計法の関係性について調べてみることにします.そして,その関連性をどのように学習者に教授すればよいか,その方法を考えることにしましょう.
コメント ( 0 ) | Trackback ( 0 )
逆正弦変換法によるχ2分散分析(三要因)の計算法(統計tool使用)
( ゜д゜) 思わず作ってしまった。多分合っているはず。
「逆正弦変換法によるχ2分散分析」の続きです。先程,分散分析の計算プログラムを使えば,結構簡単にできることがわかりました。
つーか,あれって,三要因もできそうでないか? つーわけで,さっさかさーと,試してみました。
だいたい,こんな感じだろう,と思う雪本さん!
なぜに逆正弦変換法なるものをするのか?
①百分率(割合)データを,より正規分布データに近づける作用がある.
②郡内分散とは,各セルの分散を意味しているが,「821÷人数」によって算出されるので,セル人数が同質であれば,各セルの分散も同質となる.
分散分析の前提条件として,①正規分布性,②各水準の分散の等質性がありますが,逆正弦変換法を使うと,この二つの条件を満たす(かなり満たす可能性が高くなる)ようになるわけですね.
(´-`).。oO(当然,一要因もできます。次回にでも説明します)
「逆正弦変換法によるχ2分散分析」の続きです。先程,分散分析の計算プログラムを使えば,結構簡単にできることがわかりました。
つーか,あれって,三要因もできそうでないか? つーわけで,さっさかさーと,試してみました。
Ⅰ.データ変換の段階 □生データ:%データ │ │ │ │ a1 │ a2 │ ├────────┼────────┤ │ b1 b2 │ b1 b2 │ ───┼────────┼────────┤ c1 │ 0.5 0.6 │ 0.4 0.3 │ c2 │ 0.7 0.9 │ 0.7 0.6 │ ───┴────────┴────────┘ (各セルの人数はn=10) □逆正弦変換(角変換)後のデータ │ │ │ │ a1 │ a2 │ ├────────┼────────┤ │ b1 b2 │ b1 b2 │ ───┼────────┼────────┤ c1 │ 45.00 50.77 │ 39.23 33.21 │ c2 │ 56.79 71.57 │ 56.79 50.77 │ ───┴────────┴────────┘ Ⅱ.統計ソフト(例:統計tool)を使って二要因(対応あり×あり)分散分析の実行 ┌───┬───────┬───────┬ │ │ a1 │ a2 │ │ ├───┬───┼───┬───┼ │ │ b1 │ b2 │ b1 │ b2 │ ├───┼───┼───┼───┼───┼ │No.01 │ 45.00│ 50.77│ 39.23│ 33.21│ ├───┼───┼───┼───┼───┼ │No.02 │ 56.79│ 71.57│ 56.79│ 50.77│ ├───┼───┼───┼───┼───┼ ◇二要因(対応あり×あり)分散分析の結果☆ ────────┬──────────────────── 変動因 │ SS df MS F ────────┼──────────────────── 被験者S │ 572.92 1 572.92 要因A │ 243.35 1 243.35 304.27 誤差AS │ 0.80 1 0.80 要因B │ 9.04 1 9.04 0.89 誤差BS │ 10.14 1 10.14 交互作用AB │ 132.73 1 132.73 13.09 誤差ABS │ 10.14 1 10.14 ────────┼──────────────────── 全体 │ 979.13 7 34.86 ────────┴──────────────────── Ⅲ.「比の差の分散分析」への結果の変換 ①分散分析の結果から使うのは,「SS」「df」「MS」の数値のみ。F値は使わない。 ②変動因の名称を変更 ・「被験者S」→「要因C」に変更 ・「誤差AS」「誤差BC」→「交互作用AC」「交互作用BC」に変更 ・「誤差ABS」→「交互作用ABC」に変更 ③「比の差の分散分析」として結果表に,以下の新要素を追加する。 ・追加行として「郡内」行を追加 ・追加列として「χ2」を追加 ◇ 比の差の分散分析の結果ver0.1 ☆ ────────┬──────────────────── 変動因 │ SS df MS χ2 ────────┼──────────────────── 要因C │ 572.92 1 572.92 要因A │ 243.35 1 243.35 交互作用AC │ 0.80 1 0.80 要因B │ 9.04 1 9.04 交互作用BC │ 10.14 1 10.14 交互作用AB │ 132.73 1 132.73 交互作用ABS │ 10.14 1 10.14 全体 │ 979.13 7 34.86 郡内 │ ────────┴──────────────────── ④表が見にくいようであれば,行(変動因)を適切に並び替える ⑤郡内のχ2値を以下の計算式で算出 ・郡内χ2値=821/n (各セルnで異なる場合は,nの調和平均を使用) ⑥郡内χ2値を基準にして,各変動因のχ2値欄を計算する ・変動因のχ2値=変動因のMS/郡内χ2値 ◇ 比の差の分散分析の結果ver0.2 ☆ ────────┬──────────────────── 変動因 │ SS df MS χ2 ────────┼──────────────────── 要因A │ 243.35 1 243.35 2.96 要因B │ 9.04 1 9.04 0.11 要因C │ 572.92 1 572.92 6.98 交互作用AB │ 132.73 1 132.73 1.62 交互作用BC │ 10.14 1 10.14 0.12 交互作用AC │ 0.80 1 0.80 0.01 交互作用ABS │ 10.14 1 10.14 0.12 全体 │ 979.13 7 34.86 1.70 郡内 │ 82.10 ────────┴──────────────────── ⑥χ2分布臨界値表などを使って,有意性判定を行う
だいたい,こんな感じだろう,と思う雪本さん!
なぜに逆正弦変換法なるものをするのか?
①百分率(割合)データを,より正規分布データに近づける作用がある.
②郡内分散とは,各セルの分散を意味しているが,「821÷人数」によって算出されるので,セル人数が同質であれば,各セルの分散も同質となる.
分散分析の前提条件として,①正規分布性,②各水準の分散の等質性がありますが,逆正弦変換法を使うと,この二つの条件を満たす(かなり満たす可能性が高くなる)ようになるわけですね.
(´-`).。oO(当然,一要因もできます。次回にでも説明します)
コメント ( 0 ) | Trackback ( 0 )
逆正弦変換法によるχ2分散分析(二要因)の計算法(統計tool使用)
( ゜д゜) 名義尺度版多重比較法に決~めた
というわけで,名義尺度データ(従属変数が二カテゴリ)の場合の統計法である「逆正弦変換法によるχ2分散分析」の計算法をちろっと書きます。
……何が「というわけで」と思った皆さんへ。
えと,あの,「教えて!goo」で逆正弦変換法に関する質問があったので,回答をしたわけですな。
[教えて!goo] 逆正弦変換法(角変換)の必要性と求め方
そのときは,統計ソフトを使った(少しでも)簡単な方法が自分の中で整理がついていなかったので,自分のブログに追加回答をしてみた……といのが今回の投稿です。
( ゜д゜) 運がよければ,質問者さん,参考にして下さいっ!
データは『はじめての心理統計』(by 神宮英夫,川島書店)より。
なお,「逆正弦変換法による(略)」は面倒なので,「比の差の分散分析」としています。
手計算の方法は「データテクニカルブック」に説明されていますが,こんな方法もあるわけです。
(´-`).。oO(しばらくは,勉強成果の発表をしたいと思います……な?)
というわけで,名義尺度データ(従属変数が二カテゴリ)の場合の統計法である「逆正弦変換法によるχ2分散分析」の計算法をちろっと書きます。
……何が「というわけで」と思った皆さんへ。
えと,あの,「教えて!goo」で逆正弦変換法に関する質問があったので,回答をしたわけですな。
[教えて!goo] 逆正弦変換法(角変換)の必要性と求め方
そのときは,統計ソフトを使った(少しでも)簡単な方法が自分の中で整理がついていなかったので,自分のブログに追加回答をしてみた……といのが今回の投稿です。
( ゜д゜) 運がよければ,質問者さん,参考にして下さいっ!
データは『はじめての心理統計』(by 神宮英夫,川島書店)より。
なお,「逆正弦変換法による(略)」は面倒なので,「比の差の分散分析」としています。
Ⅰ.データ変換の段階 □生データ:%データ ───┬─────────────┐ │ a1 a2 a3 │ ───┼─────────────┤ b1 │ 0.083 0.100 0.058 │ b2 │ 0.250 0.183 0.125 │ ───┴─────────────┘ (各セルの人数は,等しくn=10) □逆正弦変換(角変換)後のデータ ───┬─────────────┐ │ a1 a2 a3 │ ───┼─────────────┤ b1 │ 16.74 18.43 13.94 │ b2 │ 30.00 25.33 20.70 │ ───┴─────────────┘ Ⅱ.統計ソフト(例:統計tool)を使って一要因(対応あり)分散分析の実行 ┌───┬───┬───┬───┬ │ │ a1 │ a2 │ a3 │ ├───┼───┼───┼───┼ │No.01 │ 16.74│ 18.43│ 13.94│ ├───┼───┼───┼───┼ │No.02 │ 30.00│ 25.33│ 20.70│ ├───┼───┼───┼───┼ ◇一要因(対応あり)分散分析の結果☆ ──────┬──────────────────── 変動因 │ SS df MS F ──────┼──────────────────── 要因A │ 39.74 2 19.87 2.88 被験者S │ 120.78 1 120.78 17.52 誤差 │ 13.79 2 6.89 ──────┼──────────────────── 全体 │ 174.31 5 34.86 ──────┴──────────────────── Ⅲ.「比の差の分散分析」への結果の変換 ①分散分析の結果から使うのは,「SS」「df」「MS」の数値のみ。F値は使わない。 ②変動因の名称を変更 ・「被験者S」→「要因B」に変更 ・「誤差」→「交互作用」に変更 ③「比の差の分散分析」として結果表に,以下の新要素を追加する。 ・追加行として「郡内」行を追加 ・追加列として「χ2」を追加 ◇ 比の差の分散分析の結果ver0.1 ☆ ──────┬──────────────────── 変動因 │ SS df MS χ2 ──────┼──────────────────── 要因A │ 39.74 2 19.87 要因B │ 120.78 1 120.78 交互作用 │ 13.79 2 6.89 全体 │ 174.31 5 34.86 郡内 │ ──────┴──────────────────── ④郡内のχ2値を以下の計算式で算出 ・郡内χ2値=821/n (各セルnで異なる場合は,nの調和平均を使用) ⑤郡内χ2値を基準にして,各変動因のχ2値欄を計算する ・変動因のχ2値=変動因のMS/郡内χ2値 ◇ 比の差の分散分析の結果ver0.2 ☆ ──────┬──────────────────── 変動因 │ SS df MS χ2 ──────┼──────────────────── 要因A │ 39.74 2 19.87 2.90 要因B │ 120.78 1 120.78 17.65 交互作用 │ 13.79 2 6.89 1.00 全体 │ 174.31 5 34.86 5.10 郡内 │ 6.84 ──────┴──────────────────── ⑥χ2分布臨界値表などを使って,有意性判定を行う
手計算の方法は「データテクニカルブック」に説明されていますが,こんな方法もあるわけです。
(´-`).。oO(しばらくは,勉強成果の発表をしたいと思います……な?)
コメント ( 1 ) | Trackback ( 0 )
類似の統計法
( ゜д゜) 類似の統計法
雪本さん的に統計解析法の分野は,中級三分野として「差異の統計法」「類似の統計法」「多変量解析法」,そして補足二分野として「クロス表分析法」「分布基礎論」と五分野にわけることにしています.
この中で,一番勉強を進めいてピンとこなかったのが,「類似の統計法」なわけです.類似の統計法とは,相関係数の発展統計解析法の分野と位置づけているわけですが,多変量解析も相関係数の発展版なので
( ゜д゜) 類似の統計法っているの?
と,悩んでいたりしました.
分野として成立するためには,ある程度手法の数が揃っていなければなりません.
しかし,多変量解析にかぶらないように,そろほど多くの手法があるのか……
それで悩んでいたのですが,最近,これでいこうかという案が浮かびました.
さあ,皆様は下記の手法のうち,どの程度ご存知でしょうか?
★同尺度の類似性
<両方向性>
□基本形
間隔×間隔:ピアソンの積率相関係数
順序×順序:スピアマンの順位相関係数,ケンドールの順位相関係数
名義×名義:クラメールの連関係数
□オプション形
間×間:偏相関係数,級内相関係数
順×順:偏順位相関係数,級内順位相関係数
名×名:偏連関係数,級内連関係数
□有意性の検定
相関係数,順位相関係数,連関係数の有意性検定
独立した相関,順位相関,連関係数の有意【差】検定
<一方向性>
□統計量
間×間:回帰係数,偏回帰係数
順×順:順位の回帰係数(仮)
名×名:制約変数
★異尺度の類似性
名×順:順位相関比
名×間:相関比
順×間:①(順×順)化して,順位相関係数の算出
②(間×間)化して,積率相関係数の算出
※「順→間」はパーセンタイル順位を求めることで可能
ひとまず,こんな感じのを考えていたりします.
雪本さん的に統計解析法の分野は,中級三分野として「差異の統計法」「類似の統計法」「多変量解析法」,そして補足二分野として「クロス表分析法」「分布基礎論」と五分野にわけることにしています.
この中で,一番勉強を進めいてピンとこなかったのが,「類似の統計法」なわけです.類似の統計法とは,相関係数の発展統計解析法の分野と位置づけているわけですが,多変量解析も相関係数の発展版なので
( ゜д゜) 類似の統計法っているの?
と,悩んでいたりしました.
分野として成立するためには,ある程度手法の数が揃っていなければなりません.
しかし,多変量解析にかぶらないように,そろほど多くの手法があるのか……
それで悩んでいたのですが,最近,これでいこうかという案が浮かびました.
さあ,皆様は下記の手法のうち,どの程度ご存知でしょうか?
★同尺度の類似性
<両方向性>
□基本形
間隔×間隔:ピアソンの積率相関係数
順序×順序:スピアマンの順位相関係数,ケンドールの順位相関係数
名義×名義:クラメールの連関係数
□オプション形
間×間:偏相関係数,級内相関係数
順×順:偏順位相関係数,級内順位相関係数
名×名:偏連関係数,級内連関係数
□有意性の検定
相関係数,順位相関係数,連関係数の有意性検定
独立した相関,順位相関,連関係数の有意【差】検定
<一方向性>
□統計量
間×間:回帰係数,偏回帰係数
順×順:順位の回帰係数(仮)
名×名:制約変数
★異尺度の類似性
名×順:順位相関比
名×間:相関比
順×間:①(順×順)化して,順位相関係数の算出
②(間×間)化して,積率相関係数の算出
※「順→間」はパーセンタイル順位を求めることで可能
ひとまず,こんな感じのを考えていたりします.
コメント ( 0 ) | Trackback ( 0 )
多重回答
( ゜д゜) そろそろ後期授業が始まるぞー
今日,久々に統計法の相談を受けた雪本さん.
今回は「多重回答」をどう分析するかについてでした.多重回答というのは,質問者さんは選択肢の中から複数回答をしてもよい,という複数回答のことです.
多くの統計解析法は,多重回答に対応していないわけです.
だからこそ,対応している分析法はその辺を売りにするわけです.
この手の質問には回答レパートリーを持っていませんでしたの,相談を受けながらどきどきしていました.
今度は,この辺の問題をちょっと考えてみたいなぁと思った日本の夜です.
今日,久々に統計法の相談を受けた雪本さん.
今回は「多重回答」をどう分析するかについてでした.多重回答というのは,質問者さんは選択肢の中から複数回答をしてもよい,という複数回答のことです.
多くの統計解析法は,多重回答に対応していないわけです.
だからこそ,対応している分析法はその辺を売りにするわけです.
この手の質問には回答レパートリーを持っていませんでしたの,相談を受けながらどきどきしていました.
今度は,この辺の問題をちょっと考えてみたいなぁと思った日本の夜です.
コメント ( 2 ) | Trackback ( 0 )
分析思想の変革教育
( ゜д゜) かいき~
bobさんの重回帰分析教育を見ての徒然……。というか,これが雪本さんの考えている教育法ですな。
統計法は人によって学習段階が異なるわけで,また,必ずしも同じ経路を経ているわけでもありません。よって,同じ手法に対しても,統計法教師の持っている知識と,学習者の持っている知識は異なってくるわけです。
さて,「要因分析=重回帰分析」と考えている学習者に対してですが,まずは意識改革をしてもらう必要があります。というよりは,昔は,「多くの変数を投与してなるべく説明力の高いモデルを選ぶ」という思想がありました。いわば「全体説明力の重視」の立場です。なので,このような考えを持つことはあながち間違いとは言えないわけです。
しかし,今では,異なる思想が主流となってきたために,上記は「正しくない」と考えられています。「なんでもかんでも説明変数を投与するのではなく,本当に効果のある説明変数のみに厳選する」という発想が今の考えですね。こちらはどちらかというと「部分説明力の重視+効率性」の立場です(まるっきり全体の説明力を無視するわけではありませんが)。むしろ要因分析と考えている人ならば,操作する要因は「操作しやすく,少ない方がよい」ということを知っているのではないでしょうか? 今の思想はこれを継承しています。
この効率性ということを考慮しているために,「全体モデルの説明力(決定係数)」についても「変数の数が無駄に多いとペナルティを課す」ように修正を施した指標が考えられているわけです。これが「自由度調整済み決定係数」などをはじめとする現在普及している指標なわけです。
ただ……最初に,素朴に「全体説明力が高い方がよい」という昔ながらの発想は悪くはない,と述べました。それは何故かというと,重回帰分析をはじめとする多変量解析のほとんどは「モデル全体の説明力を高くするようなモデルを構築」する計算思想に基づいているからです。すなわち「偏回帰係数の分析」などのように,部分の分析は,後になって「こういう分析もやってもいいんじゃないかな?」としてされるようになったものと考えられます。
このように,分析の背後に隠された思想というものを発見して,その思想の改革を,そして,必ずしも昔の思想が間違っていた,という進化論的批判をするのではなく,相対的に評価することが大事だと思います。
(´-`).。oO(一ヶ月前の記事だけど,何となく書いてしまった雪本さん)
bobさんの重回帰分析教育を見ての徒然……。というか,これが雪本さんの考えている教育法ですな。
統計法は人によって学習段階が異なるわけで,また,必ずしも同じ経路を経ているわけでもありません。よって,同じ手法に対しても,統計法教師の持っている知識と,学習者の持っている知識は異なってくるわけです。
さて,「要因分析=重回帰分析」と考えている学習者に対してですが,まずは意識改革をしてもらう必要があります。というよりは,昔は,「多くの変数を投与してなるべく説明力の高いモデルを選ぶ」という思想がありました。いわば「全体説明力の重視」の立場です。なので,このような考えを持つことはあながち間違いとは言えないわけです。
しかし,今では,異なる思想が主流となってきたために,上記は「正しくない」と考えられています。「なんでもかんでも説明変数を投与するのではなく,本当に効果のある説明変数のみに厳選する」という発想が今の考えですね。こちらはどちらかというと「部分説明力の重視+効率性」の立場です(まるっきり全体の説明力を無視するわけではありませんが)。むしろ要因分析と考えている人ならば,操作する要因は「操作しやすく,少ない方がよい」ということを知っているのではないでしょうか? 今の思想はこれを継承しています。
この効率性ということを考慮しているために,「全体モデルの説明力(決定係数)」についても「変数の数が無駄に多いとペナルティを課す」ように修正を施した指標が考えられているわけです。これが「自由度調整済み決定係数」などをはじめとする現在普及している指標なわけです。
ただ……最初に,素朴に「全体説明力が高い方がよい」という昔ながらの発想は悪くはない,と述べました。それは何故かというと,重回帰分析をはじめとする多変量解析のほとんどは「モデル全体の説明力を高くするようなモデルを構築」する計算思想に基づいているからです。すなわち「偏回帰係数の分析」などのように,部分の分析は,後になって「こういう分析もやってもいいんじゃないかな?」としてされるようになったものと考えられます。
このように,分析の背後に隠された思想というものを発見して,その思想の改革を,そして,必ずしも昔の思想が間違っていた,という進化論的批判をするのではなく,相対的に評価することが大事だと思います。
(´-`).。oO(一ヶ月前の記事だけど,何となく書いてしまった雪本さん)
コメント ( 0 ) | Trackback ( 0 )
順序尺度版多重比較
( ゜д゜) ねぇ,僕のこと覚えてる? 覚えてる?
忘れ去られてしまうと,とってもしょんぼりしてしまうだろう雪本さん.
まあ,あれです.大学に投稿する紀要(いわゆる「同人誌」)をちまちまと執筆しておるわけですが……
多重比較ネタで書くことは決めております.
二本書くつもりですが,一本は間隔尺度版多重比較,雪本的には多重比較の基礎論となるもの書くつもりです.
つか,おぼろげにたたき台なるものは書きました.
残り一本は,基礎論を踏まえて,これをノンパラメトリック版多重比較に「応用」させた,要するに順序尺度版+名義尺度版多重比較を書く……「つもり」でした.
ところで,雪本的には,多重比較は一対比較型と対比型に分類できるわけですが,両者は,後者を汎用,前者をその特殊形と位置づけることに成功しています.少なくとも,間隔尺度については.
んで,順序尺度やら名義尺度については,その汎用-特殊なるものが上手く整理できていなかったのですが……
ひとまず,順序尺度版「対応なし」については汎用-特殊の関係性をなんとか整理できました(^_^)
あとは,「対応あり」について整理できれば,順序尺度版多重比較についてもかなり整合性の高い論を主張できそうです.
そうなると,紙面の関係から?,順序尺度版多重比較のみに焦点を当てた方が良さそうだな,と思うようになりました.
(´-`).。oO(名義尺度版多重比較については別の論文で書こうと思う雪本さん)
上記の「汎用-特殊」の整理をする過程で,クラスカル・ウォリス検定が,「順位データの分散分析」と呼ばれる所以がわかりました.
今なら,クラスカル・ウォリス検定の計算式を忘れても,一要因対応なし分散分析の計算プログラムがあれば,クラスカル・ウォリス検定の統計量を算出することができます.
要するに,クラスカル・ウォリス検定の計算式の思想がわかったということであり,通常の分散分析と何が違うのかわかるようになりました.
( ゜д゜) がんばれ雪本さんっ!
PLUS!(追加文)
がんばった雪本さん,何とか,順序尺度版「対応あり」の汎用-特殊の整理にも成功しました!
Θ・) がんばったよ?
忘れ去られてしまうと,とってもしょんぼりしてしまうだろう雪本さん.
まあ,あれです.大学に投稿する紀要(いわゆる「同人誌」)をちまちまと執筆しておるわけですが……
多重比較ネタで書くことは決めております.
二本書くつもりですが,一本は間隔尺度版多重比較,雪本的には多重比較の基礎論となるもの書くつもりです.
つか,おぼろげにたたき台なるものは書きました.
残り一本は,基礎論を踏まえて,これをノンパラメトリック版多重比較に「応用」させた,要するに順序尺度版+名義尺度版多重比較を書く……「つもり」でした.
ところで,雪本的には,多重比較は一対比較型と対比型に分類できるわけですが,両者は,後者を汎用,前者をその特殊形と位置づけることに成功しています.少なくとも,間隔尺度については.
んで,順序尺度やら名義尺度については,その汎用-特殊なるものが上手く整理できていなかったのですが……
ひとまず,順序尺度版「対応なし」については汎用-特殊の関係性をなんとか整理できました(^_^)
あとは,「対応あり」について整理できれば,順序尺度版多重比較についてもかなり整合性の高い論を主張できそうです.
そうなると,紙面の関係から?,順序尺度版多重比較のみに焦点を当てた方が良さそうだな,と思うようになりました.
(´-`).。oO(名義尺度版多重比較については別の論文で書こうと思う雪本さん)
上記の「汎用-特殊」の整理をする過程で,クラスカル・ウォリス検定が,「順位データの分散分析」と呼ばれる所以がわかりました.
今なら,クラスカル・ウォリス検定の計算式を忘れても,一要因対応なし分散分析の計算プログラムがあれば,クラスカル・ウォリス検定の統計量を算出することができます.
要するに,クラスカル・ウォリス検定の計算式の思想がわかったということであり,通常の分散分析と何が違うのかわかるようになりました.
( ゜д゜) がんばれ雪本さんっ!
PLUS!(追加文)
がんばった雪本さん,何とか,順序尺度版「対応あり」の汎用-特殊の整理にも成功しました!
Θ・) がんばったよ?
コメント ( 0 ) | Trackback ( 0 )
対比式
( ゜д゜) 暑いから夏っていうんじゃー
雪本的に,データ解析法は「差異の統計法」と「類似の統計法」とに大別できます。前者には,t検定をはじめとして,分散分析やら多重比較があったりしますが,意外と知られていないのが「対比」です。
t検定を複数変数版に修正したものが多重比較ですが,対比もt検定を修正というか,拡張したものです。t検定やら多重比較はある水準のデータをそのまま使おうとしますが,対比とは,そのまま使うのではなく,複数の水準データを組み合わせることに本領を発揮します。
水準:中学校,高校,大学,大学院
多重比較であれば,中学校vs高校のように水準データをそのまま使いますが,対比では,「大学受験前(中学校&高校)vs受験後(大学&大学院)」のようにデータを組み合わせることができるわけです。
さて,データ解析では,データに「対応がある」か「対応がない」かは重要な基準ですが,多くの統計法教科書には,対比式そのものが紹介されていない,されていても「対応なし」対比しか紹介されていません。
工夫によっては「対応なし」対比式を使って,「対応あり」対比の計算を行うこともできますが,その辺の解説を丁寧にしているものはほとんどありません。要するに,「対応あり対比」式については,「できるのか? できるとしても具体的にどうやってやるかは不明」という状態です。
この「対応あり」対比はSPSSで実行できますが,SPSSの対比は自由自在に水準を組み合わせることはできません。自在に組合せをしたいときには,計算式が必要となるわけですが,それが紹介されていないわけですから,やっぱり「不明」なわけです。
んで……
ここ数ヶ月ぐらいかけて,計算式を見つけました。というか,対応ありt検定を拡張して自分で作りました。それで,SPSSの計算結果と同一になることを確認しましたので,間違いないでしょう。
……というか,後から調べると,わかりにくいけど,文献があったんですけどね……
雪本的に,データ解析法は「差異の統計法」と「類似の統計法」とに大別できます。前者には,t検定をはじめとして,分散分析やら多重比較があったりしますが,意外と知られていないのが「対比」です。
t検定を複数変数版に修正したものが多重比較ですが,対比もt検定を修正というか,拡張したものです。t検定やら多重比較はある水準のデータをそのまま使おうとしますが,対比とは,そのまま使うのではなく,複数の水準データを組み合わせることに本領を発揮します。
水準:中学校,高校,大学,大学院
多重比較であれば,中学校vs高校のように水準データをそのまま使いますが,対比では,「大学受験前(中学校&高校)vs受験後(大学&大学院)」のようにデータを組み合わせることができるわけです。
さて,データ解析では,データに「対応がある」か「対応がない」かは重要な基準ですが,多くの統計法教科書には,対比式そのものが紹介されていない,されていても「対応なし」対比しか紹介されていません。
工夫によっては「対応なし」対比式を使って,「対応あり」対比の計算を行うこともできますが,その辺の解説を丁寧にしているものはほとんどありません。要するに,「対応あり対比」式については,「できるのか? できるとしても具体的にどうやってやるかは不明」という状態です。
この「対応あり」対比はSPSSで実行できますが,SPSSの対比は自由自在に水準を組み合わせることはできません。自在に組合せをしたいときには,計算式が必要となるわけですが,それが紹介されていないわけですから,やっぱり「不明」なわけです。
んで……
ここ数ヶ月ぐらいかけて,計算式を見つけました。というか,対応ありt検定を拡張して自分で作りました。それで,SPSSの計算結果と同一になることを確認しましたので,間違いないでしょう。
……というか,後から調べると,わかりにくいけど,文献があったんですけどね……
コメント ( 0 ) | Trackback ( 0 )
対応あり対比式
( ゜д゜) うだーる,うだーるっ!
日本の夏です.
この夏,多重比較についての紀要を書く予定の雪本さん.
既にその学習成果?は,本blogで紹介しているわけであり,それを固い言葉でまとめようとしています.
ただ今,頭を悩ませているのが,「対応あり対比式」の簡略版です.一応詳細版の計算式は分かったのですが,計算を簡略化するにあたって,多少の前提を置くことで,簡略版がないかを探しています.
んで,今見つけたのが,「分散が等質,水準間の相関が等質」という仮定を置いた場合,
対応あり対比式=対応なし対比式×(1-相関係数)
※この場合の分散は,対応なし分散分析の誤差項を用いること
というものです.
でも,対応あり分散分析をした後に求められる誤差項(対応ありの誤差項)を使った計算式はないかなーと探しています.
つまり,単純に対応あり対比式の計算式に,「対応なしの誤差項」の代わりに「対応あり誤差項」を代入すればよいのか? それとも,それは不適切なのか……
(´-`).。oO(悩むー)
日本の夏です.
この夏,多重比較についての紀要を書く予定の雪本さん.
既にその学習成果?は,本blogで紹介しているわけであり,それを固い言葉でまとめようとしています.
ただ今,頭を悩ませているのが,「対応あり対比式」の簡略版です.一応詳細版の計算式は分かったのですが,計算を簡略化するにあたって,多少の前提を置くことで,簡略版がないかを探しています.
んで,今見つけたのが,「分散が等質,水準間の相関が等質」という仮定を置いた場合,
対応あり対比式=対応なし対比式×(1-相関係数)
※この場合の分散は,対応なし分散分析の誤差項を用いること
というものです.
でも,対応あり分散分析をした後に求められる誤差項(対応ありの誤差項)を使った計算式はないかなーと探しています.
つまり,単純に対応あり対比式の計算式に,「対応なしの誤差項」の代わりに「対応あり誤差項」を代入すればよいのか? それとも,それは不適切なのか……
(´-`).。oO(悩むー)
コメント ( 0 ) | Trackback ( 0 )
雪本さんの統計教育観
( ゜д゜) 有意性
bobさんのここの記事を読んで,ふと思ったこと.
このblogのメインは何かというと,統計法教育であると主張することは問題ないと思います.統計法「教育」の難しいところは,如何にして学習者に効果的・適切な統計的知識・技法の習熟をサポートするかにつきます.
僕の立場は「ある程度の体系的な最終目標を想定し,段階を踏んで学習を進めるべし」というものです.なので,必ずしも初学者に最新版の統計学知識を教える必要はないと思っています.
blogでは,どのようにしてその統計的道具が誕生したからを,なるべく歴史性を踏まえて説明しています.その方が,問題意識が明確になるからです.
さて,統計の有意性検定に対する態度です.
確かに有意性検定一辺倒の態度は正しくない……と,今では納得できるでしょう.「一つの立場に固執するのはよろしくない」という一般的な意見からも納得できるでしょう.
しかし,それは,今の状況から見たからこそです.
逆に問いましょう.なぜ昔は,有意性検定主流だったのでしょうか? ここで単純に「昔の人は頭が固かったから」なんていうのはやめましょう.当時,有意性検定が支持されているのは,そのような時代背景があったから……と考えるのが自然です.
科学とは,直線上に発展しているわけでもなく,その時代に独特の性質の影響を受けながら構築されているわけです.
僕が考える「時代性を意識した統計教育」とは,今の立場から「昔の人はおろかだったのだなぁ」という見下したものではなく,「昔の人は,○○という部分に焦点を当てていたため△△という方法を主に採用していたのだ」という,相対化して歴史を説明することを意味しています.
(´-`).。oO(無駄に熱い)
bobさんのここの記事を読んで,ふと思ったこと.
このblogのメインは何かというと,統計法教育であると主張することは問題ないと思います.統計法「教育」の難しいところは,如何にして学習者に効果的・適切な統計的知識・技法の習熟をサポートするかにつきます.
僕の立場は「ある程度の体系的な最終目標を想定し,段階を踏んで学習を進めるべし」というものです.なので,必ずしも初学者に最新版の統計学知識を教える必要はないと思っています.
blogでは,どのようにしてその統計的道具が誕生したからを,なるべく歴史性を踏まえて説明しています.その方が,問題意識が明確になるからです.
さて,統計の有意性検定に対する態度です.
確かに有意性検定一辺倒の態度は正しくない……と,今では納得できるでしょう.「一つの立場に固執するのはよろしくない」という一般的な意見からも納得できるでしょう.
しかし,それは,今の状況から見たからこそです.
逆に問いましょう.なぜ昔は,有意性検定主流だったのでしょうか? ここで単純に「昔の人は頭が固かったから」なんていうのはやめましょう.当時,有意性検定が支持されているのは,そのような時代背景があったから……と考えるのが自然です.
科学とは,直線上に発展しているわけでもなく,その時代に独特の性質の影響を受けながら構築されているわけです.
僕が考える「時代性を意識した統計教育」とは,今の立場から「昔の人はおろかだったのだなぁ」という見下したものではなく,「昔の人は,○○という部分に焦点を当てていたため△△という方法を主に採用していたのだ」という,相対化して歴史を説明することを意味しています.
(´-`).。oO(無駄に熱い)
コメント ( 3 ) | Trackback ( 0 )
固有値問題II
( ゜д゜) 固いですか?
前回に続いて固有値問題。多変量解析の計算式として「固有値問題」というものが絡んでいますが,やはり固有値問題と多変量解析とは直接関係がないものと理解するのが良いようです。
すなわち,多変量解析とは,実際のデータと,分析者が想定するモデルから導かれる予測データとのズレを最小にするためのパラメーターを算出する分析道具であると割り切るべきなのでしょう。
この最小にする方法としてどのような基準を使うかによって,色々な推定法-主因子法,最小二乗法,最尤法など細々と分類できるようです。
最小二乗法が最もシンプルに考えるものですが,昔はこれを素直に計算するにはあまりにも面倒だった。そこで,別アイデアを用いることで計算を楽にしようとしたわけです。そのアイデアとは固有値問題です。多変量解析とは全く別に,線形代数学には固有値問題という有名な問題というか,考え方,というか計算公式があったようです。
んで,この固有値問題については,かなり計算手順が確立されており,比較的容易に計算することができる。【つまり,ズレの最小化問題を,計算式を式変換することで,何とか固有値問題にすることができれば】,後はこれまで蓄積された解法により多変量解析を使うことができる……
このように「多変量解析≒固有値&固有ベクトルに関する計算」というイメージがあるのは,多変量解析を考えた人が,計算が容易な固有値問題に還元したためだからです。
ん? ならば,多変量解析とは固有値問題を使わなくとも解けるということになるのか?
そうです。解けます。例えば,主成分分析とか,因子分析とかは,固有値という数値を算出するのが普通だというイメージがある多変量解析の道具ですが,これらは固有値&固有ベクトルというものを求めなくとも計算することができます。
というわけらしいです。
前回に続いて固有値問題。多変量解析の計算式として「固有値問題」というものが絡んでいますが,やはり固有値問題と多変量解析とは直接関係がないものと理解するのが良いようです。
すなわち,多変量解析とは,実際のデータと,分析者が想定するモデルから導かれる予測データとのズレを最小にするためのパラメーターを算出する分析道具であると割り切るべきなのでしょう。
この最小にする方法としてどのような基準を使うかによって,色々な推定法-主因子法,最小二乗法,最尤法など細々と分類できるようです。
最小二乗法が最もシンプルに考えるものですが,昔はこれを素直に計算するにはあまりにも面倒だった。そこで,別アイデアを用いることで計算を楽にしようとしたわけです。そのアイデアとは固有値問題です。多変量解析とは全く別に,線形代数学には固有値問題という有名な問題というか,考え方,というか計算公式があったようです。
んで,この固有値問題については,かなり計算手順が確立されており,比較的容易に計算することができる。【つまり,ズレの最小化問題を,計算式を式変換することで,何とか固有値問題にすることができれば】,後はこれまで蓄積された解法により多変量解析を使うことができる……
このように「多変量解析≒固有値&固有ベクトルに関する計算」というイメージがあるのは,多変量解析を考えた人が,計算が容易な固有値問題に還元したためだからです。
ん? ならば,多変量解析とは固有値問題を使わなくとも解けるということになるのか?
そうです。解けます。例えば,主成分分析とか,因子分析とかは,固有値という数値を算出するのが普通だというイメージがある多変量解析の道具ですが,これらは固有値&固有ベクトルというものを求めなくとも計算することができます。
というわけらしいです。
コメント ( 0 ) | Trackback ( 0 )
固有値問題
( ゜д゜) 長い列ができましたっ!
多変量解析を真面目に勉強しようとなると,どうしても「行列」という数学の道具を勉強しなければなりません。最近の統計法学習においては,コンピュータに計算任せができるので,計算式なんか知らなくてもいいもん! と開き直ることができますが,極めようとすると行列などの線形代数学を勉強しなければならないようです。
( ゜д゜) 難しいー
んで,なくなく,勉強している雪本さんなわけですが。
多変量解析では,行列に関する用語として「固有値」なるものがでてきます。主成分分析とか,因子分析とか,正準相関分析とか,結構色々なものに固有値という情報が算出されます。
これって何でしょう?
行列の教科書を見てみますと,固有値問題の説明ページがあります。
雪本的には「行列を単純なスカラー値に変換する作業」に関する問題だと理解しています。んーと,要するに情報の圧縮に関するものだとご理解下さい(それでも意味不明)。
ただ……前回の投稿において,「固有値を求める主因子法は,実際のデータと予測されるデータのズレを最小にする最小二乗法の,近似解だ」と述べました。つか,そういう風に教科書に書いているわけです。
すると,主因子法と最小二乗法とは関連があるわけで,主因子法で求められる固有値というのも最小二乗法と関連があるはずですね?
で,あれこれ調べてみたのですが,どうやら,固有値問題というものは非常に抽象度が高い問題であって,より個々具体的な応用例に適用されるみたいです。例えば,「何かの数式の最小値・最大値を求める計算式」を式変形すると「固有値問題」になるなど……
すなわち,固有値というのは,何かを最小にしたい場合に関連する数値だったりするわけです(固有値が最小二乗値であり,固有値に関する固有ベクトルがその最小二乗を成立させるような解,だとか?)。
そんな感じで,固有値というのは最小二乗に関連するみたいのようです。
たぶん
(´-`).。oO(まだ自信持ってないのでよくわかりませんがに)
多変量解析を真面目に勉強しようとなると,どうしても「行列」という数学の道具を勉強しなければなりません。最近の統計法学習においては,コンピュータに計算任せができるので,計算式なんか知らなくてもいいもん! と開き直ることができますが,極めようとすると行列などの線形代数学を勉強しなければならないようです。
( ゜д゜) 難しいー
んで,なくなく,勉強している雪本さんなわけですが。
多変量解析では,行列に関する用語として「固有値」なるものがでてきます。主成分分析とか,因子分析とか,正準相関分析とか,結構色々なものに固有値という情報が算出されます。
これって何でしょう?
行列の教科書を見てみますと,固有値問題の説明ページがあります。
雪本的には「行列を単純なスカラー値に変換する作業」に関する問題だと理解しています。んーと,要するに情報の圧縮に関するものだとご理解下さい(それでも意味不明)。
ただ……前回の投稿において,「固有値を求める主因子法は,実際のデータと予測されるデータのズレを最小にする最小二乗法の,近似解だ」と述べました。つか,そういう風に教科書に書いているわけです。
すると,主因子法と最小二乗法とは関連があるわけで,主因子法で求められる固有値というのも最小二乗法と関連があるはずですね?
で,あれこれ調べてみたのですが,どうやら,固有値問題というものは非常に抽象度が高い問題であって,より個々具体的な応用例に適用されるみたいです。例えば,「何かの数式の最小値・最大値を求める計算式」を式変形すると「固有値問題」になるなど……
すなわち,固有値というのは,何かを最小にしたい場合に関連する数値だったりするわけです(固有値が最小二乗値であり,固有値に関する固有ベクトルがその最小二乗を成立させるような解,だとか?)。
そんな感じで,固有値というのは最小二乗に関連するみたいのようです。
たぶん
(´-`).。oO(まだ自信持ってないのでよくわかりませんがに)
コメント ( 0 ) | Trackback ( 0 )
« 前ページ | 次ページ » |