現在【いろいろな意味で余裕があれば】の条件で公開相談を受付中。即効性のある相談にはのれないので注意。
独学のすスめ
統計解析法における「絶対」概念
( ゜д゜) 実は生きていた雪本さん。
はふー。最近めっさりとブログ更新がされていません。そんな寂れたブログは見捨てられるかと思っていたのですが,アクセス解析を見てみると,意外と閲覧(者)数が0にならないものですね。
さてはて。今回質問が出ましたので,それへの回答を。
一対比較法の計算に関して質問者「なべさん」から次のような疑問が。
> 研究で一対比較法を使用したのですが、エクセルでやると、選択率が0
> のときと1のときにNORMSINVの関数を使うとエラーになってしまいうま
> くできません。どうすればいいでしょうか
NORMSINV(確率)とは,「標準正規分布の累積分布関数の逆関数の値を返します。この分布は、平均が 0 で標準偏差が 1 である正規分布に対応します」というExcel関数です。そして「確率 <0、または確率 > 1 である場合、エラー値 #NUM! が返されます」という注意事項があります。要するに,この関数を使えば,ある確率が標準正規分布表でどのような値になるかを求めることができるということです(確率0.91 → 1.33)。
ここでの問題は,なぜに「0」と「1」は駄目なのかということでしょう。
まず注意してもらいたいのは,統計解析法は確率論をベースにする方法論であり,その確率論では「絶対」という概念は想定していないということです。
確率範囲が「0%~100%」を取るとして,確率論が問題にするのは,「起こるか起こらないか不明な現象(0%<確率<100%)」であり,「絶対に起こらない(0%)」や「絶対に起こる(100%)」という明確な現象を想定していないのです。よってどのような現象も絶対に起きないということはありえず,また絶対に起きるということは言えないと考えます。
このような理由から,確率関数では「0%」「100%」を入力してもエラーが発生しますが,それは確率論の大前提から外れているからです。ある意味当然の結果だと言えるでしょう。
ここまでが概論的な話です。基本的には上記の態度で対応をしなければなりませんが,「実際に0%,100%というデータが出てしまった。しかもそれを使ってデータ分析をしなければならない」という実務的な対応をする場合はどうするのか?
残念ながら,統計学的に「正しい」対応策はないでしょう(統計学的に正しい対応とは「そのようなデータを取るのが間違い。別のデータを取り直しなさい。あるいは研究テーマが統計的に不適切だ」とするのかな?)。よって「とりあえずの暫定的」対応を必要であれば取ることになります(ただし,暫定的対応なので,みんなが賛成するものではないことに注意)。
まず,その分野,今回の場合で言えば一対比較法において,このような事態になったときにどうするのが暫定的対応になるのか調べて下さい。なお,雪本は知りません。だって,この暫定的対応とはある意味邪道ということですから,そんなに大っぴらに教えていると言うことはないと思います。あるのならそれにしたがって下さい。
そして,もしないのならば,自分で考えるしかありません。ただ,自分で考えるということは,当然他の人から疑問視される可能性が高くなりますので,それに対して説明責任を果たさなければなりません(「○○の理由から,暫定的対応として,△△という方法を取った」など)。
もし雪本がこのような問題にぶつかったならば……あくまでも個人的意見です……絶対にこれが正しいなんて思わないで下さい……「0%」や「100%」という絶対確率が駄目なのならば,確率論で扱うことが可能な範囲の「0<確率<100」になるように細工します。
つまり,「0%」を「0.01%」,「100%」を「99.99%」のように絶対性をなくすわけですね。ここで重要なのは絶対性をなくすということなので,別に「0.01」でなくとも「0.000001」とかでも同じです。
Θ・)ノ「とりあえず こんな かんじ?」
はふー。最近めっさりとブログ更新がされていません。そんな寂れたブログは見捨てられるかと思っていたのですが,アクセス解析を見てみると,意外と閲覧(者)数が0にならないものですね。
さてはて。今回質問が出ましたので,それへの回答を。
一対比較法の計算に関して質問者「なべさん」から次のような疑問が。
> 研究で一対比較法を使用したのですが、エクセルでやると、選択率が0
> のときと1のときにNORMSINVの関数を使うとエラーになってしまいうま
> くできません。どうすればいいでしょうか
NORMSINV(確率)とは,「標準正規分布の累積分布関数の逆関数の値を返します。この分布は、平均が 0 で標準偏差が 1 である正規分布に対応します」というExcel関数です。そして「確率 <0、または確率 > 1 である場合、エラー値 #NUM! が返されます」という注意事項があります。要するに,この関数を使えば,ある確率が標準正規分布表でどのような値になるかを求めることができるということです(確率0.91 → 1.33)。
ここでの問題は,なぜに「0」と「1」は駄目なのかということでしょう。
まず注意してもらいたいのは,統計解析法は確率論をベースにする方法論であり,その確率論では「絶対」という概念は想定していないということです。
確率範囲が「0%~100%」を取るとして,確率論が問題にするのは,「起こるか起こらないか不明な現象(0%<確率<100%)」であり,「絶対に起こらない(0%)」や「絶対に起こる(100%)」という明確な現象を想定していないのです。よってどのような現象も絶対に起きないということはありえず,また絶対に起きるということは言えないと考えます。
このような理由から,確率関数では「0%」「100%」を入力してもエラーが発生しますが,それは確率論の大前提から外れているからです。ある意味当然の結果だと言えるでしょう。
ここまでが概論的な話です。基本的には上記の態度で対応をしなければなりませんが,「実際に0%,100%というデータが出てしまった。しかもそれを使ってデータ分析をしなければならない」という実務的な対応をする場合はどうするのか?
残念ながら,統計学的に「正しい」対応策はないでしょう(統計学的に正しい対応とは「そのようなデータを取るのが間違い。別のデータを取り直しなさい。あるいは研究テーマが統計的に不適切だ」とするのかな?)。よって「とりあえずの暫定的」対応を必要であれば取ることになります(ただし,暫定的対応なので,みんなが賛成するものではないことに注意)。
まず,その分野,今回の場合で言えば一対比較法において,このような事態になったときにどうするのが暫定的対応になるのか調べて下さい。なお,雪本は知りません。だって,この暫定的対応とはある意味邪道ということですから,そんなに大っぴらに教えていると言うことはないと思います。あるのならそれにしたがって下さい。
そして,もしないのならば,自分で考えるしかありません。ただ,自分で考えるということは,当然他の人から疑問視される可能性が高くなりますので,それに対して説明責任を果たさなければなりません(「○○の理由から,暫定的対応として,△△という方法を取った」など)。
もし雪本がこのような問題にぶつかったならば……あくまでも個人的意見です……絶対にこれが正しいなんて思わないで下さい……「0%」や「100%」という絶対確率が駄目なのならば,確率論で扱うことが可能な範囲の「0<確率<100」になるように細工します。
つまり,「0%」を「0.01%」,「100%」を「99.99%」のように絶対性をなくすわけですね。ここで重要なのは絶対性をなくすということなので,別に「0.01」でなくとも「0.000001」とかでも同じです。
Θ・)ノ「とりあえず こんな かんじ?」
コメント ( 4 ) | Trackback ( 0 )
Bonferroni法による多重比較法の記述
( ゜д゜) お久しぶれっ!
みんなが忘れかけた頃にひっそりと動き出すのが,雪本さんっ!
ぱったぱたと動きを止めてしまいまして,心配をして下さってくれた「ことり」さま,ありがとうございます。大学で担当している授業準備でばったばたしておりました。
ごめんね? ごめんね?
さてさて。黄金週間前に質問が出てたようで,すっかり賞味期限が切れてしまっているようですが。大丈夫っ! 雪本さんは納豆も好きです!(謎
質問者様は「mic」さんですね。
> 有意水準調整型の多重比較について、
> その結果を書く場合にどうすればよいか迷っています。
> というのも、ある実験で比較を3点で行いたいのですが、
> t検定+ボンフェローニの方法でやりたいと思っています。
まずは多重比較に限らず,統計解析法の分析結果は,どのような資料に記述するかで,どこまで丁寧に記述しなければならないかが違うようです。
例えば二要因分散分析を行った場合,二つの要因の主効果,及び,交互作用の効果を統計表現を交えて記述する……ここまで良いでしょう。しかし,交互作用の効果が有意であった場合,本来ならば交互作用の下位検定として,そのまま分析をすすめて詳細な記述(F値などの統計表現を省略せずに)をすべきだと思いますが,この辺をさらっとして,簡略化した記述をしたものも見られます。
ということで,実は最初の分散分析結果以降の,多重比較法や下位検定の結果というのは省略をしてしまえばかなり大胆に省略をすすことができるみたいです(無論審査付き論文として投稿した場合,審査者が詳細な記述を求めたならば,それに答える必要はあるでしょうが)。
それを踏まえて解答を続けます。
> この場合、各比較を通常のt検定で行って算出されたP値を3倍して、
> α(=0.05)と比較すればOKだと認識しているのですが、
> 論文に書くP値は3倍した後の値をそのまま載せて良いのでしょうか?
t検定のP値を比較ペア数で倍数化,その数値をαと比較する……一瞬,「おや?」と思いましたが,意味としては同じことですね。「(P値×比較ペア数)<α」?というよりも,「P値<(α÷比較ペア数)」という形式の方が一般的な理解だと思いますが,本質的には同じですね。
> (もちろん「t検定+ボンフェローニの方法でやりました」という
> ことも併記します)
ういうい。それでは雪本だったら次のような記述をすると思います。
○○要因の効果が有意であったため,Bonferroni法による多重比較を行った。具体的にはBonferroni法により「調整化された有意水準(α')」を求め,各比較ペアの有意性検定(t検定)結果の確率値に対してα'(0.017)で判定を行った。分析の結果……
上記のような感じですかね? 一般的には青色の記述部分は省略されていることが多いです。しかしそれだと一体,Bonferroni法で何をしているのかわからないため,より具体的な手順として青色記述をした方が正確でしょう。
なお,多重比較の場合は具体的な統計情報が表示されるとは限らないので,上記のように統計表現を使わない,文章表現のみで記述することが一般的のようです。
みんなが忘れかけた頃にひっそりと動き出すのが,雪本さんっ!
ぱったぱたと動きを止めてしまいまして,心配をして下さってくれた「ことり」さま,ありがとうございます。大学で担当している授業準備でばったばたしておりました。
ごめんね? ごめんね?
さてさて。黄金週間前に質問が出てたようで,すっかり賞味期限が切れてしまっているようですが。大丈夫っ! 雪本さんは納豆も好きです!(謎
質問者様は「mic」さんですね。
> 有意水準調整型の多重比較について、
> その結果を書く場合にどうすればよいか迷っています。
> というのも、ある実験で比較を3点で行いたいのですが、
> t検定+ボンフェローニの方法でやりたいと思っています。
まずは多重比較に限らず,統計解析法の分析結果は,どのような資料に記述するかで,どこまで丁寧に記述しなければならないかが違うようです。
例えば二要因分散分析を行った場合,二つの要因の主効果,及び,交互作用の効果を統計表現を交えて記述する……ここまで良いでしょう。しかし,交互作用の効果が有意であった場合,本来ならば交互作用の下位検定として,そのまま分析をすすめて詳細な記述(F値などの統計表現を省略せずに)をすべきだと思いますが,この辺をさらっとして,簡略化した記述をしたものも見られます。
ということで,実は最初の分散分析結果以降の,多重比較法や下位検定の結果というのは省略をしてしまえばかなり大胆に省略をすすことができるみたいです(無論審査付き論文として投稿した場合,審査者が詳細な記述を求めたならば,それに答える必要はあるでしょうが)。
それを踏まえて解答を続けます。
> この場合、各比較を通常のt検定で行って算出されたP値を3倍して、
> α(=0.05)と比較すればOKだと認識しているのですが、
> 論文に書くP値は3倍した後の値をそのまま載せて良いのでしょうか?
t検定のP値を比較ペア数で倍数化,その数値をαと比較する……一瞬,「おや?」と思いましたが,意味としては同じことですね。「(P値×比較ペア数)<α」?というよりも,「P値<(α÷比較ペア数)」という形式の方が一般的な理解だと思いますが,本質的には同じですね。
> (もちろん「t検定+ボンフェローニの方法でやりました」という
> ことも併記します)
ういうい。それでは雪本だったら次のような記述をすると思います。
○○要因の効果が有意であったため,Bonferroni法による多重比較を行った。具体的にはBonferroni法により「調整化された有意水準(α')」を求め,各比較ペアの有意性検定(t検定)結果の確率値に対してα'(0.017)で判定を行った。分析の結果……
上記のような感じですかね? 一般的には青色の記述部分は省略されていることが多いです。しかしそれだと一体,Bonferroni法で何をしているのかわからないため,より具体的な手順として青色記述をした方が正確でしょう。
なお,多重比較の場合は具体的な統計情報が表示されるとは限らないので,上記のように統計表現を使わない,文章表現のみで記述することが一般的のようです。
コメント ( 5 ) | Trackback ( 0 )
社会心理学は難しい…
( ゜д゜) りーろーん
前回と同じ出だしはマンネリの始まりデスカ?
雪本が一年前ぐらいから悩んでいるのが「社会心理学」をどうやって自分の理論心理学体系の中に組み込むかです。
科学教育の基本として,その知識の体系性が重要視されます。この辺の話はヴィゴツキー心理学やら,教授心理学などではおなじみでしょう。
でも,雪本さんはずっと不満でした。
体系性が重要だといっている当の心理学者の専門科学である心理学を教える時にどれだけ「体系性」に気をつけているんだろう,と。
この辺の不満があるため,いろいろな理論やら技法を体系的に整理する「枠組み」に雪本はこだわります(統計手法を体系的に整理した図式はすでにみなさんにお知らせしていますね)。
一応個人を理解するための心理学としては「子供/大人」と「知性/性格」の二軸で構成される4領域を基本とした整理図式を考えました。むろん,心理学の(代表)理論を網羅するなどというつもりはありません。でも,「子供の知性,子供の知的発達を考える」ならば「ピアジェの認知発達論」を思い出して考えるようにしてください……こんな風にある領域の問題を考える時に有効な理論はどのようなものがあるかを,心理学初学者にわかりやすく提供できないといけない……
これが雪本の意見です。
さて,これであれこれといろいろな心理学理論を取り込もうとしているのですが,一番の問題点が「社会心理学」です。
領域が広いというのもありますが,研究者の関心でテーマが選択されているので,整理しようとすると,テーマによって蓄積度が違ったりします。そのため,あるテーマは有効な理論が提唱されているが,別のテーマではそうでもなかったり……
難しいですな。
前回と同じ出だしはマンネリの始まりデスカ?
雪本が一年前ぐらいから悩んでいるのが「社会心理学」をどうやって自分の理論心理学体系の中に組み込むかです。
科学教育の基本として,その知識の体系性が重要視されます。この辺の話はヴィゴツキー心理学やら,教授心理学などではおなじみでしょう。
でも,雪本さんはずっと不満でした。
体系性が重要だといっている当の心理学者の専門科学である心理学を教える時にどれだけ「体系性」に気をつけているんだろう,と。
この辺の不満があるため,いろいろな理論やら技法を体系的に整理する「枠組み」に雪本はこだわります(統計手法を体系的に整理した図式はすでにみなさんにお知らせしていますね)。
一応個人を理解するための心理学としては「子供/大人」と「知性/性格」の二軸で構成される4領域を基本とした整理図式を考えました。むろん,心理学の(代表)理論を網羅するなどというつもりはありません。でも,「子供の知性,子供の知的発達を考える」ならば「ピアジェの認知発達論」を思い出して考えるようにしてください……こんな風にある領域の問題を考える時に有効な理論はどのようなものがあるかを,心理学初学者にわかりやすく提供できないといけない……
これが雪本の意見です。
さて,これであれこれといろいろな心理学理論を取り込もうとしているのですが,一番の問題点が「社会心理学」です。
領域が広いというのもありますが,研究者の関心でテーマが選択されているので,整理しようとすると,テーマによって蓄積度が違ったりします。そのため,あるテーマは有効な理論が提唱されているが,別のテーマではそうでもなかったり……
難しいですな。
コメント ( 0 ) | Trackback ( 0 )
公開相談(with Hayashi-daさん 2)
( ゜д゜) おそくなってごめん
二週間経とうというのにまだ完治しない根性のある風邪にかかりました(おーのーれー)
その風邪を心配して下さった,Hayashi-daさんからの相談事です。
つか,あまりにも返事が遅くなってごめん。
> ところで,ロジスティック回帰分析について教えてください。
> ロジスティック回帰分析は,独立変数が,1~5,従属変数が0,1データ
> には適用できますか?
> 調べれば分かるかもしれないことですみません。気が向いたらお返事ください。
> それでは,お大事になさってください。
遅くなって申し訳ないんですが,もう少し暇になったときに回答をしようと思います。
とりあえず一言で回答すると,「適用できます」。
※後でまた,このページを修正するつもりです。それまではこのページはコメント不可とさせていただきます。ご了承下さい。
二週間経とうというのにまだ完治しない根性のある風邪にかかりました(おーのーれー)
その風邪を心配して下さった,Hayashi-daさんからの相談事です。
つか,あまりにも返事が遅くなってごめん。
> ところで,ロジスティック回帰分析について教えてください。
> ロジスティック回帰分析は,独立変数が,1~5,従属変数が0,1データ
> には適用できますか?
> 調べれば分かるかもしれないことですみません。気が向いたらお返事ください。
> それでは,お大事になさってください。
遅くなって申し訳ないんですが,もう少し暇になったときに回答をしようと思います。
とりあえず一言で回答すると,「適用できます」。
※後でまた,このページを修正するつもりです。それまではこのページはコメント不可とさせていただきます。ご了承下さい。
コメント ( 0 ) | Trackback ( 0 )
公開相談(with Naitoさん 2)
( ゜д゜) おひさしー
> 大変すいませんが、ヒントいただけるとありがたいです。
> ちなみに変数同士でカイ2乗で検定するとP
うぉーいっ! 途中で文が途切れてるっ!(笑
> 悩める初学者の頭を整理し、明快な指針を示してくださるブログ
> いつも感動しながら拝見しております。
> またまた質問をさせてください。
雪本流の統計解析法の知識を洗脳しているブログはここですよ?(笑
ネタに溢れた再登場の仕方をして下さったNaitoさん。
今回の質問は,なかなか悩んでしまいましたよ。
今回はロジスティック回帰分析に関する質問ですね。
重回帰分析を勉強されている方からすれば,ロジスティック回帰分析とは「(原因)量的変数→(結果)0~1範囲の確率値」という特殊な回帰分析という説明法が分かりやすいのではないでしょうか? 「0~1範囲の確率値」に限定をしているため適用範囲は狭くなりますが,その分,強みもあります。
心理学などでは,多くの場合「0~1範囲の確率値」というのを「0/1の2値カテゴリ」として活用しています。それは一つの考え方なので別に問題はないと思います。
さて,重回帰分析では,(原因)に相当する説明変数・独立変数の間に関連性があってはいけないという「多重共線性」の問題がありました。この問題は,重回帰分析の特殊形であるロジスティック回帰分析,その他の予測系の多変量解析(判別分析,数量化理論一類,二類など)でも考慮すべきものです。
多重共線性とは何でしょうか?
回帰分析などの予測・説明系の多変量解析は,結果の目的変数を原因の説明変数を使って説明しようという手法のことですね。
yが情報量100を持つとします。x1の観点からはその内の「40」を知る(予測する)ことができます。x2の観点からは「35」を知ることができます。残りの「25」は分からないものとします。多重共線性とは,ここでいうx1の「40」とx2の「35」の情報は重複していない,していると問題が起きるということです。情報量とは統計学では「分散」のことになりますので,x1とx2の重複する情報=共に重なっている分散=共分散が「0」になることが期待されるわけですね。ちなみに共分散の変形が相関係数です。
要するに,多重共線性を考える場合,それが重回帰分析であれ,ロジスティック回帰分析であれ,その他の多変量解析であれ,「分散の重複度」に注目すればよいわけです。そして代表的な分散の重複度が共分散であり,その共分散を標準化したものが相関係数なのです。
Θ・)ノ「ロジット回帰分析でも変数間の関連性は相関係数を参考にしていいよ」
参考までに,重回帰分析とロジット回帰分析の計算式を紹介します。
ロジット回帰分析は,その式の一部に重回帰分析の計算式を含んでいるのですな。
そういう意味では,ロジット回帰分析の多重共線性を考慮する場合に,重回帰分析の多重共線性への対策を流用するのは,あながち間違いとはいえないのです。
> 順序尺度や名義変数同士の共線性については何を目印にしたらよいのか、
> どうしても情報を見つけられません。
順序尺度,名義尺度という区分ではないですが,上記のことを参考にして下さい。
また,順序尺度,名義尺度間の関連性を見たいのならば,順序尺度版の相関係数である「順位相関係数」や,名義尺度版相関係数である「連関係数」を参考にするのがよいでしょう。
ただし,順序相関係数や連関係数は,当然ながらロジット回帰分析を意識して開発されたものではないので,これらの係数で多重共線性が完璧に診断できるというものではないです。
( ゜д゜) まあ,多重共線性は,実際に式をつくって,
モデルが適切に解釈できればokなんだがな
> 大変すいませんが、ヒントいただけるとありがたいです。
> ちなみに変数同士でカイ2乗で検定するとP
うぉーいっ! 途中で文が途切れてるっ!(笑
> 悩める初学者の頭を整理し、明快な指針を示してくださるブログ
> いつも感動しながら拝見しております。
> またまた質問をさせてください。
雪本流の統計解析法の知識を洗脳しているブログはここですよ?(笑
ネタに溢れた再登場の仕方をして下さったNaitoさん。
今回の質問は,なかなか悩んでしまいましたよ。
今回はロジスティック回帰分析に関する質問ですね。
重回帰分析を勉強されている方からすれば,ロジスティック回帰分析とは「(原因)量的変数→(結果)0~1範囲の確率値」という特殊な回帰分析という説明法が分かりやすいのではないでしょうか? 「0~1範囲の確率値」に限定をしているため適用範囲は狭くなりますが,その分,強みもあります。
心理学などでは,多くの場合「0~1範囲の確率値」というのを「0/1の2値カテゴリ」として活用しています。それは一つの考え方なので別に問題はないと思います。
さて,重回帰分析では,(原因)に相当する説明変数・独立変数の間に関連性があってはいけないという「多重共線性」の問題がありました。この問題は,重回帰分析の特殊形であるロジスティック回帰分析,その他の予測系の多変量解析(判別分析,数量化理論一類,二類など)でも考慮すべきものです。
多重共線性とは何でしょうか?
回帰分析などの予測・説明系の多変量解析は,結果の目的変数を原因の説明変数を使って説明しようという手法のことですね。
yが情報量100を持つとします。x1の観点からはその内の「40」を知る(予測する)ことができます。x2の観点からは「35」を知ることができます。残りの「25」は分からないものとします。多重共線性とは,ここでいうx1の「40」とx2の「35」の情報は重複していない,していると問題が起きるということです。情報量とは統計学では「分散」のことになりますので,x1とx2の重複する情報=共に重なっている分散=共分散が「0」になることが期待されるわけですね。ちなみに共分散の変形が相関係数です。
要するに,多重共線性を考える場合,それが重回帰分析であれ,ロジスティック回帰分析であれ,その他の多変量解析であれ,「分散の重複度」に注目すればよいわけです。そして代表的な分散の重複度が共分散であり,その共分散を標準化したものが相関係数なのです。
Θ・)ノ「ロジット回帰分析でも変数間の関連性は相関係数を参考にしていいよ」
参考までに,重回帰分析とロジット回帰分析の計算式を紹介します。
○重回帰分析の計算式 y=a1x1+a2x2+…+apxp+b =z ○ロジスティック回帰分析の計算式 1 y=────────────────── 1+e^[-(a1x1+a2x2+…+apxp+b) 1 y=────── 1+e^(-z) ※「^」……累乗の記号。例「2^3=8」
ロジット回帰分析は,その式の一部に重回帰分析の計算式を含んでいるのですな。
そういう意味では,ロジット回帰分析の多重共線性を考慮する場合に,重回帰分析の多重共線性への対策を流用するのは,あながち間違いとはいえないのです。
> 順序尺度や名義変数同士の共線性については何を目印にしたらよいのか、
> どうしても情報を見つけられません。
順序尺度,名義尺度という区分ではないですが,上記のことを参考にして下さい。
また,順序尺度,名義尺度間の関連性を見たいのならば,順序尺度版の相関係数である「順位相関係数」や,名義尺度版相関係数である「連関係数」を参考にするのがよいでしょう。
ただし,順序相関係数や連関係数は,当然ながらロジット回帰分析を意識して開発されたものではないので,これらの係数で多重共線性が完璧に診断できるというものではないです。
( ゜д゜) まあ,多重共線性は,実際に式をつくって,
モデルが適切に解釈できればokなんだがな
コメント ( 1 ) | Trackback ( 0 )
公開相談(with ナースさん)
( ゜д゜) ひょっとして看護学系っ!?
心理学以外の人とも話をすることができる「統計解析法」は,研究者にとっては必須のスキルです(説明的
看護学にとっての統計学とは,かの有名なナイチンゲールが統計学を駆使して,戦場の衛生環境を改善したというエピソードは非常に有名ですね。さらに,最近心理学ではやりの質的分析,その代表的手法であるグラウンデッド・セオリー法とは,社会学者が看護領域における研究で適用していた分析法であったりします。
(´-`).。oO(確かそうだった…はず…………)
このように,心理学者?雪本さんは,看護学の人に対して,分析法について,「先輩っ!」とキラキラした目で見つめてしまいます(謎文
> 心理の人にこのブログを紹介してもらいました.
ぬぉっ! ひっそりとこのブログが注目されているっ!?
……以上,ナースさんがそのHNの通りに看護学に関連していると「決めつけて」話を進めていました。
前置きはこの辺にして,ナースさんの質問を考えてみましょう。
> 例えば
> 性別×時期(前・後・半年後)のデータがあり,回答は「あり」か「なし」で
> 答えているとします.
> どういう分析が考えられますでしょうか?
「あり/なし」データは御指摘通りに「0/1」データに変換することができます。これは名義尺度2カテゴリの分析法を必要とします。
対応なしであれば「χ2検定」,対応ありであれば「コクランQ検定」が教科書では説明されいます(但し,一要因の場合)。問題は「二要因」以上なのですが,残念ながら,統計学者さんたちによる開発は順調にいっているとは言えないようです(少なくとも,我々統計実務家にわかる範囲では)。
以下,あくまでも統計実務家における統計法知識の範囲で話を進めます。
結論から言えば,「対応あり」を含む,汎用性のある二要因の分析法は開発されていません。二要因以上の分析法も考えられていますが,それは全ての要因が「対応なし」データである場合に限定されています。ちなみにその分析法の名前は「対数線形モデル分析」と言います。
ゆえに,ぴったり適切な分析法がないため,既存の分析法を何とか目的に応じて強引に適用していくしかありません。
> ひとつ考えたのは,「あり」と答えた人だけの人数の時期による変化を
> みたらいいのだろう,と思ったのですが(Friedman?),
うむうむ。なかなかイイ感じの分析発想ですよ(^-^)b
ちなみに「二カテゴリ版(1位,2位)Friedman検定」は,「コクランQ検定」と同じだったりします。
話は変わりますが,ナースさんは分散分析を勉強されていますか?「0/1」データで適切な分析法がなければ,「0/1」データに対して分散分析を実行すれば代用法となります。人によっては「0/1データには正規分布性を仮定する分散分析などを使うのはだめ!」と主張するかもしれません。その人たちの意見も分かるのですが,データ数が十分であれば,代用することに実務的には問題ありませんので,使いましょう。
では分散分析を使わないのであればどうしまよう?分散分析を使わないのならば,総合的判断をすることはできなくなりますが,まあ,考えてみましょう。
・時期要因の分析:性別要因を無視したデータに「あり/なしのコクラン検定」
※ようするに,ナースさんの提案した案のことです。
・性別要因の分析:……残念ながら上手い案見つからず……
・時期×性別の交互作用分析
時期(前)における性別の分析:χ2検定
時期(後)における性別の分析:χ2検定
時期(半年)における性別の分析:χ2検定
or
性別(男)における時期の分析:コクランQ検定
性別(女)における時期の分析:コクランQ検定
こんな風に直接交互作用の分析を調べるというのどうでしょうか?
例えば,何かの処置法が効果あるかどうかを,性別と時期の要因で調べるとしましょう。大雑把に「時期」で効果があるかどうかを調べる。あるいは,男性と女性とで処置の時期の効果パターンに違いがあるかを調べる。もし,男性と女性との効果パターンがあるということは交互作用があるということになりますね。
実は上記の「ある要因の水準を固定して,別の要因で分析を進める」という発想法は分散分析で使われている交互作用分析と同一のものです。分散分析では「交互作用に【総合的に】効果があるかどうか」を調べます(その後,有意であれば,個別の下位検定を行います)。 それを上記では,「総合的判断ができないから,とばして,直接下位検定をしてしまえ」と考えているわけです。
この方法は,決して認められている方法というわけではないのですが,そもそも「0/1」対応あり×なしデータの「ぴったり適切な分析法」というものがないのですから,多少強引にでも分析をしなければならないとして考えたものです。
実際に,論文などで,上記の一連の分析法を使うと,ある程度の反論が予想されますが,私であれば「適切な分析法が想いつかないから,次善の策で分析したんだもん。何か良い案があるのなら教えて?」と反論するでしょう(分散分析を使うという手もありますが)。
どうでしょうか?
例えば,雪本なら,こんなことを考えます。分からない点などありましたら,お返事をどうぞ。
心理学以外の人とも話をすることができる「統計解析法」は,研究者にとっては必須のスキルです(説明的
看護学にとっての統計学とは,かの有名なナイチンゲールが統計学を駆使して,戦場の衛生環境を改善したというエピソードは非常に有名ですね。さらに,最近心理学ではやりの質的分析,その代表的手法であるグラウンデッド・セオリー法とは,社会学者が看護領域における研究で適用していた分析法であったりします。
(´-`).。oO(確かそうだった…はず…………)
このように,心理学者?雪本さんは,看護学の人に対して,分析法について,「先輩っ!」とキラキラした目で見つめてしまいます(謎文
> 心理の人にこのブログを紹介してもらいました.
ぬぉっ! ひっそりとこのブログが注目されているっ!?
……以上,ナースさんがそのHNの通りに看護学に関連していると「決めつけて」話を進めていました。
前置きはこの辺にして,ナースさんの質問を考えてみましょう。
> 例えば
> 性別×時期(前・後・半年後)のデータがあり,回答は「あり」か「なし」で
> 答えているとします.
> どういう分析が考えられますでしょうか?
「あり/なし」データは御指摘通りに「0/1」データに変換することができます。これは名義尺度2カテゴリの分析法を必要とします。
対応なしであれば「χ2検定」,対応ありであれば「コクランQ検定」が教科書では説明されいます(但し,一要因の場合)。問題は「二要因」以上なのですが,残念ながら,統計学者さんたちによる開発は順調にいっているとは言えないようです(少なくとも,我々統計実務家にわかる範囲では)。
以下,あくまでも統計実務家における統計法知識の範囲で話を進めます。
結論から言えば,「対応あり」を含む,汎用性のある二要因の分析法は開発されていません。二要因以上の分析法も考えられていますが,それは全ての要因が「対応なし」データである場合に限定されています。ちなみにその分析法の名前は「対数線形モデル分析」と言います。
ゆえに,ぴったり適切な分析法がないため,既存の分析法を何とか目的に応じて強引に適用していくしかありません。
> ひとつ考えたのは,「あり」と答えた人だけの人数の時期による変化を
> みたらいいのだろう,と思ったのですが(Friedman?),
うむうむ。なかなかイイ感じの分析発想ですよ(^-^)b
ちなみに「二カテゴリ版(1位,2位)Friedman検定」は,「コクランQ検定」と同じだったりします。
話は変わりますが,ナースさんは分散分析を勉強されていますか?「0/1」データで適切な分析法がなければ,「0/1」データに対して分散分析を実行すれば代用法となります。人によっては「0/1データには正規分布性を仮定する分散分析などを使うのはだめ!」と主張するかもしれません。その人たちの意見も分かるのですが,データ数が十分であれば,代用することに実務的には問題ありませんので,使いましょう。
では分散分析を使わないのであればどうしまよう?分散分析を使わないのならば,総合的判断をすることはできなくなりますが,まあ,考えてみましょう。
・時期要因の分析:性別要因を無視したデータに「あり/なしのコクラン検定」
※ようするに,ナースさんの提案した案のことです。
・性別要因の分析:……残念ながら上手い案見つからず……
・時期×性別の交互作用分析
時期(前)における性別の分析:χ2検定
時期(後)における性別の分析:χ2検定
時期(半年)における性別の分析:χ2検定
or
性別(男)における時期の分析:コクランQ検定
性別(女)における時期の分析:コクランQ検定
こんな風に直接交互作用の分析を調べるというのどうでしょうか?
例えば,何かの処置法が効果あるかどうかを,性別と時期の要因で調べるとしましょう。大雑把に「時期」で効果があるかどうかを調べる。あるいは,男性と女性とで処置の時期の効果パターンに違いがあるかを調べる。もし,男性と女性との効果パターンがあるということは交互作用があるということになりますね。
実は上記の「ある要因の水準を固定して,別の要因で分析を進める」という発想法は分散分析で使われている交互作用分析と同一のものです。分散分析では「交互作用に【総合的に】効果があるかどうか」を調べます(その後,有意であれば,個別の下位検定を行います)。 それを上記では,「総合的判断ができないから,とばして,直接下位検定をしてしまえ」と考えているわけです。
この方法は,決して認められている方法というわけではないのですが,そもそも「0/1」対応あり×なしデータの「ぴったり適切な分析法」というものがないのですから,多少強引にでも分析をしなければならないとして考えたものです。
実際に,論文などで,上記の一連の分析法を使うと,ある程度の反論が予想されますが,私であれば「適切な分析法が想いつかないから,次善の策で分析したんだもん。何か良い案があるのなら教えて?」と反論するでしょう(分散分析を使うという手もありますが)。
どうでしょうか?
例えば,雪本なら,こんなことを考えます。分からない点などありましたら,お返事をどうぞ。
コメント ( 4 ) | Trackback ( 0 )
公開相談(with hayashi-daさん)
( ゜д゜) 続々登場っ!
四人目の相談者はhayashi-daさん。クロス集計表の分析についてですね。
クロス表分析といっても,その表が2×2なのか,2×NあるいはM×2行なのか,はたまたM×Nなのかによって,使える分析手法が違います。
(ピアソンの)χ2検定は,幸い,一般的なM×N表であっても使える手法なのですが,残差分析は2×2表に対しては使わない手法なのです。というより,使っても有益な情報が得られなのです。
どうしてかというと,2×2表に残差分析を行うと,標準化残差は,4つのセルのどれもが同じ値になってしまうからです(計算上そうなってしまいます)。ゆえに,残差分析は2×2以外の表に対して使うことになります。
それでは2×2表の分析の場合,どのように考えればよいのでしょうか?
分散分析などを始めとする統計手法の思想を思い出して下さい。「最初に全体を分析,有意であれば,その後,部分を詳細に分析」という思想です。
残差分析も基本的には,「部分の詳細分析」に相当する統計手法なので,まずは全体の分析=χ2検定の結果を参考にすることになります。
今回のデータであれば「χ2(1)=4.31, p<0.05(p=0.04)」となり有意であることが分かります。ここで,思い出して下さい。χ2検定とは何を調べる分析法なのでしょうか?
χ2検定とは「行(あるいは列)によって列カテゴリ(あるいは行カテゴリ)の発生比」に差があるかどうかを調べる分析法なわけです。
もう少し具体的に言えば,
M1の場合 N1:N2=18:7
M2の場合 N1:N2=27:2
この,M1のN1:N2と,M2のN1:N2とは同じ比だと考えても良いかどうか?
あるいは
N1の場合 M1:M2=18:27
N2の場合 M1:M2=2:7
この,N1のM1:M2と,N2のM1:M2とは同じ比だと考えても良いかどうか?
ということを調べているわけです。
これが有意であったということは……? そう,「比は異なる」という結果が導かれるわけです。
今回は,カテゴリが2つなので,比とは,比率になります。ようするに,二つの比率に差があるかどうか,調べていることになります。そして,χ2検定の結果,二つの比率に差があるよ,ということがわかりました。
……これ以上知りたいことは何でしょうか? ひとまず比率の差に注目した場合,これで結論が出ているので,修了することになります。
ちょうど,分散分析における多重比較法にて,2水準データに分散分析した後に,有意だからと言って,多重比較法をしても意味がないのと,今回の事態はある意味で似ています。
別の分析法を使う場合には,「その分析法を使って,何を調べることを目的とするのか」によって,必要ならば,新しい分析を行うかもしれませんが(その場合,何を調べたいのかを明確にする必要があります)。
四人目の相談者はhayashi-daさん。クロス集計表の分析についてですね。
クロス表分析といっても,その表が2×2なのか,2×NあるいはM×2行なのか,はたまたM×Nなのかによって,使える分析手法が違います。
(ピアソンの)χ2検定は,幸い,一般的なM×N表であっても使える手法なのですが,残差分析は2×2表に対しては使わない手法なのです。というより,使っても有益な情報が得られなのです。
どうしてかというと,2×2表に残差分析を行うと,標準化残差は,4つのセルのどれもが同じ値になってしまうからです(計算上そうなってしまいます)。ゆえに,残差分析は2×2以外の表に対して使うことになります。
それでは2×2表の分析の場合,どのように考えればよいのでしょうか?
分散分析などを始めとする統計手法の思想を思い出して下さい。「最初に全体を分析,有意であれば,その後,部分を詳細に分析」という思想です。
残差分析も基本的には,「部分の詳細分析」に相当する統計手法なので,まずは全体の分析=χ2検定の結果を参考にすることになります。
今回のデータであれば「χ2(1)=4.31, p<0.05(p=0.04)」となり有意であることが分かります。ここで,思い出して下さい。χ2検定とは何を調べる分析法なのでしょうか?
χ2検定とは「行(あるいは列)によって列カテゴリ(あるいは行カテゴリ)の発生比」に差があるかどうかを調べる分析法なわけです。
もう少し具体的に言えば,
M1の場合 N1:N2=18:7
M2の場合 N1:N2=27:2
この,M1のN1:N2と,M2のN1:N2とは同じ比だと考えても良いかどうか?
あるいは
N1の場合 M1:M2=18:27
N2の場合 M1:M2=2:7
この,N1のM1:M2と,N2のM1:M2とは同じ比だと考えても良いかどうか?
ということを調べているわけです。
これが有意であったということは……? そう,「比は異なる」という結果が導かれるわけです。
今回は,カテゴリが2つなので,比とは,比率になります。ようするに,二つの比率に差があるかどうか,調べていることになります。そして,χ2検定の結果,二つの比率に差があるよ,ということがわかりました。
……これ以上知りたいことは何でしょうか? ひとまず比率の差に注目した場合,これで結論が出ているので,修了することになります。
ちょうど,分散分析における多重比較法にて,2水準データに分散分析した後に,有意だからと言って,多重比較法をしても意味がないのと,今回の事態はある意味で似ています。
別の分析法を使う場合には,「その分析法を使って,何を調べることを目的とするのか」によって,必要ならば,新しい分析を行うかもしれませんが(その場合,何を調べたいのかを明確にする必要があります)。
コメント ( 1 ) | Trackback ( 0 )
公開相談(with Dickyさん):クラスター分析の基礎知識
( ゜д゜) 三人目にして,おもしろい相談者が来ましたよ?
Dickyさんからのメルマガ「独学をすスめ 統計的研究法編」の過分な感想をいただきまして,雪本大変嬉しく思います(つか,照れる)。その後に,「クラスター分析の解説を行っていない」というお言葉で,「ずどーん」と衝撃を受けてしまいましたが(笑
落差をねらった攻撃,なかなか上手いですよ?(笑
さてはて,相談内容を見てみましょう。
> 前置きが長くなり申し訳ございません。
> で、質問なのですが、クラスター分析を行った結果(もちろん、雪本様の素晴らしい
> ツールを使わせて頂いております)の記載の仕方を教えて頂きたくお願い致します。
> デンドログラムをレポートの中に盛り込みたいのですが、図だけではなく、クラスター分析の
> 結果の「ステップ」、「平方距離」、「距離」、「融合クラスター」のデータを併記する
> 必要があるように思うのですが、いかがでしょうか。
> また、このデータの見方も教えて頂けると助かります。
まず最初にクラスター分析についての基礎知識。
クラスター分析と一言で言っても,実はいろいろな種類があります。大雑把に分けると,「階層的クラスター分析:デンドログラムを描くタイプ」と「非階層的クラスター分析:クラスター数を指定して,コンピュータにクラスターを強制的に作らせるタイプ」に大別できるでしょう。「統計tool+ct」で実行できるのは前者の階層的クラスター分析です。
階層的クラスター分析の場合の一番の特徴は「デンドログラム(樹形図)」です。これにつきます。この樹形図を描くために,
> 結果の「ステップ」、「平方距離」、「距離」、「融合クラスター」のデータ
が必要になるわけであり,要するに,樹形図があるならば,わざわざ「ステップ」などの情報はいりません。もう一度繰り返しますが,これらの情報は樹形図を描くための情報であり,樹形図からこれらの情報を読み取ることができます。
<クラスター分析問題>
日本国内の五つの都市(A市,B市,C市,D市,E市)が,それぞれがどの程度似ているかを調べたい.都市の特徴のうち,「X1:歴史の古さ」「X2:寺院の多さ」「X3:自然の多さ」に特に注目した.
このデータをクラスター分析にかけてみましょう。
■クラスター分析の結果(ウォード法)
この情報を元に,樹形図を描きます。樹形図を描く場合には,「①どのクラスター同士がどのような順番で結合していくのか,②どのぐらい素早く結合していくのか」が重要となります。①は「融合クラスター」の情報を,②は「平方距離」あるいは「距離」の情報を使います。ここでは,②は「平方距離」を使うことにします(特別どちらでなければいけないというものではありません)。
最初に結合するのは(ステップ1),【2】と【3】,すなわち【B市】と【C市】となります。平方距離は「9.00」ですね(最終的に「91.40」で全てが結合することを考えると,10%の距離?で結合,比較的早い段階で結合していることになります)。
次に(ステップ2),【2】(及び【3】,すなわち【2&3】クラスター)に【5】,【E市】が結合することになります。平方距離は「29.67」ですね。こうして【2&3&5】クラスターができあがりました。
……もうおわかりですね? このように,「平方距離」と「融合クラスター」の情報をもっと分かり易く表示したものが,デンドログラム(樹形図)なのです。樹形図の作成法を知っていれば,逆に「平方距離」「融合クラスター」の情報も簡単に読み取れますね?
まとめたものが下図です。
結論としては,「(平方)距離」や「融合クラスター」の情報は不必要となります。
Dickyさんからのメルマガ「独学をすスめ 統計的研究法編」の過分な感想をいただきまして,雪本大変嬉しく思います(つか,照れる)。その後に,「クラスター分析の解説を行っていない」というお言葉で,「ずどーん」と衝撃を受けてしまいましたが(笑
落差をねらった攻撃,なかなか上手いですよ?(笑
さてはて,相談内容を見てみましょう。
> 前置きが長くなり申し訳ございません。
> で、質問なのですが、クラスター分析を行った結果(もちろん、雪本様の素晴らしい
> ツールを使わせて頂いております)の記載の仕方を教えて頂きたくお願い致します。
> デンドログラムをレポートの中に盛り込みたいのですが、図だけではなく、クラスター分析の
> 結果の「ステップ」、「平方距離」、「距離」、「融合クラスター」のデータを併記する
> 必要があるように思うのですが、いかがでしょうか。
> また、このデータの見方も教えて頂けると助かります。
まず最初にクラスター分析についての基礎知識。
クラスター分析と一言で言っても,実はいろいろな種類があります。大雑把に分けると,「階層的クラスター分析:デンドログラムを描くタイプ」と「非階層的クラスター分析:クラスター数を指定して,コンピュータにクラスターを強制的に作らせるタイプ」に大別できるでしょう。「統計tool+ct」で実行できるのは前者の階層的クラスター分析です。
階層的クラスター分析の場合の一番の特徴は「デンドログラム(樹形図)」です。これにつきます。この樹形図を描くために,
> 結果の「ステップ」、「平方距離」、「距離」、「融合クラスター」のデータ
が必要になるわけであり,要するに,樹形図があるならば,わざわざ「ステップ」などの情報はいりません。もう一度繰り返しますが,これらの情報は樹形図を描くための情報であり,樹形図からこれらの情報を読み取ることができます。
<クラスター分析問題>
日本国内の五つの都市(A市,B市,C市,D市,E市)が,それぞれがどの程度似ているかを調べたい.都市の特徴のうち,「X1:歴史の古さ」「X2:寺院の多さ」「X3:自然の多さ」に特に注目した.
――――――――――――――――― X1 X2 X3 ――――――――――――――――― A市【1】 8 9 8 B市【2】 3 5 10 C市【3】 2 3 12 D市【4】 4 7 15 E市【5】 6 1 10 ―――――――――――――――――
このデータをクラスター分析にかけてみましょう。
■クラスター分析の結果(ウォード法)
―――――――――――――――――――――――― ステップ 平方距離 距離 融合クラスター ―――――――――――――――――――――――― 1 9.00 3.00 2 3 2 29.67 5.45 2 5 3 52.33 7.23 2 4 4 91.40 9.56 1 2 ――――――――――――――――――――――――
この情報を元に,樹形図を描きます。樹形図を描く場合には,「①どのクラスター同士がどのような順番で結合していくのか,②どのぐらい素早く結合していくのか」が重要となります。①は「融合クラスター」の情報を,②は「平方距離」あるいは「距離」の情報を使います。ここでは,②は「平方距離」を使うことにします(特別どちらでなければいけないというものではありません)。
最初に結合するのは(ステップ1),【2】と【3】,すなわち【B市】と【C市】となります。平方距離は「9.00」ですね(最終的に「91.40」で全てが結合することを考えると,10%の距離?で結合,比較的早い段階で結合していることになります)。
次に(ステップ2),【2】(及び【3】,すなわち【2&3】クラスター)に【5】,【E市】が結合することになります。平方距離は「29.67」ですね。こうして【2&3&5】クラスターができあがりました。
……もうおわかりですね? このように,「平方距離」と「融合クラスター」の情報をもっと分かり易く表示したものが,デンドログラム(樹形図)なのです。樹形図の作成法を知っていれば,逆に「平方距離」「融合クラスター」の情報も簡単に読み取れますね?
まとめたものが下図です。
―――――――――― クラスター分析の重要結果 ――――――――― 0 10 20 30 40 50 60 70 80 90 └――┴――┴――┴――┴――┴――┴――┴――┴――┴ 【A市】──────────────────────────┐ 【B市】──┐ │ ├─────┐ │ 【C市】──┘ ├──────┐ │ 【E市】────────┘ ├──────────┘ 【D市】───────────────┘ ――――――――――――――――――――――――――――――――― ※デンドログラムは平方距離に基づいています
結論としては,「(平方)距離」や「融合クラスター」の情報は不必要となります。
コメント ( 6 ) | Trackback ( 0 )
公開相談(with Naitoさん)
( ゜д゜) 二人目の相談者ですよ?
You're Welcom!
> 統計初心者です。カイ2乗の下位検定の方法を調べはじめて2時間、
> ネットを彷徨っているうちに、このブログにたどり着きました。
> Bonferroni法やHolm法はクロス集計表の多重検定でも使用してよいのでしょうか?
> 唐突ですいませんが教えていただけると幸いです。
さすらいのNaitoさんの相談事項は上記のものでよろしいですね?
結論としては「使えます」!
雪本的に言えば,多重比較法は三種類に分類できます。
Scheffe法を代表とする統計量調整型多重比較法,Tukey法を代表とする分布調整型多重比較法,Bonferroni法を代表とする有意水準調整型多重比較法です。
同じ多重比較法であっても性質が異なるわけですが,汎用性が高いものが有意水準調整型多重比較法なのです。
「同時に比較を行う」というのであれば,その統計量が平均値であれ,あるいはχ2値であれ,あるいは相関係数であれ,何でもござれで処理してくれるのが有意水準調整型多重比較法です。何故そこまで汎用性が高いかというと,統計解析法の多くが最終的に「確率」の数値を導くからです。平均値の差の検定をt検定などで行った場合,最終的に「p(確率)」は○○と算出されますよね? χ2検定も同じですよね? だからこそ,確率を直接いじる有意水準調整型多重比較法はすごいわけです。
You're Welcom!
> 統計初心者です。カイ2乗の下位検定の方法を調べはじめて2時間、
> ネットを彷徨っているうちに、このブログにたどり着きました。
> Bonferroni法やHolm法はクロス集計表の多重検定でも使用してよいのでしょうか?
> 唐突ですいませんが教えていただけると幸いです。
さすらいのNaitoさんの相談事項は上記のものでよろしいですね?
結論としては「使えます」!
雪本的に言えば,多重比較法は三種類に分類できます。
Scheffe法を代表とする統計量調整型多重比較法,Tukey法を代表とする分布調整型多重比較法,Bonferroni法を代表とする有意水準調整型多重比較法です。
同じ多重比較法であっても性質が異なるわけですが,汎用性が高いものが有意水準調整型多重比較法なのです。
「同時に比較を行う」というのであれば,その統計量が平均値であれ,あるいはχ2値であれ,あるいは相関係数であれ,何でもござれで処理してくれるのが有意水準調整型多重比較法です。何故そこまで汎用性が高いかというと,統計解析法の多くが最終的に「確率」の数値を導くからです。平均値の差の検定をt検定などで行った場合,最終的に「p(確率)」は○○と算出されますよね? χ2検定も同じですよね? だからこそ,確率を直接いじる有意水準調整型多重比較法はすごいわけです。
コメント ( 3 ) | Trackback ( 0 )
公開相談(with ゆーすけさん)
( ゜д゜) 皆さんの前にさらけ出して下さい!(笑
質問者「ゆーすけ」さんからの相談スレッドです.質問者さんは,この文章に対してコメントお願いします.
質問者「ゆーすけ」さんからの相談スレッドです.質問者さんは,この文章に対してコメントお願いします.
コメント ( 3 ) | Trackback ( 0 )