独学をすスめ 多重比較論①

( ゜д゜) 以下の学習論は,完全なる初学者を対象にしていません。
    t検定と多重比較(原理はよく分からないけど,有意差を調べるための
    道具である)を知っていることを前提にしています。


綾:「t検定の単純繰り返しは駄目だけど,多重比較なら構わない」

篠:綾姉さん,唐突に何ですか?

卓:多重比較の解説をしている教科書でよく見られるフレーズだな,それ。

綾:そうそう。

  確認だけど,t検定と多重比較は,分散分析と同じく「差異の統計法」に分
  類される統計道具ということは良いわね?
  そして,「t検定は二変数(水準)用の平均値の有意差を調べる道具であり,
  分散分析と多重比較は三変数(水準)以上の平均値の有意差を調べる道具で
  ある」……こんな風に説明している教科書が多いわ。
  でも,この説明文って不親切よね?

卓:あー,まー,そうだなぁ。
  実際,僕の以前の統計法諸学者向け講座でもそんな風に説明していた。

篠:すみませんが,もう少しはっきりと説明していただけないでしょうか?
  「t検定は二水準用,分散分析・多重比較は三水準以上用」という説明に何
  か問題があるのですか?

卓:いや,その説明自体に問題はない。
  問題なのは,t検定と多重比較との関係だな。

篠:?

綾:ねえ,篠。「t検定は二水準,多重比較は三水準以上」という文を読んでし
  まったら,「t検定と多重比較はなんだか異なる計算原理に基づく別物」だ
  というイメージを持ってしまうのではないかしら?

篠:別物だと思っています。

綾:ふむふむ。まあ,確かに「ある要素」が追加されているから,別物ではある
  んだけど。

卓:結論から言えば,t検定と多重比較は本質的には同じ手法なわけだな

篠:……いまいちよく分かりません。

卓:だろうなぁ。この辺を強調して説明した教科書とか少ないし。
  でも,この辺が分かれば,多重比較がかなり整理できるようになるぞ。

綾:ヒントは,「何故単純な繰り返しt検定は駄目なのか?」を徹底的に考える
  こと。

篠:……ひょっとして,新しい「独学をすスめ」でしょうか?

卓:まあ,そういうことだ。

(続くかな? かな?)
コメント ( 0 ) | Trackback ( 0 )

分析思想の変革教育

( ゜д゜) かいき~

bobさんの重回帰分析教育を見ての徒然……。というか,これが雪本さんの考えている教育法ですな。

統計法は人によって学習段階が異なるわけで,また,必ずしも同じ経路を経ているわけでもありません。よって,同じ手法に対しても,統計法教師の持っている知識と,学習者の持っている知識は異なってくるわけです。

さて,「要因分析=重回帰分析」と考えている学習者に対してですが,まずは意識改革をしてもらう必要があります。というよりは,昔は,「多くの変数を投与してなるべく説明力の高いモデルを選ぶ」という思想がありました。いわば「全体説明力の重視」の立場です。なので,このような考えを持つことはあながち間違いとは言えないわけです。

しかし,今では,異なる思想が主流となってきたために,上記は「正しくない」と考えられています。「なんでもかんでも説明変数を投与するのではなく,本当に効果のある説明変数のみに厳選する」という発想が今の考えですね。こちらはどちらかというと「部分説明力の重視+効率性」の立場です(まるっきり全体の説明力を無視するわけではありませんが)。むしろ要因分析と考えている人ならば,操作する要因は「操作しやすく,少ない方がよい」ということを知っているのではないでしょうか? 今の思想はこれを継承しています。

この効率性ということを考慮しているために,「全体モデルの説明力(決定係数)」についても「変数の数が無駄に多いとペナルティを課す」ように修正を施した指標が考えられているわけです。これが「自由度調整済み決定係数」などをはじめとする現在普及している指標なわけです。

ただ……最初に,素朴に「全体説明力が高い方がよい」という昔ながらの発想は悪くはない,と述べました。それは何故かというと,重回帰分析をはじめとする多変量解析のほとんどは「モデル全体の説明力を高くするようなモデルを構築」する計算思想に基づいているからです。すなわち「偏回帰係数の分析」などのように,部分の分析は,後になって「こういう分析もやってもいいんじゃないかな?」としてされるようになったものと考えられます。

このように,分析の背後に隠された思想というものを発見して,その思想の改革を,そして,必ずしも昔の思想が間違っていた,という進化論的批判をするのではなく,相対的に評価することが大事だと思います。

(´-`).。oO(一ヶ月前の記事だけど,何となく書いてしまった雪本さん)
コメント ( 0 ) | Trackback ( 0 )

順序尺度版多重比較

( ゜д゜) ねぇ,僕のこと覚えてる? 覚えてる?

忘れ去られてしまうと,とってもしょんぼりしてしまうだろう雪本さん.

まあ,あれです.大学に投稿する紀要(いわゆる「同人誌」)をちまちまと執筆しておるわけですが……

多重比較ネタで書くことは決めております.
二本書くつもりですが,一本は間隔尺度版多重比較,雪本的には多重比較の基礎論となるもの書くつもりです.
つか,おぼろげにたたき台なるものは書きました.

残り一本は,基礎論を踏まえて,これをノンパラメトリック版多重比較に「応用」させた,要するに順序尺度版+名義尺度版多重比較を書く……「つもり」でした.

ところで,雪本的には,多重比較は一対比較型と対比型に分類できるわけですが,両者は,後者を汎用,前者をその特殊形と位置づけることに成功しています.少なくとも,間隔尺度については.

んで,順序尺度やら名義尺度については,その汎用-特殊なるものが上手く整理できていなかったのですが……

ひとまず,順序尺度版「対応なし」については汎用-特殊の関係性をなんとか整理できました(^_^)
あとは,「対応あり」について整理できれば,順序尺度版多重比較についてもかなり整合性の高い論を主張できそうです.
そうなると,紙面の関係から?,順序尺度版多重比較のみに焦点を当てた方が良さそうだな,と思うようになりました.

(´-`).。oO(名義尺度版多重比較については別の論文で書こうと思う雪本さん)

上記の「汎用-特殊」の整理をする過程で,クラスカル・ウォリス検定が,「順位データの分散分析」と呼ばれる所以がわかりました.
今なら,クラスカル・ウォリス検定の計算式を忘れても,一要因対応なし分散分析の計算プログラムがあれば,クラスカル・ウォリス検定の統計量を算出することができます.

要するに,クラスカル・ウォリス検定の計算式の思想がわかったということであり,通常の分散分析と何が違うのかわかるようになりました.

( ゜д゜) がんばれ雪本さんっ!

PLUS!(追加文)

がんばった雪本さん,何とか,順序尺度版「対応あり」の汎用-特殊の整理にも成功しました!

Θ・) がんばったよ?

コメント ( 0 ) | Trackback ( 0 )

( ゜д゜) 灯りをつけましょう盆休み♪

夏バテには弱い雪本さん.

Θ・)

寒いのならば,服を着込むことでなんとかなりますが,暑いのは……駄目です.

Θ・)

駄目駄目なのです.

Θ・)

そんなつぶらな瞳で見るなぁっ!
コメント ( 0 ) | Trackback ( 0 )

対比式

( ゜д゜) 暑いから夏っていうんじゃー

雪本的に,データ解析法は「差異の統計法」と「類似の統計法」とに大別できます。前者には,t検定をはじめとして,分散分析やら多重比較があったりしますが,意外と知られていないのが「対比」です。
t検定を複数変数版に修正したものが多重比較ですが,対比もt検定を修正というか,拡張したものです。t検定やら多重比較はある水準のデータをそのまま使おうとしますが,対比とは,そのまま使うのではなく,複数の水準データを組み合わせることに本領を発揮します。

水準:中学校,高校,大学,大学院

多重比較であれば,中学校vs高校のように水準データをそのまま使いますが,対比では,「大学受験前(中学校&高校)vs受験後(大学&大学院)」のようにデータを組み合わせることができるわけです。

さて,データ解析では,データに「対応がある」か「対応がない」かは重要な基準ですが,多くの統計法教科書には,対比式そのものが紹介されていない,されていても「対応なし」対比しか紹介されていません。

工夫によっては「対応なし」対比式を使って,「対応あり」対比の計算を行うこともできますが,その辺の解説を丁寧にしているものはほとんどありません。要するに,「対応あり対比」式については,「できるのか? できるとしても具体的にどうやってやるかは不明」という状態です。

この「対応あり」対比はSPSSで実行できますが,SPSSの対比は自由自在に水準を組み合わせることはできません。自在に組合せをしたいときには,計算式が必要となるわけですが,それが紹介されていないわけですから,やっぱり「不明」なわけです。

んで……

ここ数ヶ月ぐらいかけて,計算式を見つけました。というか,対応ありt検定を拡張して自分で作りました。それで,SPSSの計算結果と同一になることを確認しましたので,間違いないでしょう。
……というか,後から調べると,わかりにくいけど,文献があったんですけどね……
コメント ( 0 ) | Trackback ( 0 )

リンクなcool

( ゜д゜) リンクされていることを知るとほんわかー

このサイト(と,元のサイト)は当然の如く,統計教育に関するサイトです.他の統計法解説サイトとの差異は,他のサイトが「統計法の解説」をしているとするならば,このサイトは「統計法を効率よく学習するための支援サイト」,すなわち「統計教育」であることが挙げられます.

ときどき検索を使ったりして,このサイト(と,元のサイト)にリンクを張って下さっている人がいることを発見すると,雪本さんは「にへらー」と微笑みを浮かべたりします.

Θ・) 嬉しいからですよ?

話を唐突に変える……

それはともあれ「cool」と言う言葉について.
ただ今の季節にとっては渇望の対象となる「cool」……「冷え冷え」?
「cool」という形容詞は,人の性格に対しても使われます.

( ゜д゜) 「おまえはcoolなやつだ」「俺ってcool!?」

そんな感じな文例.

雪本さんもちょっぴりあこがれ風味ですが,心の底からというわけでもなし.つか,雪本さんはどう転んでもcoolなんぞ似合いもしねぇ.

Σ( ゜□゜) coolとは「冷静」ではなく,「さぶい」という意味か!?(多分違っ

でもcoolな人を見るのは好きです.雪本さんの周りの誰か,coolを目指して下さい.

(´-`).。oO(むちゃくちゃ他力本願)
コメント ( 0 ) | Trackback ( 0 )

対応あり対比式

( ゜д゜) うだーる,うだーるっ!

日本の夏です.

この夏,多重比較についての紀要を書く予定の雪本さん.
既にその学習成果?は,本blogで紹介しているわけであり,それを固い言葉でまとめようとしています.

ただ今,頭を悩ませているのが,「対応あり対比式」の簡略版です.一応詳細版の計算式は分かったのですが,計算を簡略化するにあたって,多少の前提を置くことで,簡略版がないかを探しています.

んで,今見つけたのが,「分散が等質,水準間の相関が等質」という仮定を置いた場合,

 対応あり対比式=対応なし対比式×(1-相関係数)
 ※この場合の分散は,対応なし分散分析の誤差項を用いること

というものです.
でも,対応あり分散分析をした後に求められる誤差項(対応ありの誤差項)を使った計算式はないかなーと探しています.
つまり,単純に対応あり対比式の計算式に,「対応なしの誤差項」の代わりに「対応あり誤差項」を代入すればよいのか? それとも,それは不適切なのか……

(´-`).。oO(悩むー)
コメント ( 0 ) | Trackback ( 0 )