パラメトリック/ノンパラメトリック

( ゜д゜) ノンパラ!

ことりさん,勝手にネタに使ってしまってすみません!

統計解析法には実に沢山の種類があるわけですが,その中にはノンパラメトリック検定なる一連の手法があります。

雪本さんおなじみの「統計tool」で実行できるほとんどの統計解析法はパラメトリックな統計解析法に分類されるものですが,一体「パラメトリック/ノンパラメトリック」の区分とは何でしょうか?

統計解析法では「有意かどうか」を判断するときに「確率」という数値を参考にします。この「確率」というものがどうやって求められるかに「パラメトリック/ノンパラメトリック」の区分が関係しています。

統計学には「標準正規分布」「t分布」「F分布」「χ2分布」「二項分布」など実に様々な確率分布が開発されています。難しい話をすっ飛ばせば,「このデータは○○と呼ばれる確率分布の情報を使って『確率』を求めよう」とする統計解析法のことを「パラメトリック」検定呼びます。これに対して「特定の確率分布の除法を使わずに『確率』を求めよう」ものを「ノンパラメトリック」検定と呼びます(あるいはこの理解も不正確かもしれませんが,初級編においてはこの理解で特に問題はありません)。

例えば,「t検定」は「t分布」という確率分布を使って「確率」を求めます。「分散分析」は「F分布」の確率分布を使い,「χ2検定」は「χ2分布」の確率分布を使っています。これらは特定の確率分布を使うため「パラメトリック検定」ですが,ノンパラメトリック検定の場合は【基本的に】このような確率分布を使わずに【地道な作業によって】確率を直接求めているのです。確率分布を使うメリットは,「多分このデータは○○の確率分布に基づいているとしよう……そうすると,計算作業が非常に簡略化できて……えーと…………はい,確率計算おしまーい」と確率計算が素早くできます。一方ノンパラメトリック検定の場合は計算の簡略化ができないため,高校数学で学んだ「場合分け」の作業を駆使しなければなりません。今ではコンピュータに計算作業をさせると言っても,当然ながら簡略化された計算が使えるのならば,その方法を使った方がパソコンの負担も軽くなります。

このように「パラ/ノンパラ」区分は「データ数が多い/少ない」の区分とは関係ないのです……直接的には。

さて,実際の研究データは実際には○○の確率分布に基づいているとは言えません。「あー,このデータは○○の確率分布に必ずしも基づいていないから○○の確率分布の情報を使うのはちょっと強引かな? でも○○の確率分布に強引に基づいているとした方が計算がすごーく楽だよな…………よーし,ちょっと強引だけど○○の確率分布に基づくと仮定して計算しちゃおう」と強引な使用法が幅をきかせることになります。
しかし,このような強引の使用法をする研究者達ですが,彼らも実は根拠を以てこのような使用法を採用していたのです。それが「中心極限定理」と呼ばれるもので,簡単に言えば「元のデータが何であっても,多少○○の確率分布に基づいていなくとも,データ数が大きければ,そのデータの統計解析法には(元のデータがどのような確率分布に関係なく)『(標準)正規分布(およびそれから派生した「t分布」「F分布」「χ2分布」)』を使うことができるよ」という魔法の定理なのです。

この魔法を使うことによって,データ数が大きければ,データがどのような確率分布をしているかを考慮しなくとも良くなりました。

○データ数が多い場合
 どんな確率分布のデータ → 中心極限定理で「正規分布」系が使用可

○データ数が少ない場合
 ○○の確率分布(あるいはそれに近い)データ → パラメトリック検定ok
 ○○確率分布から大きく外れているデータ → ノンパラメトリック検定

上記のような区分ができたために,誤解として「データ数が少ない時にはノンパラ」が広まってしまったのです。しかし,データ数が少なくとも,そのデータが○○の確率分布に近いのであれば,全く問題なしにパラメトリック検定を使うことができます。

さて,話が長くなりましたので,そろそろ終わりますが,最後に!

統計解析法を使う場合には,データの尺度として「名義尺度」「順序尺度」「間隔・比率尺度」を区分した方がよいですが,「順序尺度」データにおける条件間の代表値の差異を調べる方法に以下のような手法があります。

○順序尺度版一要因二条件(対応なし)の差異統計法
 ※順序尺度版「対応なしt検定」に相当

 マン・ホイトニー検定(Mann-Whitney U test)

○順序尺度版一要因二条件(対応あり)の差異統計法
 ※順序尺度版「対応ありt検定」に相当

 符号検定 or 符号付き順位検定
 
なお,「マン・ホイトニー検定」の他にも「対応なし」検定法として「ウィルコクソンの順位和検定」が挙げられますが,両者は数学的原理としては全く同じです(同じ結果を導きます)。

Θ・)ノ「ことりさんが 挙げている 三手法は本質的にどれも同じ」
コメント ( 1 ) | Trackback ( 0 )

多重比較の物語

( ゜д゜) 二月も終わりそうっ!

ひっそりとブログアクセスを調べてみますと,なんだか,Tukey型多重比較に関する説明ページが人気あるみたいです。
なんか,そんなにTukeyが好きですか? と問いたくなります。
雪本的には,Bonferroni法を代表とする有意水準調整型多重比較法が好きなので,ほんのちょっぴり切なく思ってしまうのは秘密でしょうか?

でも多重比較法の歴史を眺めると,以下のような物語が考えられます。

+++++++++++++++++++++++++++++++++++++++++++++++++++++++

Bonferroniさん,Tukeyさん,Scheffeさんの三人が最初に存在しました。
それぞれ自分の観点から多重比較問題に対処していました。
しかし,多重比較問題が,差異を調べるという問題に焦点化されていくようになります。本来多重比較は決して差異を調べるだけに限定されたものではありませんが,使用者はその問題への興味を高めていくのです。
そうすると,元々差異の統計の文脈で多重比較問題を対処していたTukeyさんがその勢力を伸ばすことになります。

Tukey「我が時,来たり!」

こうして,多重比較といえばTukey派と呼ばれるほどの時代になってしまったのです。そのような時代になりScheffeさんは早々に姿を消しました。
Bonferroniさんは,そのような時代に対して,Tukey派の多重比較アプローチだけでは問題ありとTukeyさんに一生懸命に意見を述べます。
しかし,多くの統計ユーザーがTukeyさんを求め,Bonferroniさんを望むことは少なかったのです。

Tukey「負け犬の意見など,聞かん!」

―――結局,Bonferroniさんも多重比較の表舞台からその姿を消したのです。
差異の分析法以外の多重比較問題においてひっそりと活躍していたなどの噂も流れましたが,Tukeyさんにとっては関係のないこと。
覇者の道を歩いていきます。

時が流れ。
Tukey派による帝国が作られるようになりました。もはや多重比較を扱う資料にはBonferroniさんやScheffeさんの名前が省略されてしまい,一部の者が知るのみとなってしまいました。

しかし,Tukey帝国にも陰りが見えます。独裁的なTukey帝国では,異なる意見がでなかったため,発展の加速度が落ちてしまうのです。Tukey派が独裁となってしまったため,それ故に,Tukey派の問題点も浮き彫りになってしまったのです。
このままではTukey帝国がどうなってしまうのかという不安が蔓延してきた,その時です!

Bonferroniさん「―――ただいま」

差異の統計法以外の多重比較問題でひっそりと活躍をしていたBonferroniさんが,危機に陥ったTukeyさんを,かつての友を救うために戻ってきたのです。

Tukeyさん「我を笑いに来たか?」
Bonferroniさん「――違うよ」
Tukeyさん「―――――そうか」

いろいろな問題に対応できるBonferroniさんは実は非常に強力です。しかし,Bonferroniさんは,自分の我を通すのではなく,Tukeyさんの弱点を補う形でその能力を発揮していくのです。
Tukeyさんが実力を発揮する場面では,Tukeyさんの意見を通して,そればかりではなくよりTukeyさんの意見をサポートしたりしました。そしてTukeyさんが非常に苦手とする場面に対して,Bonferroniさんが自分の意見を述べるのでした。

+++++++++++++++++++++++++++++++++++++++++++++++++++++++

以上,多重比較を擬人化して多重比較の歴史を大雑把に述べてみました。
雪本は多重比較の歴史をちゃんと調べていないので,上記は正しい流れになっていなかったりしますが(意図的に変更した部分もあったりします),まあ,大雑把な流れを知るという意味ではいいのではないのかな?

なお,Tukeyさんは分布調整型多重比較法,Bonferroniさんは有意水準調整型多重比較法,Sheffe法は統計量調整型多重比較法を意味しています。よってBonferroniさんの中には,Bonferroni法だけではなくSidak法やらRyan法なども含まれたりしています。

ともかく,上記の「物語」からも分かるように,雪本はBonferroniさんが好きなのですよ。というか,Bonferroniさん万歳の立場の物語ということには注意して下さいね。Tukeyさんの立場の物語は全く異なる印象になると思いますので。

……というより,Tukeyさんがすごいいやなやつになっているよね。
ごめんね,Tukeyさん。ごめんね。
コメント ( 0 ) | Trackback ( 0 )

シェッフェ法の変法

( ゜д゜) シェッフェ! シェッフェ!

今年研究費で購入した本の中に『統計的官能検査法』があります。
これに探していたシェッフェ法の変法に関する計算法が書かれています。

一対比較法で有名なものにサーストン法とシェッフェ法があります。
両方とも,複数の分析対象の中から,二つの対象ペアを設定して,次々と評価を下していき,最終的に複数の対象に対する評価点を算出するという方法です。
サーストン法は「○○の観点で優れているものはどちらか」という択一的な選択法ですが,シェッフェ法は「どちらがどれだけ優れているかを」という程度を評価させます。

このシェッフェ法の方が色々な情報を得ることができるわけですが,データの収集によって,計算方法も異なり,

・シェッフェの一対比較(原法)
・シェッフェの一対比較(芳賀の変法)
・シェッフェの一対比較(浦の変法)
・シェッフェの一対比較(中屋の変法)

とこれだけの種類があります。
現在,これらを組み込んだ「一対比較法.xls」を作成中(修正中)です。

Θ・)ノ「げんざい いそがしいから こうかいは まだまだま~だ さきだけど」

そんな感じです。
コメント ( 0 ) | Trackback ( 0 )

統計toolシリーズ「一対比較法(仮)」のup

( ゜д゜) ひさしぶりのファイルアップ!

みなさん,みなさん。雪本さんはこっそりしていますよ?

何やらHolm法の話題にコメントをしていただいた方がおられまして,誰でしょうという感じでその方のサイトを見てみまして。吹きました。
多重比較法関連のサイト・ブログで時々チェックさせていただいているNader.comさんではないですか!

なんというか,雪本は謝りたくなりました。

m(_ _)m コメントありがとうございます。

あと,そのHolm法のページですが,アクセス解析を見てみると,教えて!gooのとある質問で引用されていました。

なんということでしょう。ひっそりと生きていくという雪本に苦難がっ!

m(_ _)m maokiさん,引用ありがとうございます。

逆に名前をさらしてしまう雪本さん(いや,本当に嬉しかったですよ)。

話は変わって。

雪本のところに来るのは,スパムメールだけではないかと思えるほど,意味のあるメールがあまり来ません。ちょっと寂しいです。
んで,今日もメールをチェックしていたんですね。そうしたら,雪本が放置していた一対比較法のExcelファイルに興味を持たれた方がおられまして,その方がメールをくださったのです。

それを見た雪本は(略)で,(略)となり,(略)です(謎)。

Θ・)ノ「まあ ゆきもとが たまたま きぶんが のっていたので」

というわけで,ひっそりこそこそとupしましたので,どこにあるか自分で探してダウンロードしてください。

ただ,雪本が作った統計toolはあくまでも学習用と位置づけております。公的な研究データの分析に使うことに対して責任を持ちません。別の適切な分析道具を使うことを強く推奨します
もし,間違った分析結果が出ても,雪本は責任を持ちません。もし使われる場合は,その旨を承知していただき,ご使用ください。


コメント ( 0 ) | Trackback ( 0 )

はくしのむら

( ゜д゜) しんみり

博士(はくし)が100人いるむら

はくしのむら

切ないよぅ,な創作童話の紹介です。
コメント ( 0 ) | Trackback ( 0 )

一対比較法へのチャレンジ

( ゜д゜) やはり刺激になっています!

異なる分野の人たちと勉強会をしたおかげで(今回は雪本が主として説明担当でしたが),刺激になるものです。
心理学は効果的な分析道具,測定道具を提供する役割を持っているのだと思いました。

Θ・)ノ「で」

作ろう,作ろうと思っていた「一対比較法」のExcelファイルを作ることにしました。ようするに「統計toolシリーズ」の新しいお仲間です。

かなり前に,こっそりこそこそとBobさんから「サーストンの一対比較法」のExcelファイルをもらっていましたのですよ。しかし,このファイル,使いやすさやレイアウトなどが,雪本が試しに作っていたファイルに比べて良かったのです。雪本さん,へこみましたよ(笑

んで,へこみにより,封印をしていたんですが!

最近統計に関する資料を集めたりなどして,再チャレンジすることにしました。とりあえずサーストン法の一種類だけではbobさんのに立ち向かえないので,「質より量」の作戦で,サーストンの一対比較法の他に,シェッフェの一対比較法のセットにすることにしました。

( ゜д゜) これでリベンジをはかるぞー

現段階で,ひとまず,シェッフェの一対比較法を完成させました。後は,サーストンの一対比較法です。
近いうちに公開できると思います。
コメント ( 4 ) | Trackback ( 0 )

Excel分析ツールの「分散分析」

( ゜д゜) Excelの分析ツールの分散分析は癖がありすぎ!

Excelのアドイン「分析ツール」の中には「分散分析」として,「一元配置」,「繰り返しのある二元配置」,「繰り返しのある二元配置」の三種類が用意されています。

雪本にとって馴染みのある表現を使えば,次の通り。

・【一元配置】 → 一要因(対応なし)分散分析
・【繰り返しのある二元配置】 → 二要因(対応なし×なし)分散分析
・【繰り返しのない二元配置】 → 一要因(対応あり)分散分析
※ただし,各条件の人数は等しいものとする


【一元配置】or【繰り返しのない二元配置】の例題(Excel準備)

 ──────────────
    a1  a2  a3  a4
 ──────────────
    6   3   5   5
    6   1   4   2
    4   2   5   4
    8   2   4   6
    7   4   6   3
    5   2   2   4
 ──────────────


○一元配置(対応なし分散分析)
 上記のようにデータをExcelで入力・準備しておきます。ツールの入力範囲を「数字部分」とします。方向はデフォルトの「列」にしときましょう。結果表を読み取る時には,下記に注意しながら解読します。

 ・「グループ間」変動要因 → 「要因」変動因
 ・「グループ内」変動要因 → 「誤差」変動因
(・「全体」        → 「全体」)

○繰り返しのない二元配置(対応あり分散分析)
 上記のようにデータをExcelで入力・準備,ツールの入力範囲を「数字部分」とします。結果表における注意点は以下の通り。

 ・「行」変動要因  → 「被験者」変動因
 ・「列」変動要因  → 「要因」変動因
 ・「誤差」変動要因 → 「誤差」変動因
(・「全体」     → 「全体」)

【繰り返しのある二元配置】の例題(Excel準備)
 ───┬─────────
    │  b1   b2
 ───┼─────────
  a1 │  3    4
    │  3    3
    │  1    4
    │  3    5
    │  5    7
 ───┼─────────
  a2 │  3    2
    │  5    6
    │  2    3
    │  4    6
    │  6    4
 ───┴─────────


○繰り返しのある二元配置(対応なし×なし分散分析)
 上記のようにデータをExcelで入力・準備,ツールの入力範囲を「『ラベル名を含めた』数字部分」とします。そして「1標本あたりの行数」欄にて条件の人数を入力します。今回の場合は「5」となります。結果表における注意点は以下の通り。

 ・「標本」変動要因(行)   → 「要因A」変動因(A要因は行方向の違い)
 ・「列」変動要因       → 「要因B」変動因(B要因は列方向の違い)
 ・「交互作用」変動要因    → 「交互作用」の変動因
 ・「繰り返し誤差」変動要因  → 「誤差」の変動因
(・「全体」          → 「全体」)

となっています。

うーん。独特の表現が使われていたりわかりにくいなぁ。
コメント ( 0 ) | Trackback ( 0 )

統計toolのバージョンアップ2

( ゜д゜) またもやバージョンアップ!

せっせと担当授業「心理統計法」の授業プリントを作っている雪本さんです。
その授業では「統計tool」を使っているのでが,説明の都合上,「あったら便利だなぁ」として,質的データ(名義尺度データ)の記述統計量として「比」の表示欄を追加しました。

追加して,微妙にレイアウトも変更しました。
今回のバージョンアップは間違いの修正ではありませんが,よろしければ新しい「統計tool1.54」をダウンロードしてみて下さい。
コメント ( 2 ) | Trackback ( 0 )

統計toolのバージョンアップ

( ゜д゜) 間違えてた!

質的データ(名義尺度データ)の「散布度」である「情報量」について。
「統計tool」においても計算できるのですが,計算式にミスがありました。

今まで全く気づいておりませんでした。申し訳ありません。
修正版として,「統計tool1.53」をアップしました。
コメント ( 0 ) | Trackback ( 0 )

驚きの雪本さん

( ゜д゜) びっくりっ!

ひっそりひそひそとネット世界の片隅に居着いてるつもりだった雪本さん。
「いかに雪本さんが広まっていないか」を確認するためにときどき「独学をすスめ」「独学のすスめ」「雪本 統計」などのワードで検索をかけたりしています。

ええ,見事なほどに影響力がないかがわかりますね?

( ゜д゜) ところがっ!

今回,何かの拍子に「雪本卓」として検索をかけみました。
自分の(仮)名前を検索かけるなんて,痛々しい人間だとお思いでしょう。

自分でもそう思うのですが,その痛さの先に,驚くべきものがっ!

五十嵐俊彦先生の「統計解析における統計手法の選択方法―高いお金を出して統計ソフトを買わなくても、ホームページを使って統計処理ができる─」の論文がpdfで読めるのですが,この論文で「独学をすスめ」が紹介されていたのですよ!

このページ「通し番号31」(pdf直リンクなので注意)

なんつか,がびーん! というショックに見舞われてしまいました(笑

関係ないんですが,職場を歩いていたら,電灯の笠に頭をぶつけました。それ,なんというコント!? それを直近で見ていた先生たち(複数人に見られていました!)の視線が忘れられません!

ともあれ,その論文内での「独学をすスめ 統計的研究法編」の紹介文をこっそりと引用します。

「一押し!使いやすいソフトが1つになっている。著者の理解力によって、記載内容は読者の為に漫談風とし、判りやすい。分散分析の部分だけでもプリントして読むことをお奨めします。」

きゃーっ! ほめられていますっ! 恥ずかしいです!

……

五十嵐先生,過大なるお褒めのお言葉と紹介,ありがとうございました。

うーふーふーふ?

追伸
「厚生連医誌」が引用元ということですが……これは印刷出版された論文なのですか!? すると「雪本卓」という名前の初紙面デビュー?! 中の人(本名)の学術論文デビューと同じ年だ!?(笑
つまり,2004年は,中の人と,「雪本卓」の両方の名前のデビューだったのですね(なんつか,すごいです)
コメント ( 0 ) | Trackback ( 0 )

やっぱりt検定で問題なさそう

( ゜д゜) うぼぁー

最近ちょいっと自分の時間がもてるようになり,久々に,頭の中を統計モードにチェンジさせております。

うーふーふーふー

今回の統計学習では,名義尺度(2カテゴリ)の多重比較法がテーマです。
んで,どうにもこうにも考えているんですけど,やっぱり

0/1データに,【χ2検定を適用することを認めるのである限り】,t検定を適用することに問題はない!

と考えるに至りました。寧ろ,χ2検定よりも,小標本データに修正された分布(t分布)を使っている分だけ,t検定の方が良い気がします。

これは,マクニマー検定(対応あり0/1データ分析法)についても同様で,やはり(対応あり)t検定を使っても問題がないと思います。

つーか,計算原理からすると,本質的に同じもんじゃねーの?

無論,t検定が正規分布を本来仮定するデータ分析であることを重々承知の上で上記の発言をしております。
「t検定は正規分布……」という理由で「0/1データはt検定はだめじゃないの?」と反論しようと思っている方へ。

・標本データの分布と,標本平均の分布,とを区別しているか?
・中心極限定理を知っているか?
・χ2検定も,正規分布を仮定したデータ分析であることを知っているか?

以上の点を踏まえてもう一度考えてみてください。
今回の雪本の主張がわかると思います。

まあ,数理統計学でみっちりと基礎から勉強されている方からすれば,「何を当たり前のことを自慢げに語っているんだろ,こいつ」と思うような記事ですな,今回は。
コメント ( 0 ) | Trackback ( 0 )

少しずつ多重比較を頑張る(表現が変)

( ゜д゜) がんばれっ! 雪本さんっ!

時々,自分にエールを与えています。
今年度は,赴任初年度ということで,ほとんど自分の研究などはできませんでした。しかし,来年度から徐々に復活していきたいと思います。

とりあえずは…多重比較法!

このweblogの読者の多くが「多重比較法」をキーワードにされているようです。
なんというか,Tukey法が大人気みたいです。個人的にBonferroni系の多重比較法が大好きな雪本としては,すこしばかりTukey法に嫉妬の炎をめらめらと…

それはともあれ。

これまで,間隔尺度版多重比較法,順序尺度版多重比較法についての整理法を提唱してきました。この流れで,名義尺度版多重比較法についても整理法を考案したいのですが……

単純な多重比較法のやり方についてはアイデアは浮かんでいるわけですが,なるべく統一的な視点で多重比較法を整理したいので,この辺でうにょーんうにょーんと悩んでおります。

もう少し具体的に言えば,名義尺度における対比(複数の合成変数の比較)をどのように具体化すればよいのか,ということです。
とりあえず,名義尺度は「2カテゴリ」と「汎用カテゴリ(3カテゴリ以上)」とに分けて議論を進めないと混乱します。

混乱していますが,ちょっと頑張ってみます!

( ゜д゜) フォォォォォォー

コメント ( 0 ) | Trackback ( 0 )

一致係数=対応あり順位相関比?

( ゜д゜) エネルギはもう少しは続くよ?

岩原先生のノンパラメトリック統計法の教科書で勉強している雪本さん。

以前,(間隔尺度版の)相関比と,ケンドールの一致係数が同じタイプ・データに対して使うと同じ数値を返すと述べました。

ただいま,順位相関比(順序尺度版の相関比)を調べた今では,これが奇妙なことに気づきました。だってケンドールの一致係数のデータとは「対応ありデータ」だもん。
それに対して相関比は,計算上は「対応なし」として処理しています。
統計toolがどちらも同じ入力形式でできてしまうものだったから,勘違いが行われたわけです。

ようするに,本来の使い方をする順位相関比は,当然というべきか,間隔尺度版の相関比とは異なる数値を返すと言うことです。

逆に言えば,ケンドールの一致係数とは「対応あり順位相関比」と言うことができるわけです。

Θ・)ノ「きづいてよかった」

追伸


       (項目数k-1)×平均順位r^+1
 一致係数W=────────────────
             項目数k


      表 平均順位相関(r)と項目数(k)から導かれた一致係数
 ┌───┬───┬───┬───┬───┬───┬───┬───┬───┐
 │[r]│ k=02│ k=03│ k=04│ k=05│ k=10│ k=20│ k=50│k=100│
 ├───┼───┼───┼───┼───┼───┼───┼───┼───┤
 │ 0.00 │ 0.50 │ 0.33 │ 0.25 │ 0.20 │ 0.10 │ 0.05 │ 0.02 │ 0.01 │ 
 │ 0.10 │ 0.55 │ 0.40 │ 0.33 │ 0.28 │ 0.19 │ 0.15 │ 0.12 │ 0.11 │ 
 │ 0.20 │ 0.60 │ 0.47 │ 0.40 │ 0.36 │ 0.28 │ 0.24 │ 0.22 │ 0.21 │ 
 │ 0.30 │ 0.65 │ 0.53 │ 0.48 │ 0.44 │ 0.37 │ 0.34 │ 0.31 │ 0.31 │ 
 │ 0.40 │ 0.70 │ 0.60 │ 0.55 │ 0.52 │ 0.46 │ 0.43 │ 0.41 │ 0.41 │ 
 │ 0.50 │ 0.75 │ 0.67 │ 0.63 │ 0.60 │ 0.55 │ 0.53 │ 0.51 │ 0.51 │ 
 │ 0.60 │ 0.80 │ 0.73 │ 0.70 │ 0.68 │ 0.64 │ 0.62 │ 0.61 │ 0.60 │ 
 │ 0.70 │ 0.85 │ 0.80 │ 0.78 │ 0.76 │ 0.73 │ 0.72 │ 0.71 │ 0.70 │ 
 │ 0.80 │ 0.90 │ 0.87 │ 0.85 │ 0.84 │ 0.82 │ 0.81 │ 0.80 │ 0.80 │ 
 │ 0.90 │ 0.95 │ 0.93 │ 0.93 │ 0.92 │ 0.91 │ 0.91 │ 0.90 │ 0.90 │ 
 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │
 └───┴───┴───┴───┴───┴───┴───┴───┴───┘

コメント ( 0 ) | Trackback ( 0 )

計算のメモ

( ゜д゜) 単なるメモ書き

 ────┬───────────
     │ a1  a2  a3  a4
 ────┼───────────
  No.01 │  3  2  3  2
  No.02 │  2  4  3  4
  No.03 │  4  5  4  4
  No.04 │  2  3  2  2
  No.05 │  4  4  3  4
 ────┴───────────
  ※4項目(a1,a2,a3,a4)

  ─────────────────────
   変動因   SS  df  MS   F
  ─────────────────────
   要因   1.20  3  0.40  1.00
   被験者  11.20  4  2.80  7.00	
   誤差   4.80  12  0.40
  ─────────────────────
   全体   17.20  19  0.91
  ─────────────────────

                      1.20
・項目カテゴリからの関連性 =0.0698(=─────)
                     17.20

                     11.20
・被験者カテゴリからの関連性=0.6512(=─────)
                     17.20

コメント ( 0 ) | Trackback ( 0 )

相関からα係数へ

( ゜д゜) 学習メーモー

相関係数からα係数を導出する計算式を見つけました。


      項目数×平均相関値※
 α=────────────────
    1+平均相関値×(項目数-1)

  ※相関行列の対角要素を除去した相関の平均値

(計算例:前回の例題参照です)

 ──┬──────────────
   │  V1  V2  V3  V4
 ──┼──────────────
  V1│ 1.00
  V2│ 0.43 1.00
  V3│ 0.71 0.60 1.00
  V4│ 0.45 0.87 0.64 1.00
 ──┴──────────────

        0.43+0.71+0.45+0.60+0.87+0.64
 平均(r^)=───────────────────≒0.62
                6

      4×0.62
 α=──────────≒0.86
    1+0.62×(4-1)


         表 平均相関(r)と項目数(k)から導かれたα係数
 ┌───┬───┬───┬───┬───┬───┬───┬───┬───┐
 │[r]│ k=02│ k=03│ k=04│ k=05│ k=10│ k=20│ k=50│k=100│
 ├───┼───┼───┼───┼───┼───┼───┼───┼───┤
 │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ 0.00 │ 
 │ 0.10 │ 0.18 │ 0.25 │ 0.31 │ 0.36 │ 0.53 │ 0.69 │ 0.85 │ 0.92 │ 
 │ 0.20 │ 0.33 │ 0.43 │ 0.50 │ 0.56 │ 0.71 │ 0.83 │ 0.93 │ 0.96 │ 
 │ 0.30 │ 0.46 │ 0.56 │ 0.63 │ 0.68 │ 0.81 │ 0.90 │ 0.96 │ 0.98 │ 
 │ 0.40 │ 0.57 │ 0.67 │ 0.73 │ 0.77 │ 0.87 │ 0.93 │ 0.97 │ 0.99 │ 
 │ 0.50 │ 0.67 │ 0.75 │ 0.80 │ 0.83 │ 0.91 │ 0.95 │ 0.98 │ 0.99 │ 
 │ 0.60 │ 0.75 │ 0.82 │ 0.86 │ 0.88 │ 0.94 │ 0.97 │ 0.99 │ 0.99 │ 
 │ 0.70 │ 0.82 │ 0.88 │ 0.90 │ 0.92 │ 0.96 │ 0.98 │ 0.99 │ 1.00 │ 
 │ 0.80 │ 0.89 │ 0.92 │ 0.94 │ 0.95 │ 0.98 │ 0.99 │ 1.00 │ 1.00 │ 
 │ 0.90 │ 0.95 │ 0.96 │ 0.97 │ 0.98 │ 0.99 │ 0.99 │ 1.00 │ 1.00 │ 
 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │ 1.00 │
 └───┴───┴───┴───┴───┴───┴───┴───┴───┘


上表は,「相関からα係数へ」の公式に入力して作成したものです。
これを見て分かるように,同じ相関値であっても,項目数が多いほどα係数が高くなっていきます。

そうすると,相関係数とα係数との違いは何と考えればよいのでしょうか?
例えば,学生からこう質問されたらどう答えましょうか?

「二変数の類似性を調べる統計手法に相関係数があります。今,4つの質問項目(項目a,b,c,d)が類似しているかどうかを調べるために,[項目aとb][項目aとc][項目aとd][項目bとc][項目bとd][項目cとd]の全ペア(6ペア)で相関係数を算出して,その6つの相関係数の平均を,4質問項目の類似度(内的整合性)と考えました? これって考え方として駄目ですか?」

Θ・)ノ「うぬーん。うぬーん(考え中)」

上記の「相関からα係数へ」を踏まえて,雪本ならこう答えます。

「うん。平均相関値も悪くないと思うよ。考え方の方向性としては正しいと思うな。」「ただ,おしい点がある。それは,項目数が少ないときは,その項目が類似するのはそれほど難しくないけど,項目数が多いほど類似しにくくなると思うな。」「例えば,君と同じような人を見つけてくれといわれると,一人ならば何とか見つけられるかもしれないけど,求められる人が多いほど苦労するだろう? それと同じように,項目数が多いにもかかわらず,その項目が類似しているとなるとそれは大変なことだろうね」

「要するにね。項目数を考慮した類似度の指標があれば,それを使った方がよいと言うことだよ。その指標がα係数というんだね」

( ゜д゜) こんな感じだよー
コメント ( 0 ) | Trackback ( 0 )
« 前ページ