不偏分散と1/(n-1) では
単純に,どちらがもっともらしいか示すだけで十分では?
極端な場合を見せれば十分かな?
> n <- 2
> loop <- 10000
> u <- v <- numeric(n)
> for (i in 1:loop) {
+ x <- rnorm(n)
+ u[i] <- var(x)
+ v[i] <- var(x)*(n-1)/n
+ }
> layout(matrix(1:2, 2))
> hist(u)
> hist(v)
> layout(1)
> mean(u)
[1] 1.002552
> mean(v)
[1] 0.5012759
もうちょっとあり得そうな例
> n <- 20
> loop <- 10000
> u <- v <- numeric(n)
> for (i in 1:loop) {
+ x <- rnorm(n)
+ u[i] <- var(x)
+ v[i] <- var(x)*(n-1)/n
+ }
> layout(matrix(1:2, 2))
> hist(u)
> hist(v)
> layout(1)
> mean(u)
[1] 1.004137
> mean(v)
[1] 0.9539302
ありません。サンプルサイズ2の研究で検定・推定をしている論文、あるんなら、ここで、具体的に挙げて教えてください。仮想的な数値例ではなく、理学・工学・医学・農学・社会科学など、実際のデータ解析でですよ?幸せなのは、あなたの頭でしょう。
> 傲慢なのでしょうか(^_^;)
最後に。お前が言うな。
普通はそうでしょうね。しかし,統計学の「研究者」という所に,若干の引っかかりはあります。『統計学を利活用する「研究者」』というのとはちょっと違うと言うことでしょうか?
> 「ちゃんと推定できる」そう断言しておられるところがすごいと思います
だってそうでしょう,「nが幾つ以上ならちゃんと推定できる(妥当な推定ができるという,基準(閾値)がある」とでもお思いでしょうか」という。
前にも言ったように,場合によっては,一度に 2 つしかサンプルを採れないということもあるわけです。確かに,サンプルサイズが2であれば,母数の信頼区間がとてつもなく(?)大きいこともあり得るでしょう。しかし,それが現実的な制約だし,その制約の範囲内で最良の推定をする必要があるし,それを保証するのが近代統計学でしょう。
> 私は、Small sampleのデータ解析はたくさんしてきましたし
たぶん,あなたが仰る Smalle smple というのは少なくとも n ≧ 10 とか 20 のレベルなのではないでしょうか?もっと少ない n 数で勝負しなければならない分野もあるということは思いやる必要はあるのではないでしょうか?
> 貴方は、「サンプルサイズの設計」をされたことはありますか?「サンプルサイズを設計する意味」をご存知ですか?
ないと思うのでしょうか?なぜそういう疑問というか挑戦を突きつけるのか,意味が分かりませんね。傲慢なのでしょうか(^_^;)
サンプルサイズの設計をして,とてもそんなサンプルサイズを揃えるのは無理だということもあるし,ぎりぎり得られるサンプルサイズでどれくらいのことがいえるだろうかと試算して,絶望することもあるけど,絶望しても意味ない,やれるだけのことをやって,その限界を留保する,という現実もあるわけですよ。
サンプルサイズ設計して,それだけのサンプルをなんの苦もなく得られるなら,どんなに幸せなことか。
> 「N=2で推定がうまくいく」と自信を持っておっしゃる方には、はじめて出会いました。
そんな状況,いくらもあるし,それを知らないあなたは幸せ者ですね。
> 母分散は,n=2 の場合でもちゃんと推定できますという所に意味があるのです。
「ちゃんと推定できる」そう断言しておられるところがすごいと思います。私は、Small sampleのデータ解析はたくさんしてきましたし、Small sampleの統計理論の論文も書いていますが、さすがに「N=2で推定がうまくいく」と自信を持っておっしゃる方には、はじめて出会いました。そういう専門家の方もおられるのですね。
ところで、貴方は、「サンプルサイズの設計」をされたことはありますか?「サンプルサイズを設計する意味」をご存知ですか?
「不偏分散と1/(n-1)」 では
ということ。括弧部分がアンカーになっているので。最後の「は」はなかった方が,日本語としてはよいですね。
「サンプルサイズ2の例」は確かに極端ですが,シューハート管理図なんかで,n標本の「範囲」つまり最大値と最小値の差から母標準偏差を推定する係数まで用意されているのですよ。n=2 の場合の係数もちゃんとあります。
母分散は,n=2 の場合でもちゃんと推定できますという所に意味があるのです。
「データ解析、したことありますか?」ありますよ(^_^)
あなたのイメージでは,ビッグデータ(とまでは行かなくても)なんかを扱うのをデータ解析とよぶのでしょうね。
分野と状況によっては,いつも十分な量のデータを使えるわけではなく,そう言う場合も推測統計学が必要なこともあるのです。
そして、サンプルサイズ2の例って、形式的な例にしてもナンセンスです。サンプルサイズ2で分散を求める意味、ないでしょう(データ解析、したことありますか?)。