裏 RjpWiki

Julia ときどき R, Python によるコンピュータプログラム,コンピュータ・サイエンス,統計学

びっくりデータ

2012年10月19日 | 雑感

ビッグデータ(ビックデータと書く輩もいるようだが)って,「近代」統計学の対象か?

統計学では,サンプルサイズは 1000~10000 の範囲で十分だろう。

ビッグデータの必要性を説く輩は,統計学というか実利統計学(統計屋)なんだろうね。

例えば,日本全国,人口が(老いも若きも取り混ぜて)1億として,それをマーケット対象として,

そのうちのほんの0.001パーセントについて1億円の商売が成り立つとすれば,それは

100000000*0.00001*10000000=10000000000=100億円の商売

まあ,一企業が一契約で魅力ある商売なんでしょうね。

でも,こんなのは,近代統計学とはあんまり関係ないように思う。まあ,お好きに金儲けすれば宜しいでしょう。

なんか,オレオレ詐欺みたいですなあ。

コメント (3)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

ダメ出し:そうではない

2012年10月19日 | 統計学

「医学・薬学・生命科学を学ぶ人のための 統計学入門 ―基礎の基礎からデータ解析の実際まで―」1.5 推定って?

> CIの間に母数(parameter)が入っている確率を「信頼係数 または 信頼頻度」と呼ぶ.(以下が,95%信頼区間)

信頼区間をキーワードでネット検索すると,あなたの理解とは異なった説明が一杯見つかると思います。例えば 「信頼区間って何?」(まあ,そこにも書いてあるように,ベイズ統計学は別)

なんの断りもなく,特殊な場合に成り立つ事柄を述べるのは不適切でしょう。

統計学,特に検定とか推定の場合,些細な用語の使い分けや解釈や説明の違いは大きな違い(場合によっては結果としてそれが誤っているなど)を生むことになりがち。

例えば,人によっては,「帰無仮説は採択できない,棄却しかできいないのだ」とか,「一元配置分散分析は,片側検定だ」という。これが正しいか,誤っているか,どうでもよいことなのかの判断は極めて難しい。

コメント (3)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

PVアクセスランキング にほんブログ村

PVアクセスランキング にほんブログ村