とーけい

2013-12-28 03:09:15 | 昆虫
お久しぶりです。
この記事はTDN覚書なので、スルーしてどうぞ。


最近は大学からの脱出のために論文を書いているのですが、これまで(盲目的に)扱っていた分散分析ANOVAから一般化線形モデルGLMに移行しなさいという命令が出たので勉強しています。

・・・
とある虫4種(A、B、C、D)がいて、各種の♀成虫の持っている卵の数を数えてデータにしました。グラフにすると、なんとなく種Bが一番卵を持ってそうだ。ということで、今までは分散分析をしてくれる有料ソフトに突っ込んで、P値をだし、P<0.05なら種Bが他より有意に卵を多くもっているといえる(多重比較とかやって、おわり)。というストーリーでした。

GLMとはいったい・・うごごご。
1晩いろんなウェブサイトを廻ってみましたが、よくわからない。どうも今までやってきたものとは毛色が違う様子?
図書館に走って本を適当に借りてきました。「データ解析のための統計モデリング入門 著:久保拓弥」の第3章まで読んでなんとなく理解。
今回の例で言うと、卵の数を計算するためのモデルづくり(観測データにうまいこと当てはまるようなモデルづくり)のための武器なのかな?
今までの線形モデルLM(分散分析ふくむ)では、前提条件で等分散性だったり正規分布だけだったり?なるほど聞いた覚えはある。といった感じ。GLMにレベルアップするとそういうのは考えなくてよい(自分で設定できる)?らしい。聞こえはシンプルでイイネ・
はてなマークばかりだけども、GLMを使うために統計ソフトRくんに計算してもらう。

Speciesは4種(A、B、C、D)あって、卵の数Eggのモデルづくりは、
>glm(Egg~Species, family="poisson",data=元データ) と入力
すると、
切片とB C D の係数がでた。Aはどこいったの?(←ここで1日悩んだ)
どうも基準として種Aの係数を0(ゼロ)にしてから、他の種の係数を計算しているそうです。あたしきいてない!
とにかくこれで、各種に対する卵の数のモデルが組み立てられた感じ。

で、モデルを作ってどうするんだろう・・・
がイマココです。
他にも虫の齢期などの要因があるので、他のモデルを作ってAICの比較をするつもりだけども・・・
さらに、このglm()の結果をaov()に放り込んだりするとそれっぽいのが出るけど、変なことやってそう。
勉強したいけどそろそろ提出期限ががが

おしまい