goo blog サービス終了のお知らせ 

goto_note

西東京市・北海道富良野の森林を舞台にした遺伝,育種,生態などに関する研究ノートの一部を紹介します

ランダム効果って・・・

2007-02-05 | 研究ノート
・明日、北大のIくんのD論発表会があるということで、札幌に出張することになる。せっかくなので、ということでlmerの解釈とプレゼンの仕方についてKさんにご相談させていただくことになる。その前に少々動かしてみようということで、標高別相互移植試験のトドマツについて、全個体の生データを用いてlmerを利用したGLMM解析を行う。

・Kさんのブログによれば、lmer人口が急増しているらしい。しかし、こうした新しいツールは、一体全体、自分が何をしているのか、ちゃんと分かってから使わないといけない。一番分かっていない当方が言うのも何だけど、統計パッケージの乱用とならないように自戒をしなければいかんな。

・さて、今回のトドマツ相互移植試験では、8標高各5母樹から得られた種子をそれぞれ6標高に2反復で植栽している。今回は生存、樹高、胸高直径などを測定しているわけだが、母樹や反復では測定できていないランダム効果があると考えた、というわけだ(と思う)。

・従属変数を生存/死亡の1/0データ、ランダム効果として母樹と反復、固定効果として、1)種子産地の標高、2)種子産地と植栽地の標高差、3)種子産地の標高、種子産地と植栽地の標高差の両方、の3パターンを考える。familyは二項分布、linkはlogitを選択。Kさんの教えに従い、method は "Laplace" を指定する。

・AICを比較すると、3)のモデルが最もよく説明できるようで、種子産地標高が高いほど、種子産地と植栽地の標高差が小さいほど生存率が高くなる、という傾向が見られる。一方、母樹と反復についてのランダム効果の結果も出ているのだが、これをどう表現すればいいのかよく分かっていない。とにかく、うまく計算されれば、AIC、ランダム効果、固定効果などがずらずらと結果が記載されることが分かった。

・樹高を従属変数として、似たような構造で解析をすると(familyやlinkは異なる)、やはり3)のモデルがもっとも良く、こちらは種子産地も標高差も小さい方が樹高が高いという結果となった。あれれっ、t値は出ているが、有意確率が表示されていないな。何でだろう・・・。

・全体としての傾向は見えてきたので、今度は植栽地を少し限定してみる。一般には530m以下に植栽するので、530以下(低標高)と730m以上(高標高)に分類すると、さてさて・・・。ううむ、低標高に植栽する場合、標高差よりも種子産地が生存には効果が大きく、標高差を含めないモデル(1)の方がむしろAICがよい。一方、高標高に植栽する場合は、標高差の方がむしろ重要で、種子産地と標高差の両方を加味したモデル(3)がもっとも当てはまりがよい。

・樹高についてみてみると、低標高に植栽する場合には種子産地は重要ではなく、標高差が重要(モデル2)が割とよい)。高標高に植栽する場合には種子産地も標高差も重要で、モデル3)がもっともよい。低標高に植栽する場合と高標高に植栽する場合では、効いてくるポイントが異なるようで、これはかなり面白い、と思うのだが、これで解釈が合っているのかどうかが一番問題だな。