goo blog サービス終了のお知らせ 

goto_note

西東京市・北海道富良野の森林を舞台にした遺伝,育種,生態などに関する研究ノートの一部を紹介します

Geneclass2再考

2007-02-21 | 研究ノート
・再びGeneclass2のオプションについてあれこれと模索する。このソフトでは、基準、リサンプリング方法などが色々とを選べるのだが、それだけにどの方法を選んだ方がよいのか悩ましい。サクラソウ品種の起源集団の解析をされたというHさんにヘルプのメールを出すと、ありがたいことに、早速、考え方や解析方法の流れなどを詳しく解説していただいた。おお、やはりHさんも同じところで悩んでおられたのか・・・(同志よ、みたいな気分に勝手になったりして・・・)。やはり実際に活用された方のアドバイスは大変参考になる。

・そうしたアドバイスも踏まえて、再び原著論文へと戻る。Bayesian CriteriaではRannala and Mountain (1997)とBaudouin and Lebrun (2000)の2つの方法を選択できる。どうやら、事前確率の設定の仕方が違うのだが、Rannala and Mountain 1997では元のアレル頻度が事前確率になるのに対し、Baudouin and Lebrun (2000)の方法では一様分布になる、ということだろうか・・・。そうなると、Baudouin and Lebrun (2000)の方法の方がレアアレルの影響が少ないということになるのか!?。うーむ、まだ理解できない。

・Probability Computationでも3つの方法が選択できるが、これについては最新の方法であるPaetkau et al. (2004)を用いた方がよいらしいということが分かってきた。この方法は、以前の2つの方法に比べて推定時のバイアスがかなり改善され、必要以上に排除されてしまうことを防ぐことができる、などと書いてある(ただし、計算時間は少々長い)。もうちょっと真剣に読まないとなんとも言えないが、理由もなしに古い方法を選択するのは「明らかにまずい」ということだけは言えそうだ。

・ということで、Baysean CriterionをBaudouin and Lebrun (2000)に、Probability ComputationをPaetkau et al. (2004)に設定して、10000個体のリサンプリングで再び推定してみると、基準を5%に設定する場合と1%で設定する場合で多少変動するものの、やはり高い確率でアサインされるのは九州の2集団であり、それでもアサインされない品種が2つほど残ることが分かってきた。この結果が真実により近いような気もしてきた。後は、Hさんのアドバイスに従い、天然集団で再チェックしてみることにしよう。