goo blog サービス終了のお知らせ 

goto_note

西東京市・北海道富良野の森林を舞台にした遺伝,育種,生態などに関する研究ノートの一部を紹介します

Masterbayes始動?

2007-01-30 | 研究ノート
・イギリスのT氏から「Masterbayesとfull-probabilityモデル(Neighborhoodモデルなど)の長短について述べよ」という宿題をいただいた。そんな難しい問題は答えられそうにないのだが、せっかくなのでMasterbayesを紐解いてみるかと思い、北大のKさんのサイトの説明を見ながら、パッケージをダウンロードする。いわれるままにコマンドを打ち込むと61ページの解説が出てきたので、これを印刷してみる。

・MCMCの概念など、詳しいことが色々と書いてあるのだが、到底頭に入ってこないので、飛ばし飛ばし見ていく。2.3のCategorical estimationの項目になると、ようやく多少は理解ができそうだ。CERVUSとの対比で長短が書かれてあり、CERVUSではできなかった父母の同時推定、信頼度推定において全親候補の情報を使えること(CERVUSでは結局、第一位と第二位の尤度差から信頼度を推定している)などの違いが書かれている。また、遺伝データ単独で推定するCERVUSに比べて、距離やサイズなどの事前情報を加味して推定できるようだ。

・さらに、エラー率もCERVUSのように「えーい0.5%だ!」などと適当に決める必要がなく(普通はエラー率0でやるんだろうけど)、自動的に計算するオプションもあるらしい。ううむ、想像以上にこれは使えるような気がする。前回敗北した原著論文も再び手にとって眺めてみるとするか・・・。マニュアルはろくに読まず、書かれているコードを打ち込みながら、TINN-Rにコピーして保存していく。と、15ページの肝心のMCMC計算の途中で、突然、Rが止まってしまった。なんでじゃあ・・・!?

・広島のSさんの卒論がらみで久しぶりにRに長いこと触れる。今更ながら、ようやくデータフレームの取り扱いというか、必要な行だけにアクセスすることとか、グラフの書き方などが少しだけできるようになった。それにしても、この歩みののろさ、当世の学生からみたら信じられないスピードだろうな。

・さて、花粉散布を見ていく中で、ちょっとした発見があった。カツラでは沢沿いに3kmにも及ぶ長大なプロットを設定して、長距離の花粉散布を調べている。母樹は下流域から3個体、中流から10個体、下流から3個体としてそれぞれ24個ずつの種子を解析している。これまで、母樹のポジションはまとめて解析していたのだが、上流、中流、下流に分けて見ると、下流から上流になるにつれて、長距離散布の割合が明らかに多くなりそうである(サンプル数のばらつきが問題ではあるが・・・)。



・そういえば、開花調査をしていたときに、下流から咲き始めて、上流が咲くまでにはタイムラグがあり、おそらく3日から1週間程度差があったことに気がついた。ということは、下流の雌が開花しているときには下流の雄しか開花しておらず、中流では中流と下流、上流ではすべてが開花しているので、下流から上流という長距離の散布が起こりやすいのではないかと考えられる。

・残念ながら、開花時期のデータはないが、これは結構リーズナブルな解釈といえそうだ。風向のデータと絡めれば、面白い結果となるのではないだろうか?それにしても、ちゃんと結果が出ているもんだ。色々と解析すると見えてくるものもあるもんだねえ。