・午前中,こちらの学生とともに,長江などを見せてもらった.頼みの綱のRさんは別行動なので,それなりに緊張したが,一人になれば何とかそれなりにやっていけるものである.もちろん,学生がある程度英語を話せたからではあるのだが,中国語も少しずつ覚えつつある.長江にかかる南大橋に立って川(というよりも海?)を眺めていると,あまりの雄大さにしばし言葉を失う.川は決してきれいではなく,川の途中で微妙だが確かに異なる二色がぶつかっている.その二色が交わるとも,交わらないともなく,ただ流されていくのを見ていると,なぜか「清濁併せ呑む」という言葉が浮かぶ.
・ホテルに戻り,久しぶりに論文指導作業など.それも一段落したので,度重なるフライト中に読んだBuczyk et al. (2006) Using genetic markers to directly estimate gene flow and reproductive success parameters in plants on the basis of naturally regenerated seedlings. Genetics 173: 363-372の読解を試みる.この論文はBurczykの自信作で(直接,話したわけじゃないが,メールを読む限り・・・),とにかく一度は読んでおかないと仕方がない論文なのである.
・この論文は,母樹別種子とその周囲の成木から花粉散布パターンを推定するNeighborhood model (Burczyk et al. 2002 Mol Ecol)を実生の親子解析用に改良したモデルが紹介されている.論文の構成は,まずモデルの概念,シュミレーションによる妥当性の検証,既存データを使った結果の検討,となっている.今回は,モデルの概念と既存データを使った結果について概説してみよう.
・このモデルで必要なデータセットは,1)実生の位置座標と遺伝子型,2)プロット(こちらで決めた半径の円形プロット)内の親の位置座標と遺伝子型(親の形質,DBHや開花量のデータがあってもよいし,なくてもよい),3)プロット外の親の遺伝子頻度(この論文では,プロット内の遺伝子頻度がプロット外にも適用できるとして単純化している)である.
・ここで気をつけなくてはいけないのは,まずは稚樹の周囲に一定範囲の母親候補を押さえる必要があり,母親候補からみてさらに同じ範囲の父親候補を押さえる必要があることだ.したがって,3重の円形プロットを設定するのが最も効率的だと思う.
・モデルの概念について説明しよう.おそらく式(1)を見ると,多くの人が逃げ出したくなるはずだ(当方もそうだったからよく分かる).しかし,この式が意味するところは,実は単純である.まず,実生のうち,母親プロットの外からの移入率をmsとして,(1-ms)の割合が母親プロット内から散布されたとする.このとき,距離が離れれば指数関数的に各母親候補の相対的な貢献度が下がるような指数関数のパラメータを決めるのだが,観察値(メンデル確率)が得られる確率が最も高くなるような指数関数を選んでやろうというわけだ.
・次に,母親プロット内から散布された実生について,今度は花粉散布パターンの推定を行う.これは,花粉散布のNeighborhoodモデルと全く同じで,交配を自殖(s),プロット外からの移住(mp),プロット内交配(割合1-mp-s)の3つに分割してやる.ここでsとmpはパラメータである.プロット内交配については母親同様,距離に応じて減少するような指数関数を選び,各父親候補の相対貢献度を推定してやるわけである.この論文では,花粉散布kernelは単純な指数関数を使い,また距離とサイズの効果などは単に線形で結合させている.もちろん,種子や花粉の散布がこんなに単純に記述できれば苦労はないのだが,モデル的にはこの単純さがミソなのである.
・既存データの適用例では,ヨーロッパアカマツ(525実生,313成木,166本/ha,アロザイム8座,排斥率=0.72)とナラ(320実生,450成木,147本/ha,マイクロサテライト3座,排斥率0.95)の既存データセットを用いて,パラメータの推定を行っている.円形プロットの半径はいずれも40mである.今回のパラメータ推定を行っているのは,種子移入率ms,花粉移入率mp,プロット内母親候補の距離の効果γ,プロット内父親候補の距離の効果β,自殖率sの5つである.つまり,個体サイズのデータとかは本論文では扱っていない.
・結果を見ると,半径40mの円形プロットを想定した場合,種子移入率はヨーロッパアカマツで45%,ナラで6%ともっともらしい値である.花粉移入率は同じ順番で92%と62%である.種子散布と花粉散布における距離の効果だが,いずれも値はマイナスであり,距離が離れるほど相対的な貢献度が下がることが分かる.詳しくみると,ヨーロッパアカマツの種子散布はマイナスだけれども,-0.04と非常に弱い関係なのに対し,ナラでは-0.2とだいぶ強い関係がある.花粉の方はヨーロッパアカマツでは,この程度の半径では距離の効果はないに等しく,ナラでも非常に弱い(0.01).自殖率は,ヨーロッパアカマツで6%,ナラで1%である.
・このように見ると,それなりに推定できているようで,思ったよりは使えるモデルかもしれないと思う.ちなみに,既にプログラムがリリースされていて,J. Chybickiにメールを送ったら,すぐに送ってくれた(実は,一度Chybickiとは別件でメールのやりとりをしたことがあったのである).そのうち,このプログラムSNM ver.1.0を使って,ほぼ完璧に親子解析ができている当方のデータセットに適用してみようと思っている.
・さて,この論文についての感想だが,何よりも勿体なく感じるのは,せっかく父親候補の位置と遺伝子型を押さえているのに,母親プロットと父親プロットの合間にいる個体の情報が母親解析で使えないところである(もしかしたら,うまい補正のやり方があるのかもしれない・・・).また,プロット外からの種子や花粉の移入について,その割合は割合と精度よく推定できそうだが,全体の種子散布や花粉散布のパターン推定はできない(ヤチダモ論文ではやっている・・・強引だけど).散布曲線も指数分布しか使えないというのは,やはり無理がありそうである.
・しかし,特に実生の親子解析の場合,単純排除でいけるほど多型性の高いマーカーが得られないような種も多いはずである.そう考えると,CERVUSなどで無理に親子判定をしてから,距離分布を調べるようなことをするよりは,最初からこのモデルを使うことを想定したサンプリング行うというのも一案かもしれないと思えてきた.何より,モデルの基礎を試しながら実感できるという点では,単純なだけにいいかもしれないな,と思った次第である.