・相変わらず,申請書の締め切りに追われており・・・.ほぼ出来上がったはずなのだが,細かいところでミスがあったりして,妙に時間を食ってしまう.色んな申請書を見ているうちに,何が何だか分からなくなったりして,時折,頭が真っ白になる.
・さて,倒木上のトドマツ実生の親子解析のデータが届いたので,気分を変えてに解析にいそしむ.単純排除の親子解析を行う場合,タイピングエラーは当然ながら致命的である.ということで,まずは怪しげなアレルの抽出をする必要があるわけだ.現在,Iさんから教えていただいた手法を改良し,エクセルのシートでIF文とAND,ORを多用した独自の親子鑑定ファイルを作成している.ヌル遺伝子座の可能性のあるものは,それも考慮できるように・・・とかやっていると,とてつもなく大きなファイルサイズになってしまい,このあたりもRでやりたいところだと思ったりする.落ち着いたら,一度取り組んでみるか・・・.
・今回は7座で解析しているのだが,1座違いで親候補なしに判定されたやつとかは,もう一度確認したいところである.ということで,単純排除法とCERVUSのエラー率1%(デフォルト)の結果を比較するという方法を採用してみた.エラー率を1%にすると,とんでもなく親を無理やりに決めてしまう.しかし,不一致遺伝子座数もチェックできるので便利である.
・今回はマーカーが優秀なので,どちらの結果も非常によく合う.ただし,411のサンプルのうち,9サンプルは妙な結果である.つまり,単純排除では親候補なしと判定されているのだが,CERVUSでは親候補と実生の不一致遺伝子座数が0になっている.よくよく見ると,そのうち2つは実生のアレルの一部に抜けがあったもので,これは矛盾せずに納得できる.しかし,7つは確かに不一致があるのに,それがCERVUSではないことになっている.どういうことかと中身をみると,7座のうち6座しか比較していないのであった.どうして最後の1座を使わなかったのかは不明だが,アレル頻度からしてミスだろうと判定されたのか・・・.うーむ,謎だ.
・しかし,単純排除と比較しながら,一つ一つをチェックしていく方法は効率は悪いが,データの質もよく把握できるという利点はある.マイクロサテライトのタイピングエラーについては既に多数の論文が出ており,代表的な論文は既に読んでいるのだが,その話はまたいつか,ということで・・・.
・さて,倒木上のトドマツ実生の親子解析のデータが届いたので,気分を変えてに解析にいそしむ.単純排除の親子解析を行う場合,タイピングエラーは当然ながら致命的である.ということで,まずは怪しげなアレルの抽出をする必要があるわけだ.現在,Iさんから教えていただいた手法を改良し,エクセルのシートでIF文とAND,ORを多用した独自の親子鑑定ファイルを作成している.ヌル遺伝子座の可能性のあるものは,それも考慮できるように・・・とかやっていると,とてつもなく大きなファイルサイズになってしまい,このあたりもRでやりたいところだと思ったりする.落ち着いたら,一度取り組んでみるか・・・.
・今回は7座で解析しているのだが,1座違いで親候補なしに判定されたやつとかは,もう一度確認したいところである.ということで,単純排除法とCERVUSのエラー率1%(デフォルト)の結果を比較するという方法を採用してみた.エラー率を1%にすると,とんでもなく親を無理やりに決めてしまう.しかし,不一致遺伝子座数もチェックできるので便利である.
・今回はマーカーが優秀なので,どちらの結果も非常によく合う.ただし,411のサンプルのうち,9サンプルは妙な結果である.つまり,単純排除では親候補なしと判定されているのだが,CERVUSでは親候補と実生の不一致遺伝子座数が0になっている.よくよく見ると,そのうち2つは実生のアレルの一部に抜けがあったもので,これは矛盾せずに納得できる.しかし,7つは確かに不一致があるのに,それがCERVUSではないことになっている.どういうことかと中身をみると,7座のうち6座しか比較していないのであった.どうして最後の1座を使わなかったのかは不明だが,アレル頻度からしてミスだろうと判定されたのか・・・.うーむ,謎だ.
・しかし,単純排除と比較しながら,一つ一つをチェックしていく方法は効率は悪いが,データの質もよく把握できるという利点はある.マイクロサテライトのタイピングエラーについては既に多数の論文が出ており,代表的な論文は既に読んでいるのだが,その話はまたいつか,ということで・・・.