シークエンスを担当していまして
そのデータの解析を行っています。
GeneOntologyについて
まだ十分理解してないことが
あります。
GO slimで大まかな機能分類を行うために
下記流れでデータ解析を行おうとしています。
①ESTデータをBLAST検索にて
UniProt Accessionを取得
②UniProt AccessionをGO IDに変換
③GO IDをGO slim termsで機能分類
②で試しに下記サイトでGO IDを取得しましたが
1Accessionにつき複数GO IDがつくために
その後の
GO slim termsに変換するのに困っています。
Affymetrixなどのチップでの解析では
プローブセットと
それに対応する
GO Termのデータを得ることもできると思います。
ESTデータの場合
BLASTでヒットした
アノテーションは
データベースの精度によって曖昧です。
アノテーションの目安として
一般的に使われる基準(Ex:e-value値)などは
あるのでしょうか?
そのデータの解析を行っています。
GeneOntologyについて
まだ十分理解してないことが
あります。
GO slimで大まかな機能分類を行うために
下記流れでデータ解析を行おうとしています。
①ESTデータをBLAST検索にて
UniProt Accessionを取得
②UniProt AccessionをGO IDに変換
③GO IDをGO slim termsで機能分類
②で試しに下記サイトでGO IDを取得しましたが
1Accessionにつき複数GO IDがつくために
その後の
GO slim termsに変換するのに困っています。
Affymetrixなどのチップでの解析では
プローブセットと
それに対応する
GO Termのデータを得ることもできると思います。
ESTデータの場合
BLASTでヒットした
アノテーションは
データベースの精度によって曖昧です。
アノテーションの目安として
一般的に使われる基準(Ex:e-value値)などは
あるのでしょうか?
特定の生物種の遺伝子に対して
複数付けられているのが自然です。
Gene Ontologyは遺伝子の機能を
記述するための語彙集ですから
それで理にかなっているかと思います。
ある程度機能分類に使えるように
GO Slimなるものが使われるようになりましたが
それでも特定の遺伝子を
特定の一つのカテゴリーに分類するのは困難です。
動物の眼のレンズに当たる器官
水晶体に存在するタンパク質の
クリスタリンは
熱ショックで誘導される
HSP(Heat ShockProtein)としても
報告されていたりとか。
遺伝子の機能に関する知識が増えてきて
データベースが充実してきている昨今
そういう分類をすることの意義が
問われてきていると思うのですが。
それを無理やりやることで「分かった」
気になる人の心を打つ
そういう統計量の
別の可視化手法が求められているのが
現状ではないでしょうか?