長期滞米研究者ネットワーク

管理人たちの日記

codepad で Smith-Waterman

2008年03月26日 | SE の日記
ウェブブラウザ上でプログラムの実行結果を簡単に見ることが出来る codepad というサイトが話題になっているみたいです。C, C++, Perl, Python, Ruby など色々な言語に対応しています。セキュリティはどう確保しているのかわかりませんが、「やれるもんならやってみな」的記述があったのでかなりしっかりした対策がしてあるようです。Perl で遊んでみたところコードが色つきで綺麗に表示されその下に実行結果が表示されました。スクリプト言語より、C や C++ などで短いコードの動作確認をするのに便利そうです。

それから、他の人にコードやアルゴリズムを見てもらいたい時に重宝しそう。で、早速 Smith-Waterman Algorithm のスクリプト(200行)を実行してみました(こちら)。調子に乗って500+行の 系統樹作成も。


HP update: BLAST-ish perl script.


--- 何故既存のアルゴリズムをコーディングするのか?

主目的は自分の向学のためですが、他の方にとっても Bioinformatics で使われる手法の理解に役立つように工夫できればと思っています。将来的には自分の研究目的に合わせてカスタマイズしたプログラムを組むのが目標です。

--- 計画

BLAST (incl. Smith-Waterman) アルゴリズムでホモログ探して、 Needleman-Wunsch と Neighbor-Joining で作ったガイドツリーをもとに Multiple Alignment して、 Genetic Algorithm でリファインし、そのアライメントで作った Profile Hidden Markov Model を使って再度 Search をする、また Multiple Alignment の結果を Neural Network の教師信号として用い二次構造予測を行う、を C++ and/or Perl で実装。

どの段階からでも入出力が出来、パラメータも GUI から幅広く簡単に変更できるなど柔軟な仕様にする。ヘルプファイルを充実させ、使用法に留まらず各解析手法の基礎知識までもりこむ。パラメータの意味などはポップアップ等で表示。コードには細かくコメントを付け、デバックや変更、学習の効率を高める。



>> 人気 blog ランキング: 他の長期滞米研究者の方々のブログあります。
クリックしていただくと当ブログの順位が上がります。

>> ホームページ: 長期滞米研究に関する情報集めてます。

Sequence alignment and more in Perl

2008年03月09日 | SE の日記
This Perl script creates a dendrogram from multiple amino acid sequences using Needleman-Wunsch algorithm for global alignment, Feng-Doolittle method for distance calculation and Neighbor-joining method for clustering --- a similar approach used in ClustalW.


References

Needleman-Wunsch:
1. Wikipedia --Needleman-Wunsch algorithm--
2. Dynamic Programming
3. Language Benchmark
4. Advanced Dynamic Programming Tutorial
5. バイオインフォマティクス講義情報 --アラインメント--
6. 生物情報工学 講義資料 1
7. バイオインフォマティクス入門コース

Neighbor Joining:
1.Wikipedia --Neighbor Joining--
2.BioBEAT --遺伝子系統樹入門講座--
3.Dr. Opperdoes @ Institute of Cellular Pathology --The Neighbor-Joining Method--
4.Python implementation of Feng-Doolittle Algorithm for Multiple Sequence Alignment

Other:
Algorithms in Java and C++


>> 人気 blog ランキング: 他の長期滞米研究者の方々のブログあります。
クリックしていただくと当ブログの順位が上がります。

>> ホームページ: 長期滞米研究に関する情報集めてます。