中田真秀(なかたまほ)のブログ

研究について、日常について、その他。

PubChemQC 200万分子突破!

2015-05-27 09:36:40 | 日記
PubChemQC project 200万分子突破しました。

2015/5/27現在、201万分子(励起状態も含め)計算されてます。
2122146 molecules (excited states are available for 2016173 molecules) last updated : Wed May 27 02:39:30 JST 2015

分子の構造式と電子の数だけをインプットとし、完全なる第一原理計算(DFT使ってますがw)での
分子の構造、電子状態、励起状態、物性のデータベースを作ってますが、200万分子超えました。

HOKUSAI(MPC; fx100)になってGAMESSの構造最適化が遅いのであるがそれは石村さんのSMASHを用いている。体感的には数倍速くなった。GAMESSもDDIでの並列ができず、MPI並列なので、遅くなっているため単純な性能の比較はフェアでないが、今ここで高速となるとSMASHを使うのが正しいということです。また、TDDFTの計算がHOKUSAI(MPC;fx100)で大変遅いため、とりあえずやめることにした。HOKUSAI(RICC;500ノード)も計算に組み入れた。これはGAMESS+FireFlyのまま。

理研は良いと思うのは、こういう計算にもスパコンが使いやすいことです。所内なら無料で使えるというのはとても大きい。

Metatrader4諦めました->pythonへ

2015-05-16 11:31:14 | 日記
metatrader4ずっと騙し騙し使ってきましたが、限界がきてしまいました。

* 重いインジケーターで止まること、動作が不安定になることがよくある。
* デバッガが事実上使えない。
* Windowsでしか動ない(wineで動くが)。
* MQL4+になったのはいいけど、Cではないし、C++でもない。object orientedよりかはpointerが使いたい。
* 結局DLLを作成することになる。
* テキスト処理などはUnix系のコマンドの方が役に立つが、Cygwin/mingwは、Linux/BSD/Macなどに比べて遅く不安定。
* バックテストが貧弱かつ重いと固まることがある。一度に多数の通貨はいじれない(頑張ればできなくもないが)。
* デコンパイルで勉強できなくなった(w
* 往復0.5pip Metaquotes社に払ってるみたい(?)なのが気に食わない
* virtual dealing deskがあってインチキされることがある。
* Windowsは仮想マシンで使わないと管理がめんどい。

結局Rなどと連携する羽目になるのだが、それってそこまでMT4に固執する意味あるのか?
と悩み始めた。

Pythonだとライブラリもあるし、自由度も高い。そっちに移行するよ。

ありがとうMT4
さよ~なら~MT4

為替のレートを取得する@TrueFX and gaincapital.com

2015-05-15 13:09:39 | 日記
MetaTraderでゆけば多分Alpariからhistorical dataをダウンロードするのがいいのかもしれないが、tickデータから持ってる
というのも良かろう(勝てないくせに...)

ということで、Tickデータがダウンロードできるのは:


という2つのサイトが有る。

ほんで、
HistData.com (Free Forex Historical Data)というのもあって、こいつは
最小で1秒足でのデータが非常に多くのペアで入手可能。Tickではない。

他にもあるらしい。
未調査: https://currencylayer.com/ Real-time JSON API for 168 World Currencies
https://openexchangerates.org/ 上と同じ?
http://www.federalreserve.gov/RELEASES/H10/Hist/

OpenBABELでSMILESやInChIから初期座標自動生成するのは結構良い

2015-05-14 17:23:32 | 日記
OpenBABELでSMILESやInChIから初期座標自動生成するのは結構良い

以前CBI学会でPubChemQCプロジェクトで、初期座標はコレでエエのかと言われましたが
そのときは、分子量が200以下ならほとんど配座は関係ないですとかとりあえずごまかしました。

で、実際はどうなってるんだろう?と思ってドキュメント調べたら結構真面目にやってるらしい。
以下引用

gen3d

To illustrate how some of the above methods might be used in practice, consider the gen3d operation. This operation (invoked using --gen3d at the commandline) generates 3D structures for 0D or 2D structures using the following series of steps, all of which have been described above:

Use the OBBuilder to create a 3D structure using rules and ring templates
Do 250 steps of a steepest descent geometry optimization with the MMFF94 forcefield
Do 200 iterations of a Weighted Rotor conformational search (optimizing each conformer with 25 steps of a steepest descent)
Do 250 steps of a conjugate gradient geometry optimization

Taken together, all of these steps ensure that the generated structure is likely to be the global minimum energy conformer. However, for many applications where 100s if not 1000s of molecules need to be processed, gen3d is rather slow. A future version of Open Babel will provide options for slow/medium/fast 3D structure generation which will involve different compromises between speed and finding the global energy minimum.


幾つかコンフォーマー作って比較するというのは必要ないかもな。

領収書をRubyで

2015-05-14 17:09:30 | 日記
HPCS2015の運営委員としての活動で領収書発行というのがあって、ググるとExcelのシートなんかがちょいちょい出てくる。ただ、VBAはあんまり好きじゃない、使い勝手が若干悪かったりして悩んでるところ、事務の偉い人に聞いてみてVBAの差し込み印刷のスクリプトもらった(ありがたい...)のだが、イマイチデザインが好きじゃない。VBAはMacとWindowsでも互換性がないらしいし、これだけでモチベーションがだだ下がり。

ただ、こんなもの一つ一つ入力するというのは人間がやってはならないものだと思うため、探すとやっぱりRubyのがあった。Thinreportというやつらしい。

考え方はスッキリしてて、
まず、差し込まない状態のひな形を作ってやる。これはChromeのアプリ。そこで文字を入れるところなどを囲ってやってそこにタグづけ。これがおわったらtlfができている。XMLで書かれた、ま、どこに何があって、どこが文字入れるところ...とか。気に食わないならエディタで書き直すとよかろう。

ほんで、Rubyのスクリプトで、タグになってるところ入れ替えて、pdf出力。

である。

最終的に名簿をcsvを作っておいて、perlで読み込んでrubyスクリプトを生成、実行。
pdftkで固めて一つのpdfにする。

漢字はIPAフォントがついてきている。良い時代になったものだ。

僕のようなデザイン音痴が作ってもサマになっててびっくり。事務の偉い人はぜひ還元したいと思ったが、VBAじゃないですよね...Rubyって? という感じで使っていただけず。残念...