最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

Torque へのジョブの投入

2005年12月16日 22時51分24秒 | Weblog
Aist Super Cluster では、ジョブマネージャーとして OpenPBS を基本とした Torque を用いている。使用方法の中で SCore を用いて並列実行するときに実行ファイルに引数を渡す方法が良くわからなかったのだが、Torque でも結局 PBS と同じだろうということで試行錯誤していたら結局次のようにやれば良いことに気がついた(いったん寝るといい考えが浮かぶことが多い)。

普通は SDPARA は SCore では以下のように呼び出す。
scrun -nodes=2x2 ./prsdpa -ds ./mcp124-1.dat-s -o ./out -p ./param.sdpa

Torque(PBS)では、シェルスクリプトを書く必要があるので以下のようなファイルを作る。
--- sdpa.sh ---
#!/bin/sh
#PBS -N mpijob
#PBS -l nodes=2:ppn=2
export arg1
export arg2
export arg3
uniq ${PBS_NODEFILE} > /home/sdpa/prog/prsdpa/node2.list
scrun -file=/home/sdpa/prog/prsdpa/node2.list,nodes=2x2 /home/sdpa/prog/prsdpa/prsdpa ${arg1} ${arg2} ${arg3}

ファイルの指定は、フルパスでないとまずいので以下のように qsub コマンドでジョブを投入する。

qsub sdpa.sh -v "arg1=-ds /home/sdpa/src/sdplib/mcp124-1.dat-s,arg2=-o /home/sdpa/out,arg3=-p /home/sdpa/prog/prsdpa/param.sdpa"

これで O.K. のようだ。わかれば簡単だが、情報が載ってなかったのでなんとも面倒くさい。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする