最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

セミナー内容

2009年11月15日 02時24分31秒 | Weblog
以下のセミナーは残念ながら受講者のレベルと合わなかったようで、大変苦労した割には得られたものがほとんど無いという失敗に終わった。ただし、企画自体は良いのでサイエンスセミナーなどで優秀でやる気のある高校生が受講生であれば、結構上手く進みそうだ。

1. 計算機(PC) の基本的な構成(特にハードウェア)
2. OS (Linux) のインストールと設定
3. 自動クラスタ計算機設定ツールLucie による自動構築
4. 最適化ソフトウェア(特に最短路問題と半正定値計画問題) の紹介
5. 最適化ソフトウェアの構築と数値実験及び評価

次は非常勤での講義用に以下の内容を計画している。これはさすがに情報系の学科で無いと理解するのは難しそうだ。

1: HPC (ハイパフォーマンス・コンピューティング)
2: クラスタ・コンピューティングとその応用
3: グリッド・コンピューティングとその応用
4: クラウド・コンピューティングとその応用
5: マルチコアプロセッサと並列化
6: メモリ階層構造と高速化
7: スーパーコンピュータの使い方と性能向上
8: 並列化用ソフトウェアツール (MPI, OpenMP, pthread, Intel TBB 等)
9: GPGPU アクセラレータを用いた高速化
10: 数値的安定性と任意精度計算
11: 最適化問題に対する高速&安定計算(最短路問題、数理計画問題等)
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

次世代スパコン凍結

2009年11月14日 03時13分58秒 | Weblog
まだ正式に決まったわけではないのだが、神戸の次世代スパコンプロジェクトが中断(実質は中止)される可能性が高くなってきた。情報の多くが非公開でトラブル続きの次世代スパコンプロジェクトが見直し対象となるのは理解できるものの、代替となる科学技術政策の新提案や新展開なく単に中断するというのは自爆行為に等しく責任放棄としか見えない。

それはそれとして思うことが幾つかあって、

1: 現行の 50TFlops 程度のスパコンでも管理、運用に苦労しているのに、その 200 倍もの規模の 10PFlops 巨大スパコンの安定した稼働や運用が本当に出来るのだろうか? 汎用の Intel や AMD 系の CPU ではなく、新しい CPU 上でバグが無く、性能を引き出すことが出来る OS や コンパイラ、それに各種ライブラリの提供が出来るのだろうか?

2: 一方でユーザは巨大スパコンの性能を引き出すことができるソフトウェアを開発することが出来るのか? 少し開発方針を考えてみようと思ったが、公開情報が少なく不明な点だらけなので考えるのは止めた。現在のスパコンはノード、CPU, コアと階層構造になっているが、大規模なデータをどのレベルで分割して、かつ資源の衝突が少ないように多数のコアをどのように同時に走らせるかという問題の解決が必要。
ちなみに SDPA, SDPARA の現バージョンと次期バージョンはこのような問題の解決を意識して開発を行っている。

3: 魅力的かつ一般の人にも実行する意義が理解しやすいスパコン上でのアプリケーションを複数提示出来なかったことが、今回の中断の主原因であるように思えるし、そもそもスパコンの用途(つまり主となるアプリケーション)を決めてから、スパコンの設計や仕様の決定に入るべきではなかったのか? 現在の状態ではスパコン不要論が出て来ても当然であろう。

SDPA プロジェクト自体は次世代スパコンプロジェクトと無関係なので中断されても直接の被害は無いが、ソフトウェアを開発しても実行するスパコン自体が日本から無くなりそうなので、今後は海外での実行場所を見付ける必要がありそう。


次世代スパコン「凍結」、富士通の戦略に影響も

行政刷新会議の仕分け作業で13日、次世代スーパーコンピューター開発計画について2010年度分の事業は「凍結」とされた。12年に完成をめざして進めてきた開発が中断されれば米欧や中国などが開発を競うなか、世界最高速の性能をめざす競争で出遅れは必至だ。スパコンを使う国内産業にも影響が及ぶ可能性がある。米国でも政府が次世代スパコンの開発資金を負担。中国なども開発を急いでいる。現在、日本最速のスパコンは世界22位。米国が1、2位を独占する。日本は次世代の開発でトップ浮上をめざしていたが、計画が中断されればさらに引き離される見通し。

【事業仕分け】最先端科学も“敗北” 「スパコン世界一」を否定 ノーベル賞受賞の野依氏憤慨

政府の行政刷新会議の13日の仕分け作業は、次世代スーパーコンピューターの開発予算に事実上の「ノー」を突きつけた。議論の方向性を決定づけたのは「(コンピューター性能で)世界一を目指す理由は何か。2位ではだめなのか」という仕分け人の発言。結局、「科学技術立国日本」を否定しかねない結論が導かれ、文科省幹部は「日本の科学技術振興政策は終わった」と吐き捨てた。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Tesla C1060 と GeForce 9600 GT

2009年11月13日 00時32分14秒 | Weblog
NVIDIA Tesla C1060 自体には画面表示機能が無いので、写真のように別にビデオカードが必要になる。

lspci|grep -i nvidia
02:00.0 VGA compatible controller: nVidia Corporation G94 [GeForce 9600 GT] (rev a1)
03:00.0 3D controller: nVidia Corporation GT200 [Tesla C1060 / Tesla S1070] (rev a1)

OS は Fedora 11 で 以下の CUDA 2.3 をインストールすることはできるが、gcc のバージョンが 4.4.1 なので SDK のサンプルファイルはコンパイルすることが出来ない。そこで gcc-4.3.2 を用いると Fedora 11 でもコンパイル&実行ができる。

http://www.nvidia.co.jp/object/cuda_get_jp.html

SDK のサンプルプログラムである Mandelbrot で比較すると、Tesla C1060 は 300fps ぐらいだが、GeForce 9600GT は 100fps になる。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

CentOS 5.4 上の CentOS4.8 の仮想マシンクラスタ

2009年11月12日 05時53分38秒 | Weblog
まず CPU が AMD Barcelona のマシン上に CentOS 4.8 の仮想マシンを作成して、次に CPU は Intel Xeon (Clovertown) だが、CentOS 5.4 上に CentOS 4.8 の仮想マシンクラスタを作成した。何故こんな物を作るかというと、CPU が Barcelona で OS が RHEL 4.x という大規模なスパコンでの実行を想定しているからである。ならば本物で実際に開発、デバッグ、実行すれば良いように見えるのだが、なかなかそうは簡単にいかない。ハードウェアのスペックが同じでもインストールされている OS やソフトウェアによって性能も変わってくるので、その環境に合わせて開発をしなくてはならないというのは何とも面倒。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

MUMPS 4.9.2 登場

2009年11月11日 00時23分08秒 | Weblog
MUMPS が短い間に 4.9 から 4.9.1, 4.9.2 とバージョンアップが行われた。性能的には 4.8.4 と比べると 4.9.2 では少し速度が落ちているようだ。SDPA が MUMPS を用いて Sparse Cholesky 分解を行うときには、添付の図のようなかなり疎な行列を扱うことが多い。もともとは対称行列なのだが、上三角部分の非零要素だけを青く描いている。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

お問い合わせに対する答え

2009年11月10日 16時01分04秒 | Weblog
最近のブログの内容に関するお問い合わせに対する答えは以下の通り

1:Lucie によるクラスタインストール(この記事)において3台のインストールにかかる時間はどれくらいか?

だいたい4,5分です。台数が増えてもそれほど遅くならないと思います。その中でreboot に関する時間が 1,2分ほどあります。


2:このクラスタインストールのデモに対してどのような反応が予想されるか?

今回は、特に反応は無いと思います(ふーんという感じでしょう)。ただし、中学生、高校生に対するサイエンスセミナーのようなところで行えば反応が良いと思います。


3:最短路問題に対するソフトウェアのソースファイルは公開しないのか?

昔作っていたものは公開していたと思いますが、特に最新のソースファイルは公開していません。使用してみたい方は個別にご相談下さい。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

最短路問題

2009年11月09日 12時36分36秒 | Weblog
某学会誌に最短路問題の Wiki が載っていたが、これはページ数の都合や編集の方針で内容を大分変更や削減しているので、読者にとって有益な情報が少ないように見える。そこで文章では無く発表スライドだが、参考になる資料をこちらに置いた。 以前にこちらのブログから配布させていただいたイノベーションジャパン 2009 の資料にさらに詳細な内容等を追加した。
これから最短路問題の研究ではクラスタ&クラウド関係の拡張や類似性検索等によるグラフの疎化処理などを予定している。さらに Fermi などを用いて大量のスレッド生成による query の処理なども計画中になっている。人材不足なので興味のある方は参加をお願いしたい。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Lucie によるクラスタインストール 11月14日用

2009年11月08日 00時52分38秒 | Weblog
11月14日用に Lucie による自動クラスタインストール環境を作った。一度環境が安定してくると、1: ネットワーク boot できるようにする 2: MAC アドレスを調べる 3: Lucie の config ファイル(以下参照)を書く

./node install-multi "opt-opteron140 -a 192.168.0.6 --mac 00:e0:81:52:a4:22 --storage-conf ./config/storage-opteron140.conf" "opt-opteron140-1 -a 192.168.0.10 --mac 00:e0:81:52:a5:ed --storage-conf ./config/storage-opteron140.conf" "opt-opteron140-2 -a 192.168.0.11 --mac 00:e0:81:52:b0:ce --storage-conf ./config/storage-opteron140.conf" --installer-linux-image linux-image-2.6.18-fai-kernels_1_amd64.deb --linux-image linux-image-2.6-amd64 --netmask 255.255.255.0 --verbose

4: サーバの /etc/hosts に新ノードを登録 5: 上記のシェルスクリプトを実行する
以下に3台のインストールのスクリーンショットを示す。いつの間にか Lucie のホームページが英語になっていた。










コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

公開倒壊実験 その2

2009年11月07日 00時52分26秒 | Weblog
昨日の公開倒壊実験について参考になる意見や見解を幾つか頂いた。キーワードは金物による固定ということで、倒れた方が長期優良住宅という設定だったようだ。これだけの結果では断定等は難しいだろうが、壁や筋交いで固めても必ずしも安全とは言えないことと、あまり固く地面に固定しない方が良い(経験上は昔から指摘されているが)という可能性はあるだろう。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

公開倒壊実験

2009年11月06日 02時26分08秒 | Weblog
公開倒壊実験のビデオが公開されていた。別な方角から撮影されたビデオが youtube にもアップされていた。以前ある専門家の方に活断層付近(活断層上ではない)にどうしても建物を立てなければならない場合では、どのように耐震設計をしたら良いか聞いたところ、地面にあまり固く固定しない方が良いと言われた。昔の人は感覚的にこのようなことも理解していたと推測される。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SDPA Online Solver : laqua 復活

2009年11月05日 00時12分09秒 | Weblog
SDPA Online Solver の http://laqua.indsys.chuo-u.ac.jp/portal/ の方が復活した。サーバ自体は私の方で復活させておいたが、SDPA Online Solver 関連は Sasajima さんにお願いした(作業ノートはこちら)。いろいろとやりたいことが多いが、本当に人材難で困る。
コメント (2)
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

共有キャッシュのバンド幅

2009年11月04日 03時41分09秒 | Weblog
詳しくは添付の図を見ていただくとして、2スレッドで同じ領域のデータを参照するとデータサイズが小さい場合(全データをキャッシュに載せることが出来る場合)では、その2スレッドを実行する2つのコアがキャッシュを共有した方がバンド幅が低下する。ところが、データサイズが大きい場合では(全データをキャッシュに載せることが出来ない場合)、反対に共有した方がバンド幅が増大するという現象が発生する。
SDPA 7.3.1 ではこの現象を利用して疎行列を用いたマルチスレッド計算を高速化している。しかし、最近また別のアルゴリズムによってさらに高速化できるかもしれないと考えている。ある程度コストのかかる前処理を行うので、大きな問題限定になるかもしれない。
コメント (2)
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

NVIDIA Fermi で汎用コンピューティング

2009年11月03日 03時19分10秒 | Weblog
NVIDIA Fermi では以前の Tesla よりも汎用のコンピューティングが出来るように設計が行われている。その他にも ECC 対応、倍精度演算強化などの特徴がある。この Fermi は倍精度行列積のアクセラレータとして使えるかどうかは、実際にやってみないとわからないが、PCI-Ex のバンド幅に律速される部分も大きい。
そこで可能性としては、行列積を含む演算を GPU 内で完結させて、CPU と GPU 間のデータ転送量を小さく抑えることができれば GPU の使用によって高速化できる余地が出てくる。
また以前に最短路問題のソフトウェアを GPU 内で動作させたことがあったが、メモリのレイテンシが大きすぎて性能が全く出なかった。通常の GPU 使用においては膨大な数をスレッドの切り替えによってレイテンシを隠蔽していたのだが、今度の Fermi では別の方法でも隠蔽が可能になると言われている。GPU 上のメモリに最短路問題の全データが入るので、いろいろと工夫すれば良いスループットが得られる可能性もあるだろう。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

購入品

2009年11月02日 01時32分37秒 | Weblog
研究用購入品について業者の方と打ち合わせを行った。

1:Fermi の製品出荷にはまだ時間がかかる。Intel が来年同様にアクセラレーターを発表するので待った方が良いかもしれない。現在は競合製品が無いので NVIDIA 系が高めになっている。個人的には Intel の方に期待
2:Intel Nehalem-EX は年内入手が困難。しかもクロック周波数が 2GHz 程度低め。来年の春以降の製品に期待。
3:Intel Nehalem-EX が買えそうもないので AMD Opteron 8439SE 2.8GHz(6コア) x 4CPU : メモリ 128GB の購入を検討中。しかし 24 コアを使いこなすのは大変そう。
コメント (2)
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

今日の blogram.jp

2009年11月01日 01時40分28秒 | Weblog
ブログコンテンツ解析の blogram.jp だが、最近の結果は以下のようになっている。キーワード "小学" と言ってもオープンキャンパスで小学生も歓迎と書いただけ。”熱い想い”と”好き”というのはどのように判断しているのだろうか。

「最適化問題に対する超高速&安定計算」には、sdpaninfさんの
パソコン, Linux, 学校への熱い想いが溢れています。
ちなみにパソコンに対しては「好きという気持ち」といった想いが感じられます。
キーワードは「AMD」「Linux」「小学」です。
コメント
  • Twitterでシェアする
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする