最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

VTEC エンジンと SDPA

2008年06月15日 06時03分02秒 | Weblog
Honda の VTEC エンジンというのは、クルマ業界ではかなり有名なエンジンである。何が凄いかというと、それまでのエンジンは「吸気」「排気」を行うバルブと呼ばれる弁の開きが常に一定だったので、低速域から高速域まで全域に渡って性能を出すことが難しいというか、ほとんど不可能だった。
本来は低回転では、少なめのバルブの開きにして、高回転では多めのバルブの開きにできると良いのだが、Honda が初めて VTEC エンジンで回転数によってバルブの開きを変えていく仕組みを完成させた。今ではトヨタなどの他社でも同様のエンジンが採用されている。
ソフトウェアも同じようなことが言えて、データが密(Dense)な場合と疎(Sparse)な場合では、適切なデータ構造や計算方法も異なる。よって入力データの特性によって、この両者を切り替えようという研究は各方面で行われているが、SDPA でも 1997 年に、1: Dense, 2: ちょっと Dense, 3: Sparse の三つにデータ構造と計算方法を分けて、入力データの特性(サイズや非零要素の数など)によって、これらを自動的に切り換えるシステムを内蔵させた。数理計画問題に対するソフトウェアではこのような仕組みを採用したのは、かなり初期のものであったように思う。後から見ると元の発想は VTEC エンジンと結構似ていることが分かる。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Windows を使ったシステム

2008年06月14日 05時46分35秒 | Weblog
もうだいぶ前のことだが、研究室のみんなで某大手ファミレスで食事をしていたところテーブルに置いてある画面に突然写真のようなメッセージが現れた。Linux か TRON あたりだろうと勝手に思い込んでいたのだが、実際には Windows 98 だったことがわかる。同じ頃、某大手ガソリンスタンド(セルフ式)で給油していたところ、突然給油機の表示が変わり、システムが再起動した。その後見慣れた画面が現れ Windows 2000 が動き始めた(Windows 2000 は安定している方なので、不思議ではないが)。
その後しばらくして、近所のビル内の情報表示用のモニターがあるのだが、誰かがいじったらしく、ソリティアの画面になっていて、来場者は爆笑している人が多かった。これも一目で Windows XP であることがわかる。開発が楽とか様々な理由があると思うのだが、Windows はこういった用途には向いていないような気がする。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

熱暴走するPC

2008年06月13日 05時26分27秒 | Weblog
最近暑くなってきたのが原因なのか、PCが頻繁に熱暴走するようになってきた。とは言っても熱暴走するPCは限定されていて、反対に Dell の PowerEdge などは大型ファンが6個もついていることもあって、今まで熱暴走したことはない。データを取ると熱暴走するPCは全て P 社製だった(Panasonic ではない)。
PCというのは一応エアーフローを考えて設計されているので、ケースのふたは閉めておいた方が良いと言われる。しかし明らかに熱暴走の回数が増えてきたので、ふたを開けて小型の扇風機を直接あててみると明らかに熱暴走の回数は減る。それでも、ウイルスチェックをしながら作業をしているとたまに熱暴走する。というわけで本当に熱暴走なのか、他の要因もあるのではないかと疑われる。PCパーツにも出来不出来があって、全く同じ構成でも熱暴走しない場合もあるので原因の特定は難しい。自作でPCクラスタを作ると、1:頻繁に熱暴走するノード、2:たまに熱暴走するノード、3:一度も熱暴走しないノードにはっきりと分かれる(同じ構成だが)。Dell PowerEdge にしてからは、全て3のタイプになっている。

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SDPA Online Solver 変更

2008年06月12日 22時53分47秒 | Weblog
ユーザからの指摘があったので、SDPA Online Solver のシステムを少し変更した。SDPA の反復回数が 52 回を超えるとファイルのバッファサイズ 4096byte を超えてしまい、ファイルに書き出されてしまうので、このバッファサイズを増やすことにした。やはり SDPA Online Solver も gfarm 等を用いた方が良いと思うようになった。
現在、最短路問題用のオンラインソルバーを考案、開発中である。こちらの方が問題も感覚的に把握しやすいし、見てくれも良いだろう。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

もう 32bit の時代ではないです

2008年06月11日 22時37分28秒 | Weblog
以下の PowerEdge 2900 絶好調と思いきや、ちょっとしたトラブルでファイルシステムの一部が破壊され、OS の再インストールをすることになった。このマシン単独で Linpack 測定を行ってもらったところ、91.68 GFlops であった(with GotoBLAS)。

PowerEdge 2900
CPU : Intel X5460 (3.16GHz) × 2
メモリ : 48GB (4GB × 12)
HDD : 1TB × 6 (RAID5)

ところで、数 Gbyte もあるような巨大な PDF ファイルを作成、表示、印刷することになった。このマシンは当然ながら CPU は 64bit 対応で、メモリも 48GB あり、OS も CentOS 5.1 for x86_64 になっている。しかし、実際のアプリケーションはなかなか 64bit 対応になっていないようで、例えば Adobe AcrobatReader 8.1 なども 32bit版なので、メモリの消費量が 4GB に達した時点で止まってしまう。まさに宝の持ち腐れ状態で、SDPA などはソースファイルから make することによって、64bit パワーを体感することができるが、Windows などは XP にしても Vista にしてもいまだに 32bit 版の方が主流になっている。というわけで CPU, メモリ, OS, ソフトの四つが揃って初めて 64bit パワーを体感できることを改めて感じた。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

なんでもベンチマーク

2008年06月10日 22時15分51秒 | Weblog
日経トレンディという雑誌があるが、1988年8月号を購入したのが初めてなので、もう20年になる(今は2008年7月号)。1988年秋の号で福岡市の天神地区が大きく変わるという特集があって(イムズとかソラリアプラザが出来るというもの)、それを見てわざわざ福岡まで大学受験に行った(九州大学)ぐらいなので、何か違えばそのまま日経トレンディの影響で福岡に住んでいたかもしれないというほど人生に影響?を与えた雑誌である。この雑誌は良し悪しはともかく、PCでも有線、無線通信などでもとにかく徹底的にベンチマークテストを行って点数付け、評価するというスタイルを取っている。
一般ユーザは全ての製品を試すわけにはいかないので、参考になることも多い(昔、某出版社のアルバイトでこれに近いことをやったような気がする)。
今月号(2008年7月号)で驚いたのは白物家電グランプリということで、洗濯機、炊飯器、掃除機、冷蔵庫や電動自転車までをベンチマークテストしていることだった。ベンチマーク好きだが、家電製品までやろうとはなかなか思わない。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

PowerEdge v.s. ハンバーガーパソコン の続き

2008年06月09日 03時52分27秒 | Weblog
結果が長くなってしまったので、スレッド数を増やすと実行時間が増えてしまう mater-5 を除いて excel の表にしてみた。() の中の数字がスレッド数になる。全体的にはハンバーガーの速さとコストパフォーマンスの良さが光る。

mcp1000-10 で見てみると、1スレッドのときに
ハンバーガー: 31.952(s) : 2.66GHz
PowerEdge1900: 40.04(s) : 2.33GHz
PowerEdge2900: 28.532(s) : 3.16GHz
なので、
40.02/31.952 = 1.25 > 2.66/2.33 = 1.14 (ハンバーガー v.s. PowerEdge1900)
31.952/28.532 = 1.20 > 3.16/2.66 = 1.19 (ハンバーガー v.s. PowerEdge2900)
となる

また 4スレッドのときに
ハンバーガー: 13.012(s) : 2.66GHz
PowerEdge1900: 14.649(s) : 2.33GHz
PowerEdge2900: 11.037(s) : 3.16GHz
なので、
14.649/13.012 = 1.13 < 2.66/2.33 = 1.14 (ハンバーガー v.s. PowerEdge1900)
13.012/11.037 = 1.18 < 3.16/2.66 = 1.19 (ハンバーガー v.s. PowerEdge2900)
となる
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

PowerEdge 2900 v.s. PowerEdge 1900 v.s. ハンバーガーパソコン

2008年06月08日 02時58分05秒 | Weblog
昨日の続きで PowerEdge 2900 v.s. PowerEdge 1900 v.s. ハンバーガーパソコンというか、 Harptown v.s. Clovertown v.s. Penryn の対決を行った。

PowerEdge 2900
CPU : Intel X5460 (3.16GHz) × 2
メモリ : 48GB (4GB × 12)
HDD : 1TB × 6 (RAID5)

PowerEdge 1900
CPU : Intel E5345 (2.33GHz) × 2
メモリ : 16GB (2GB × 8)
HDD : 500GB × 4 (RAID5)

ハンバーガーパソコン
CPU : Intel Q9450 (2.66GHz)
メモリ : 4GB (1GB × 4)
HDD : 500GB

1: 1スレッドの場合
○mcp500-1.dat-s
ハンバーガー: 4.560s
PowerEdge 1900: 5.589s
PowerEdge 2900: 4.221s

○theta5.dat-s
ハンバーガー: 26.104s
PowerEdge 1900: 32.015s
PowerEdge 2900: 22.870s

○mcp1000-10.dat-s
ハンバーガー: 31.952s
PowerEdge 1900: 40.040s
PowerEdge 2900: 28.532s

○mater-5.dat-s
ハンバーガー: 22.847s
PowerEdge 1900: 32.604s
PowerEdge 2900: 20.842s


2: 2スレッドの場合
○mcp500-1.dat-s
ハンバーガー: 2.841s
PowerEdge 1900: 3.685s
PowerEdge 2900: 2.774s

○theta5.dat-s
ハンバーガー: 16.629s
PowerEdge 1900: 20.829s
PowerEdge 2900: 15.145s

○mcp1000-10.dat-s
ハンバーガー: 18.649s
PowerEdge 1900: 23.814s
PowerEdge 2900: 17.150s


2: 4スレッドの場合
○mcp500-1.dat-s
ハンバーガー: 2.380s
PowerEdge 1900: 2.518s
PowerEdge 2900: 1.963s

○theta5.dat-s
ハンバーガー: 12.876s
PowerEdge 1900: 15.353s
PowerEdge 2900: 11.282s

○mcp1000-10.dat-s
ハンバーガー: 13.012s
PowerEdge 1900: 14.649s
PowerEdge 2900: 11.037s

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

PowerEdge 2900 v.s. ハンバーガーパソコン

2008年06月07日 06時02分35秒 | Weblog
ソフマップのオリジナル PC にハンバーガーパソコンと牛丼パソコンというのがある。完成品を安く販売するということで,以前1台購入してみた。
スペックは以下の通り。
CPU : Intel Q9450 (2.66GHz)
メモリ : 4GB (1GB × 4)
HDD : 500GB
価格 : 約 12 万円

一方 PowerEdge 2900 のスペックは以下の通り
PowerEdge 2900
CPU : Intel X5460 (3.16GHz) × 2
メモリ : 48GB (4GB × 12)
HDD : 1TB × 6 (RAID5)
価格 : 約 118 万円(定価 約 200 万円)

後者はメモリが多かったり、サーバ用の重厚な作りで信頼性も全く異なるので単純に比較はできないが、以下のように SDPA 7.1.1 + GotoBLAS 1.26(1 スレッド) を動かすと CPU の勝負になるので意外とハンバーガーパソコンが速い。というかクロック比で見ると明らかに前者の方が速くなっていることもある。


○mcp500-1.dat-s
ハンバーガー: 4.560s
PowerEdge 2900: 4.221s

○theta5.dat-s
ハンバーガー: 26.104s
PowerEdge 2900: 22.870s

○mater-5.dat-s
ハンバーガー: 22.847s
PowerEdge 2900: 20.842s
コメント (4)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

PowerEdge 2900

2008年06月06日 05時46分10秒 | Weblog
PowerEdge 2900 の先行導入マシンがやってきた。あと16台購入する予定になっている。昨年度購入した PowerEdge 1900 と基本的な大きさは変わらないが(こちらは縦置き型)、ラックマウントで 5U 分なので、横置きにするとなかなかの迫力と大きさと持っている。内部に大型ファンが6つあり、その内の1つはメモリの上にある。全体的なエアーフローを考えてのことだろうが、メモリも冷やす必要があるのだろうか。

PowerEdge 2900
CPU : Intel X5460 (3.16GHz) × 2
メモリ : 48GB (4GB × 12)
HDD : 1TB × 6 (RAID5)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

GLPK 4.28

2008年06月05日 05時41分02秒 | Weblog
GLPK の現在の最新バージョンは 4.28 になっている。以前も GLPK 4.16 と GLPK 4.25 を比較したのだが、今回は 4.28 も入れて簡単に比較してみる。以前の比較結果も参照していただければ幸いである。理由はわからないが 4.28 を make するときには、./examples/ の下の Makefile の中で
LIBS = -lz -lgmp -lm -ldl
と -ldl を追加する必要があった。

実行環境は CPU Intel X5460 3.16GHz; CentOS Ver.5.1 である。
全体的には性能向上が続いているようだが、やはり stein45 とアルゴリズムの相性が良くないようだ。


○MIPLIB : stein45

glpk 4.16(gcc 4.1.2 : 64bit)
Time used: 32.0 secs
Memory used: 6.3M

glpk 4.25(gcc 4.1.2 : 64bit)
Time used: 320.0 secs
Memory used: 44.5 Mb (46671599 bytes)

glpk 4.28(gcc 4.1.2 : 64bit)
Time used: 318.9 secs
Memory used: 44.5 Mb (46671575 bytes)


○MIPLIB : air06

glpk 4.16(gcc 4.1.2 : 64bit)
Time used: 13.0 secs
Memory used: 16.5M

glpk 4.25(gcc 4.1.2 : 64bit)
Time used: 6.0 secs
Memory used: 16.0 Mb (16772220 bytes)

glpk 4.28(gcc 4.1.2 : 64bit)
Time used: 6.5 secs
Memory used: 16.0 Mb (16772172 bytes)


コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Barcelona マシン

2008年06月04日 23時17分00秒 | Weblog
今は Barcelona とは呼ばすに普通に クアッドコア AMD Opteron と言うのかもしれないが、この Opteron を2個搭載したモデル(つまり合計8コア)でも、Dell などでは結構安く入手できるようだ。以下の構成で 572,500 円というのは、競合他社と比べても安い方ではないだろうか。計算サーバならば Intel Xeon にするのだが、Web & データベースサーバなので Barcelona でも十分だろう。反対に Intel クアッドコア Xeon × 2個 + メモリ 16GB + HDD 500GB × 4台(RAID 5) という構成では、なかなかこの値段では入手できない。

<CPU>
クアッドコアAMD Opteron 2350 2.0GHz 2MB L3 Cache × 2個
<メモリ>
16GB (8x2GB 2R) DDR2/667MHz レジスタード SDRAM DIMM ECC(CPU2つのみサポート可能)
<OS>
OSなし
<ハードディスク>ディスクシステムの構成
構成11:Per6iコントローラ接続 (RAID 5 HDD3~4台)
<ハードディスク> ハードディスク
<4台> 500GB 3.5インチ SATAⅡハードディスク (7,200回転)(ホットプラグ対応)

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

GNU Octave

2008年06月03日 23時05分11秒 | Weblog
GNU Octave を用いてソフトウェアを作り、数値実験を行う研究を多く見かけるようになった。MATLAB は人気も高いが値段も高いので、Octave を使う人も多い。ただし理工系の大学だと MATLAB のサイトライセンスを取っていることも多い。
Octave, MATLAB (あるいは Python なども)によって、今までプログラムを作って数値実験をしていなかったグループや研究室でも数値実験付きの発表や論文を見かけるようになったのは大きな変化だろう。かなり理論系の研究でも数値実験と結果を付けないと少し後ろめたいというのもあるそうだ。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SDPA 7.1.1

2008年06月02日 14時58分39秒 | Weblog
いつの間にか、SDPA も 7.1.1 になってホームページから公開中である。SDPA Online Solver もユーザの方は気づいていないかもしれないが、SDPA 7.1.1 + GotoBLAS 1.26 になっている。もうすぐ SDPA Online Solver の計算環境も大幅に増強される。ちなみに日本人以外の人から来る SDPA Online Solver に関する質問のほとんどは使用法などについて、日本人から来る一番多い質問は、1円にもならない(一見得がない)SDPA Online Solver というサービスを何故やっているのかというもの。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

4K SXRD プロジェクター

2008年06月01日 14時52分12秒 | Weblog
先日、丸の内の丸ビル7階にあるホールで SONY の 4K SXRD プロジェクターで投影された映像を見る機会があった。何で 4K かというと 水平4,096×垂直2,160 ドットで幅が 4K だからだそうだ。掛けると 8,847,360 ドットなので 8.8M プロジェクターとか呼んだ方が正確な気もするが、言われてみると確かに鮮明できれいだ。普段 CG や映像などで高解像度で鮮明なものをいっぱい見ているので、あまり感動は湧かないのだが、PC-Engine CD-ROM^2 の映像に感動していたころが懐かしい。値段はオープン価格で良くわからないし、デジタルシネマ上映用システムの用にプロジェクターを単独で買うわけではないので、システム全体では数千万円ぐらいするのではないだろうか(定価で)? レンズだけでも 2百数十万円なので、本体だけで数百万円はしそうだ。
キューバ危機のときには U-2 という偵察機が地上2万数千メートルから写真撮影(もちろんアナログ)して、それを顕微鏡で拡大、解析してミサイルを発見した。アナログ写真というのはそれだけ情報量が多いということも言える。デジタル全盛なのだが、アナログの役目もまだまだ大きい。
コメント (2)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする