最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

Visual Studio Express

2006年11月30日 01時54分15秒 | Weblog
Visual Basic 2005 Express Edition や Visual C++ 2005 Express Edition などの Visual Studio Expressのダウンロード版は特に期限もなく無料になっている。Windows XP Pro の 32bit 版にインストールしてみたが、当然のことかもしれないが普通にインストール&実行できた。そこで Windows Vista RC1 64bit でも試したみたが、こちらの環境でも Microsoft SQL Server 2005 Express Edition 64bit と共にインストールに成功した。Vista RC1 64bit で動けばほとんどの環境で動作しそうだ。
現在来年の夏に教育用の計算機のリース期限が来るので、ハードの更新と同時に OS もVista にアップグレードされることになる。Vista では動作しないソフトも多いので、反対する意見もあるが、全体的にはまだ本物が出ていない段階なのでソフトウェアのVista 未対応は仕方がないというものが多い。近いうちに主要なソフトウェアは対応するだろうが、3年で更新とは豪勢な話である。現在のマシンは Pentium 4 3.2GHz、メモリ 512 MB で OS は Windows XP である。 まだまだ使えるのでもったいないが、3年で更新するのは学生の在学中(4年間)に1回は更新してあげたいという気持ちがあるらしい。
コメント
この記事をはてなブックマークに追加

ClearSpeed と LINPACK

2006年11月29日 00時32分14秒 | Weblog
東工大のTSUBAME というスパコンは現在 TOP500 でアジアで1位、世界9位の性能になっている。TSUBAMEは Opteron と ClearSpeed の複合機で世界一を目指す京速計算機システムの基礎的な研究の役目もある。前回(2006年6月)の TOP500 においては、ClearSpeed を用いないで 38.18TFlops という性能を残しているが、今回は ClearSpeed を用いて 47.38TFlops に達している。前回 ClearSpeed を用いなかったのは全ノードに ClearSpeed が搭載されていないヘテロな環境なので、この点を考慮せずに ClearSpeed を用いるとノード間の計算能力が不均衡になって、使用した方が全体性能が悪化するからだそうだ。
ClearSpeed のライブラリ CSXL は現時点では BLAS の全ての機能を高速化するのではないので、dgemm(倍精度行列積)だけを ClearSpeed に任せて、あとの処理は CPU 側で行っている。ClearSpeed は PCI-X 接続のカードなのでお世辞にもアクセススピードは速いとは言えないし、SIMD で一部の処理(dgemm)を高速処理するだけで、しかも ClearSpeed への転送等を実行するプロセスの負荷も無視できないとなると、これらの使用して全体の性能を上げるのはかなり難しい作業になる。ClearSpeed には一度に一個のジョブしか投入できないようなので、実際には負荷分散サーバを用いているようだ。LINPACK は個別にチューニングが出来るので、IBM の BlueGene などでも相当中身を変えて最高速を出しているのだろう。それだけに LINPACK 以外の実行性能も気になるところである。

TSUBAMEが47.38TFLOPSを達成しTop500プロジェクト9位にランクイン

米国タンパ市で開催されているIEEE Supercomputingにおいて第29回の Top500®(http://www.top500.org/ )リストがアナウンスされ,東工大のスーパコンピュータTSUBAMEは,産学共同の研究開発の結果,前回の 38.18TeraFlops(1TeraFlops = 1秒間に1兆回の浮動小数点演算)から,47.38TeraFlops と,9.2TeraFlopsの性能向上を果たし,前回に引き続きアジアで1位,全体では9 位とトップ10にランクインしました。
今回の性能向上はClearSpeed社のアクセラレータ (内蔵型の演算加速装置)を有効活用するアルゴリズム,およびそれを実現したプログラムを開発したところによります。


コメント
この記事をはてなブックマークに追加

私大の新設認可

2006年11月28日 04時28分43秒 | Weblog
今でも過剰感が高い大学をさらに増やすという動きになっている。地方では私大だけではなく国立大ですらも定員割れの危険性が大きくなってきた。普通に考えると現在の私大の統廃合もなく、さらに新設を認めるのは奇異な感じがするが、これが国立大ではないことに注意する必要がある。文科省は国立大の再編や統合を行っているが、国立大の新設はよほどのことがない以上、現状では認可しないだろう。そのかわり国立大の経営が危機的になった場合には文科省はそこを守るだろうが、私大の場合には作るも潰すも自由といった感がある。

来春、11私大の新設認可へ・審議会答申

 大学設置・学校法人審議会は27日、来春新たに私立大11校の新設を認可するよう伊吹文明文部科学相に答申した。これで国公私立あわせた大学数は計 755と史上最多になる見通し。少子化で、総受験者数が総合格者数に並ぶ「大学全入時代」が来春にも到来するにもかかわらず、直近5年間で約80もの大学が誕生。定員割れで経営が悪化する大学が相次ぐ中、さらに過剰感が増して生き残り競争が激化するのは必至だ。

ネットだけで授業、キャンパスない大学の新設認可

 文部科学相の諮問機関「大学設置・学校法人審議会」は27日、来春開校予定の大学や大学院など計25校の新設を認めた。今回、すべての授業をインターネットだけで行い、キャンパスを持たない大学が初めて認められた。
 開校が認められたのは、私立大11校、公立短大1校、私立短大1校、私立大学院大1校、公立大学院1校、私立大学院10校で、医療看護系が多かった。
 福岡市に新設予定の「サイバー大学」は、ソフトバンクが71%出資する「日本サイバー教育研究所」が設置。IT総合学部と世界遺産学部の2学部を設ける。ネットで授業を行うため、教室やキャンパスはない。
コメント   トラックバック (1)
この記事をはてなブックマークに追加

マルチコアプログラミングの入門書2

2006年11月27日 00時33分35秒 | Weblog
並列処理を実現するにも様々な形態と方法(ソフトウェア)がある。例えば最適化のアルゴリズムを並列処理する場合にも適切なソフトウェアを選択する必要があるが、どの場合にどれを選んだら良いかと言ったことはあまり知られてないようだ(というか最適化系の人から聞かれることはほとんどないが)。ずっと前にも書いたが大規模な最適化問題を並列処理しているのは他分野の研究グループの方が多いので他分野との共同研究の重要度が上がりつつある(SDP も最近では量子化学や代数幾何などの分野との結びつきが増している)。

先日も紹介した以下の本だが、
マルチコアCPUのための並列プログラミング
マルチスレッドと言えば Java か C(C++)で pthread という感じがするが後者での技法が紹介されている。マルチコアな CPU ではマルチスレッドにするだけで自動的に並列処理されるだろう。OpenMP と Cell が紹介されているのも個人的趣向と一致している。OpenMP は SCore 上で動かしていたが、Intel コンパイラという選択肢もある。

OpenMPによる並列プログラミングと数値計算法 (単行本)
OpenMP というと簡単に並列化出来て性能はイマイチという印象があるが、すぐに並列化の恩恵を受けることが出来るのは重要である。これ一冊で OpenMP についてはかなり理解できると思う。簡単ループの並列化だけでなく、より高度な並列化手法についても触れている。ただし説明は Fortran 90 なので C や C++ について知りたい人には不向き

実践MPI‐2―メッセージパッシング・インタフェースの上級者向け機能 (単行本)
MPI の入門書ではないかもしれないが、反対に言えば相当高度なことまでプログラミング出来るようになるだろう。こちらよりはこの本の方が MPI-2 の記述も含めて理解しやすい。MPI を知っている(使っている)人が MPI-2 を用いてさらに発展させたい場合には良いと思う。
コメント
この記事をはてなブックマークに追加

第二東京タワー(新東京タワー)

2006年11月26日 14時18分04秒 | Weblog
地上デジタル放送用の第二東京タワー(新東京タワー)が墨田区に建設されることが決まっているがデザインも発表になった。タワーのデザインは構造的な要素で決まる部分も多いので、誰が設計してもそんなに変わらないだろうと思う。実際に良くも悪くも普通のデザインでコンセプトなどと説明されても特段に凄いとは思えない。そんなことよりもタワーの機能や展望台などに普通の人は興味があるだろうが、第一展望台(350m)と第二展望台(450m)が用意される予定である。新宿に横浜のランドマークタワー(296m)を超える超高層ビルを作る予定があるが、第二展望台はそれさえもはるかに超えることになる。

日本一の超高層ビル構想、東京・西新宿に地上338メートル
東京・西新宿に338メートル、地上77階の日本一の超高層オフィスビルを建設する構想が持ち上がっている。横浜ランドマークタワー(横浜市、296メートル)を抜き国内初の300メートル超のビルとなる。構想は地権者でつくる西新宿3丁目西地区市街地再開発準備組合がまとめた。

こんなに目立って高いタワーだと事故やテロなどが心配になるが、日本の高塔という本によるとタワーの方がビルよりも巡航ミサイルなどの攻撃にも強いという。ただしビルの上に塔が建っている東京電力本店や防衛庁はビルと同じくらいの耐久性しかないそうだ。テロでなくても有視界飛行の飛行機が衝突する可能性も低くはないだろう。
コメント
この記事をはてなブックマークに追加

マルチコアプログラミングの入門書

2006年11月25日 09時47分36秒 | Weblog
マルチコアCPUのための並列プログラミングという本が株式会社フィックスターズという会社のメンバーによって執筆されて発売されている。ちらっと中身を見たが、MPI についてはないがマルチスレッド、OpenMP さらに Cell コンピューティングについても解説されている。フィックスターズはこの書籍だけでなく Cell コンピューティングの普及のために様々なホームページの運営やセミナーなどを行っている。先日はこちらの学生もお世話になった。
MPI と OpenMP に関しては以下の本もある。
OpenMPによる並列プログラミングと数値計算法 (単行本)
実践MPI‐2―メッセージパッシング・インタフェースの上級者向け機能 (単行本)
コメント
この記事をはてなブックマークに追加

AMD Stream Processor

2006年11月24日 03時36分28秒 | Weblog
AMD は ATI を買収している。それと関係あるのかもしれないが AMD から Stream Processor が発表されている。簡単に言うと以下の記事のとおりだが、3Dグラフィックスの並列処理技術を大量のデータ処理が必要な HPC(Hige Performance Computing)分野に応用したいということである。グラフィックス処理用のチップは特定の計算だけであるが CPU に比べても大変速く、その処理能力をグラフィックスだけに使用するのはもったいない。ニュースリリースだけでは詳しいことはわからないので、今後も続報に注目していく必要がある。

AMD、世界初のエンタープライズ向けHPC専用ストリームプロセッサを投入

AMD(本社:米カリフォルニア州サニーベール、会長兼CEO:ヘクター・ルイズ)は、Supercomputing 2006において、ハイパフォーマンス・コンピューティング(HPC)アプリケーションに特有のハードウェア要件に対応するよう設計された世界初のHPC 専用ストリームプロセッサを発表しました。ワークステーションやサーバなどの演算専用システム向けに設計されたAMD Stream Processor™ は、AMDの新しいシン・ハードウェア・インタフェースであるCTM™ インタフェースの採用により、財務分析や地震研究のマイグレーション解析、生命科学研究などの分野において大幅な性能向上を実現しています。

ストリーム・コンピューティングでは、3Dグラフィックス・アプリケーション向けに数百万個ものピクセルを演算してコンピュータ・モニタにレンダリングする動作を毎秒数百回実行する用途で普及している先進の超並列プロセッサを活用します。ストリーム・コンピューティングは、その圧倒的な処理能力を、幅広い科学、ビジネス、およびコンシューマ向けのコンピューティング・アプリケーションにおいて利用することで、驚異的な量の情報をこれまでより大幅に短時間で処理することを可能にします¹。AMD Stream Processorは、エンタープライズ分野におけるストリーム・コンピューティングの問題に対応するために開発された業界初の専用プロセッサです。
コメント
この記事をはてなブックマークに追加

PS3 と SIMD 命令

2006年11月23日 03時54分29秒 | Weblog
PS3 と Linux に関する情報サイトが出現し最近では頻繁に更新されている。PS3 にインストール可能な Linux は

Yellow Dog Linux for PS3
64bit PPC版 Fedora Core 5

になっている。Linux をインストールしても Game OS とは再起動することによって切り替えが可能になっている。現在では Cell の開発環境としては最も安価な環境である。しかし、我々のようにソフトウェア開発なども目的にしている人はともかく、そういう目的でない人たちは Linux を PS3 にインストールして何に使うのだろうという疑問がある。
最短路問題に対するダイクストラ法を Cell で並列高速計算などということを考えているが、これらの鍵を握るのは SIMD 命令である。Cell の SIMD については SONY から入手できる IBM が作成した Cell 関係のマニュアルの日本語訳があるが、全体的に情報が少なめである。
コメント
この記事をはてなブックマークに追加

東高西低

2006年11月22日 01時53分53秒 | Weblog
自分自身が関西に居たときにインターネットが重いなと思っていたのだが、多くのサーバが東京近辺に集中している関係もあって以下のような結果になっている。地方の方が光の普及が遅れていることもあるだろうが、東京からの距離に応じて通信の設定を変えれば速度が向上することも知られているので、適切でない設定による通信ロスも大きいのではないか。

【スピード速報】ダウンロードは関東圏と愛知が速く、大きすぎる「東高西低」の格差

【スピード速報】はhttp://speed.rbbtoday.com/の1週間分の計測データをもとに各種の統計データを速報でお伝えする。このサイトはIXに計測専用サーバを置き、月間計測数は40万を超え、統計データとしても十分な精度と信頼性を持っている。

 今回は2006年11月7日~11月13日の全測定データを用いて、最新の手法によりIPアドレス等を用いた発信地解析を行い、都道府県ごとのダウンロード速度の平均を算出した。 なお、全測定データの73.7%について、発信地の都道府県を解析できた。
 図を見ての通り、ダウンロード速度の平均のトップ3は東京・埼玉・神奈川で、首都圏に集中している。また、平均18Mbps以上なのは関東圏5都県を除くと愛知県のみである。
 これに対して、大阪府より西の県においては、平均15Mbpsを越える県は一つもなく、最下位の鹿児島は、トップの東京の5分の1以下の平均5.6Mbpsとなった。図を見た途端に明らかな「東高西低」であり、この大きすぎる「スピードデバイド」(格差)の解消が急がれる。
コメント
この記事をはてなブックマークに追加

次期と次々期 SDPA

2006年11月21日 00時33分56秒 | Weblog
次期(Ver.7)の SDPA は開発中であり、次々期(Ver.8)の SDPA は構想中(使えそうな技術の評価)と言えば聞こえが良いのだが、明確なロードマップは無いのでいつ完成かといったことは決まっていない。Ver.7 では既存の Ver.6 の改良だが、Ver.8 の方は最適化ソフトウェアの今後も見据えて今までとは大きく変えることになるだろう(でも現物が何もまだ無いので迫力が無いが)。
Ver.7 の目標
1: Shur Complement 行列の疎になる場合の対応(データ構造、Sparse Cholesky 分解)
2: SOCP (二次錐計画問題)に対する内点法の組込み
3: 数値的安定性とロバスト計算
多倍長計算をどこで組み入れるかは未定。例えば Ver7.0 では無しで、7.1 からサポートという形になるかもしれない。
コメント
この記事をはてなブックマークに追加

裏サーバ

2006年11月20日 11時41分30秒 | Weblog
SDPA Online Solver には裏サーバがある。公開はしているが、リンクは貼られていない(でも AIST CA ページの所為と言うべきか、おかげと言うべきか、検索エンジンにはヒットする)。こちらは OS も新しく計算できるクラスタ計算機が3箇所もあって、使用可能な総 CPU 数は 112 にも達する(同時に使用できるわけではないが)。宣伝しないのはクラスタ計算機が三つに増えているのでサポートが大変だからである。
中身はあまり詳しく書いていないが、SDPA Online Solver も含めて論文にまとめて投稿したので、いずれ文書として表に出ることになるだろう。
コメント
この記事をはてなブックマークに追加

SCore 6.0.0

2006年11月19日 03時19分29秒 | Weblog
SCore の 6.0.0 がリリースされている。以前の 5.8.3 との変更点はざっと見た感じでは、対応 OS が Fedora から CentOS(4.4)になっている。Fedora と CentOS も親戚なようなもので、そんなに大きく変わるわけではない。CentOS は商用 Red Hat Enterprise Linux(RHEL) のソースを用いた互換 OS であり、RHEL の修正パッケージが出ると CentOS でも修正パッケージが出て利用することが出来る。Fedora のように頻繁にアップデートするわけではなく、安定性ではこちらの方が上と言われているので、CentOS に乗り換えるのも理解できる。他にも Kernel Patch が不要になっていて、以前にようにカーネルにパッチをあてて make して入れ替えるといった作業は要らない(カーネルモジュール化されたので)。PBS が無くなっているようだが、個人的には SDPA Online Solver で使用していたので困ることもある(今度は Sun Grid Engine を使おうか)。
SCore 6.0.0 のは CentOS 4.4 が付いていて、まずこの OS をインストールしてから SCore 6.0.0 のインストール作業に入るのだが、OS を入れ替えるのは少し勇気がいる。どうせ近い内にクラスタ軍団は一時閉鎖なので採用するとしてもその後でもいいだろう。
コメント
この記事をはてなブックマークに追加

Ninf-G & Invoke Server

2006年11月18日 04時19分25秒 | Weblog
Ninf-G は、Globus 上で動作する Ninf という意味なので Globus Toolkit の使用を前提にしている。ただし Globus の全ての機能を利用するわけではなく MDS、GRAM、Globus-IO の三つである。この Globus というのは運用が大変面倒であり、立ち上げ時とその後も1年に1回ずつ認証局(CA)から host とユーザーについて認証を受ける必要がある。商用的な使用を考慮すれば必要な作業かもしれないが、学術的な研究での使用には必要ない部分も多いと思う。そのため普及には障害となることも多いのだが、上記の機能の GRAM(ジョブ起動機構)を Invoke Server で置き換える研究も行われている。Invole Server はクライアント側で起動して、クライアントプログラムからのジョブの起動依頼をサーバ側に行うことになる。
個人的にもグリッド間の通信は ssh で十分ではないかと思っていたので、ssh ポートフォワーディングを用いた Invoke Server SSH の開発は歓迎すべきものである。ただし Globus のジョブマネージャーが使用できなくなるので、自前で SGE や PBS などをサーバ側で使用することになる(これも真っ当な考えだ)。将来的に Ninf と Globus の関係がどうなるかはともかく、Globus に依存しない Ninf が出てくることになるし、少なくとも学術的な分野では歓迎されることになるだろう。
コメント
この記事をはてなブックマークに追加

PS3 と HDD 交換

2006年11月17日 02時19分27秒 | Weblog
PS3 では HDD 交換は出来るが失敗すると有償でも修理不可という恐ろしい現実がある。自作パソコンだと思えば、どうせ有償無償でもどこのメーカーも修理してくれないので同じだが。自分で修理出来なければ捨てるしかないのか。にも関わらずサードパティから PS3 でも使用できる HDD が発表された。別に S-ATA ならばほとんど何でも大丈夫なのだろうが(アップデートに失敗するという噂がある)、メーカーに可能と言ってもらえば安心もできる。ゲームはおまけで Linux 搭載が PS3 の本命なので HDD を付け替えるかもしれない。
マンションのロビーで子供が Nintendo DS(だと思ったが、興味無いので詳しく知らない)でスーパーマリオブラザースをやっていた。近所のお母さん方も集まっていて懐かしそうに見ていた。元少女のお母さん方も(年代は一緒だが)”マリオ”はみんなやったことがあるらしい(奥さんはマリオとツインビーにはまったらしい)。ドラクエはと聞いたら”難しいからやってない(難しいか?)”という人も多かった。何か面白いゲームありました?と聞かれたのだが、これが一番お母さま方に受けた。電話でヒントを聞くというのは珍しい発想だった。
コメント (2)
この記事をはてなブックマークに追加

Double-Double and Quad-Double Arithmetic

2006年11月16日 08時54分56秒 | Weblog
C(C++)言語で使用できる4倍精度とそれ以上(8倍精度)の計算ライブラリを探していたが、こちらのライブラリが見付かった。例えば4倍精度では double 型の変数を二つ用いて一つの変数を表現する。IEEE の4倍精度では仮数部の 112 ビットに対して、倍精度の仮数部は 52 ビットである。よって二つ用いた場合の仮数部は 104 ビットになって精度ではやや劣ることになる。Double-Double は加算や乗算などが定義されているが、内積などの組合せはやや複雑である。計算時間は Fortran の 4倍精度を用いるよりは高速だが、当然普通の double よりは遅い。そのため Intel CPU の SSE2 命令などを用いて高速化する研究も行われている。
コメント
この記事をはてなブックマークに追加