最適化問題に対する超高速&安定計算

クラスタ計算機やスーパーコンピュータ上での大規模最適化問題やグラフ探索などの研究のお話が中心

VMware Virtualization Fair 2007 参加

2007年02月28日 02時34分07秒 | Weblog
VMware Virtualization Fair 2007 に参加した。立派な会場(赤坂プリンスホテル)なのでスポンサーも相当出資しているのはないかと思う。展示や様々な導入事例などが紹介されたが、VMware の新技術に関する説明があった。

BT (Binary Translation)
VT (Hardware Technology)
PV (Para Virtualization)

BT は特権命令を安全で等価な命令に変えるもので、Java Virtual Machine などでも行われている馴染みの深い技術である。VT はハードウェア支援で、すでに Intel 系 CPU ではVT-x, AMD 系 CPU では AMD-V などとして実現されている。ここまではゲスト OS の修正が必要ないが、ゲスト OS の修正が必要なるのは PV であり、例えば Linux のカーネルなどの修正を行う。ゲスト OS の修正は Linux では難しいことではないが、Windows ではなかなか困難である。
また仮想化技術についても以下のような分類がされている。

第一世代 特権命令仮想化    VT-x/AMD-x
第二世代 メモリ仮想化     NPT/EPT
第三世代 I/O、デバイス仮想化 インテリジェントデバイス/IOMMU

第三世代についてはあまり説明がなかったが、コア数に対してかなり大きめの仮想マシンを動作させようとしている現在では I/O の仮想化は不可欠になってくる。
今年は仮想化元年などと言われているが、大学でも研究用(HPC 系)、教育用(Windows と Linux の両用)、事務系(教務、人事、入試などのサーバーの統一)などで使用が進んでいくだろう。
コメント
この記事をはてなブックマークに追加

double-double と float-float

2007年02月27日 04時27分49秒 | Weblog
以前にも紹介したように double 型の変数を二つ用いて(擬似)4倍精度の計算を行う方法がある。long double ではなく double の変数を用いるので SSE 命令などによる高速化を行うことも出来る。実際には a = a_hi + a_lo のように二つの double 変数の和で表現するのだが、a_hi の方は普通の double の演算結果が、a_lo の方は計算の誤差が入ると考えても良いだろう。同様に float 変数を二つ用いれば(擬似)倍精度の計算を行うことができる。普通はあまり必要ないように見えるが、Cell のように単精度の演算が倍精度の演算よりも圧倒的に速いとこのような需要も出てくる。
しかし環境によっては float を double として計算してしまったり、様々な最適化処理を行ったりするので、なかなか意図したように計算してくれない。ATC 制御の新幹線を運転手が自由に運転できないのに似ている。現在はいろいろ試したりして調査中である。
コメント
この記事をはてなブックマークに追加

地下鉄副都心線と新宿

2007年02月26日 04時14分05秒 | Weblog
日経ビジネスの 2.26 号の連載で 2008 年開通予定の地下鉄副都心線(13号線:70年代ならともかく今更副都心というネーミングはどうかと思うが)と新宿などの街の変化の予想について触れている。都心回帰という動きがあるなかで、一方、郊外では生活圏が自立しているので、たとえば大宮、八王子、横浜などに住んでいる人は単に買い物ぐらいでは東京まで来なくなってきている。だから都心と呼ばれる地域でもよほど交通条件が良くないと人が集まりにくい。その点新宿は十字に様々な電車が走っていて交通条件は日本一と言っても良い。
汐留や六本木など様々再開発がされる度に新宿の没落などが言われてきているが、新宿の交通条件や背後にかかえる膨大な人口を考慮すれば多少浮き沈みはあっても没落などしていくことは考えにくい。それは他の地域にも言えることだと思う。
しかし新宿には大地震のときに集まってきている膨大な人間を収容する能力に乏しい。避難しようにも周辺は延焼危険地帯だらけである。新宿御苑のような広域避難場所を普段からチェックして、どういう行動を取るのか考えておいた方が良い(これも他の地域にも言えるが)。
コメント
この記事をはてなブックマークに追加

情報収集衛星4基体制

2007年02月25日 04時06分26秒 | Weblog
めずらしく7時ニュースなどでも大きく扱われたが、H2A ロケットで情報収集衛星が打ち上げられて情報収集衛星が4基体制になった。H2A ロケットも6回連続成功で通算で11勝1敗になった。情報収集衛星とは変な呼び名だが、普通に偵察衛星(スパイ衛星)で良いと思うが、これは日本特有の言葉の置き換えと省庁間の争いが原因だと思われる。CNN では普通に "Japan successfully launches 4th spy satellite" と出ていたので、日本以外では普通にスパイ衛星だと思われている。
現行の光学衛星の分解能が 1m 程度だということになっているが、光学衛星1号機の打ち上げから2号機の打ち上げまでに3年半もあったのに、1号機と2号機が同じ性能とはなかなか信じがたい。1号機は衛星の振動などで撮影にも影響があったと言われており期待通りの性能が出ていないという噂もあるが、2号機は不具合の修正だけでなくスペック的にも1号機を上回っていると思われる。今回の光学衛星実証機の分解能はアメリカ軍事用の偵察衛星を除けば、世界最高レベルにあると勝手に推測する。

H2A-12号機で情報衛星打ち上げ成功、監視4基に

 宇宙航空研究開発機構は24日午後1時41分、鹿児島県の種子島宇宙センターから、夜間や悪天候でも軍事施設などを監視できる情報収集衛星「レーダー2号」を、H2Aロケット12号機で打ち上げた。
 衛星は高度400~600キロ・メートルまで到達してロケットから分離し、地球を南北に回る極軌道に乗った。
 今回の打ち上げ成功で、政府はレーダー衛星2基、光学衛星2基の計4基を運用することになる。北朝鮮の核実験などで情報収集能力の強化が求められるなか、24時間以内に地上のあらゆる地点を1回以上、監視する準備が整った。約3か月間の機能試験を経て、夏ごろから本格的に稼働させる。
打ち上げられたレーダー2号は、電波の反射を利用して地上の状況を把握する。「マイクロ波」とよばれる電波を使うため、昼夜、天候にかかわらず地上を観測でき、ふつうの光を利用して写真撮影のように高精細な画像を得る光学衛星と補完しあう。光学衛星実証機は、1メートル四方の物体を識別できる現行の衛星よりも分解能を高めた光学センサーなどのテストを、半年間行う。
コメント
この記事をはてなブックマークに追加

イーモバイル

2007年02月24日 01時57分42秒 | Weblog
かねてから噂があったように定額の高速データ通信サービスが始まることになった。今までは定額データ通信サービスと言えばウィルコムだったが、こちらは PHS なので低速だが現時点で使用できるエリアはかなり広い。イーモバイルは HSDPA(いわゆる 3.5G)なので下記のように下り 3.6Mbps, 上り 384kbps で通信速度になる。3G の W-CDMA は停止時に最大 2Mbps になっていて 4G は 100Mbps などという噂がある。3.5G はその名の通り両者の真ん中に位置するのだが、このサービスにしてもエリアの拡大状況、実際の通信速度、繋がり具合などがみんな気になっている。今では Web 閲覧にしてもブロードバンドが前提になっているのが多いので、昔の ISDN じゃあるまいし PHS で 64k や 128kbps ぐらいでは時間がかかり過ぎてやる気が沸いてこない。
端末は同じ SHARP なので、W-ZERO3 にかなり似ているという印象を受ける。しかし Windows Mobile では出来ることがかなり限定されるので、端末は VAIO type U ぐらいのレベルが良いと思う。

イー・モバイル、3月31日から携帯事業スタート──シャープ製のHSDPA端末「EM・ONE」を投入

新規参入組のイー・モバイルが、いよいよ3月31日から携帯電話事業をスタートする。全サービスエリアで、下り3.6Mbps、上り384kbpsのHSDPAサービス「EMモバイルブロードバンド」を提供する。携帯キャリアとして初めて、PCからの利用も含めたデータ通信の月額定額制を展開する。
 サービス開始当初のサービスエリアは東京23区、愛知県名古屋市、京都府京都市、大阪府大阪市(名古屋市、京都市、大阪市付近の一部地域も含む)。以降2007年6月末までに、関東地域は東京都、神奈川県、埼玉県、千葉県の国道16号線圏内をカバーする計画。関西地域も兵庫県神戸市および大阪府の大阪市近郊都市の一部をサービスエリアとする予定だ。
コメント
この記事をはてなブックマークに追加

VMware Virtualization Fair 2007

2007年02月23日 03時02分15秒 | Weblog
Virtual PC 2007 だがゲスト OS が Linux のときはビデオカードの認識などの問題で結局あまり使い勝手が良くない。LiveCD などを別にすれば結局 Fedora Core や CentOS などでまともに動作したものは少なかった。やはり VMWare の方が使い勝手は上である。
2月27日に 東京の赤坂プリンスホテルで VMware Virtualization Fair 2007 が開催されることになっている。展示や様々なセッションで発表やセミナー等が行われる。最近では CPU の仮想化支援技術による高速化や Linux のカーネル自体に仮想化のインターフェイスを組み込むための開発も行われている。その他導入事例なども多く紹介され、初心者用のセミナーもある。
コメント
この記事をはてなブックマークに追加

Virtual PC 2007 その2

2007年02月22日 12時54分48秒 | Weblog
Virtual PC 2007 には 32bit と 64bit 版がある。64bit 版の方は WinXP Pro 64bit や Vista 64bit で動作するという意味であって、ゲストの OS は 32bit でないと駄目なようだ。ただし Fedora Core 5, 6, 7(test1) を Virtual PC 2007 にインストールしようとするとなぜか Video カードが S3 Trio64(懐かしい!)と認識されてしまうので、インストーラーの表示が正しくされない(とりあえず text モードでインストールする)。
最近は LiveCD (CD/DVD からOSを起動する。HDDへのインストールは不要)が流行していて仮想マシンか LiveCD かといった選択肢があるが、仮想マシンで LiveCD を使ってみるのも気軽に利用できて便利である。まだ ISO イメージをキャプチャしてブートできる機能は一度使ってしまうと便利なので、もう以前のように ISO イメージをいったん CD/DVD に焼いてブートするといった方法に戻れない。インストール自体も ISO イメージからの方が圧倒的に高速である。インストールする HDD と別の HDD にISO イメージを置くほうがさらに高速になる。
Intel Core2Duo などの新しい CPU では VT(仮想化支援機能)が利用できるが、Virtual PC 2007 のこの機能に対応している。
コメント
この記事をはてなブックマークに追加

Virtual PC 2007

2007年02月21日 01時22分21秒 | Weblog
Virtual PC 2007 の正式版の無償ダウンロードが開始された。日本語版も同時にダウンロードできるようになった。下記のようにインストール手順は英語で書かれているが、あまり問題ないだろう。現時点で一番気に入っている仮想マシンは VMWare であるが、無償であるので試しに使ってみるには良いだろう。

Microsoft、Virtual PC 2007正式版の無償ダウンロード提供を開始

米Microsoftは2月19日(現地時間)、同社の仮想化ソフトウェアの最新版「Vitual PC 2007」の提供を開始した。新版の特徴はWindows Vistaに対応した点で、同社ダウンロードセンターから無償で入手できる。MicrosoftのVirtual PCのページ(http://www.microsoft.com/windows/products/winfamily/virtualpc/ )からダウンロードの項目を選択すると、Vitual PC 2007の英語版バイナリの配布ページへとジャンプする。日本語版バイナリもダウンロードセンターを通じて配布されているが、インストールに関する手順や製品の説明は現在、英語で記述されたもののみとなっている。Vitual PC 2007は、Windows上でMS-DOSや異なるバージョンのWindowsなど、複数のOSを仮想的に1つのシステム上で動作させることが可能なソフトウェア。
コメント
この記事をはてなブックマークに追加

64bit 版 Vista

2007年02月20日 00時31分47秒 | Weblog
昨年 Windows XP Professional x64 edition (Win XP の 64bit 版)を購入して、いつ頃普及するのかと思いながら使っていだが、冷静に考えて Vista が発売され、しかも 64bit 版の Vista も発売されていることから新規に Win XP Pro の 64bit を購入する人はほとんどいなくなったと見ていいだろう。
ただし 64bit 版の Vista が普及すれば 64bit 対応のアプリケーションも多数発売され、しかもそれらの多くは Win XP Pro 64bit でも動作することが期待できるのでまだまだ使えそうとも思っていた。しかし Vista にしても早期に 64bit の方へ移行させようという意図はあまり感じられない。64bit 版 Vista のデメリットは

1: 対応するアプリケーションはドライバ等がまだ少ない
2: Win32 アプリケーションは WOW64 より Win64 の システムコールに変換されるのでそのまま実行できるが、オーバーヘッドを考慮すると 32bit 版 Vista に性能で劣ることもある
3: Win16 は動作しないので、 16 ビットのインストーラーを含むアプリケーションは動作しない

であるが、これはそのまま Win XP Pro 64bit のデメリットでもある。しかしメモリ 4GB (認識は 4GB, 使用は3GB) の壁の問題が間近に迫っているので数年後にどうなるかを考えると微妙なところだ。
Linux は基本的にソースファイルから make するので 64bit 移行に大きな問題はなし。実際にほとんどの環境で 64bit に移行を済ませてしまった。
コメント
この記事をはてなブックマークに追加

Cell と Intel のテラフロップスチップ

2007年02月19日 03時59分07秒 | Weblog
Cell については以前のブログでも触れたように、基本的に現在の PPE と SPE のヘテロなコアな構成で 2009 年あたりに 1TFlops 越えを目指すことになっている。

2007年 Cell BE (1PPE + 8SPE 90nm から 65nm スケールへ)
2008年 Enhanced Cell BE(1PPE + 8SPE 65nm : SPE での倍精度演算強化)
2009年 Next Gen. Cell BE? (2PPE + 32SPE 45nm : ピーク性能 1TFlops)

ところが Intel の Teraflops Chip の方はインテルのページを見ていると Cell とは随分と内部構成が異なることがわかる。

Network on a chip – In addition to the compute element, each core contains a 5–port messaging passing router. These are connected in a 2D mesh network that implement message–passing. This mesh interconnect scheme could prove much more scalable than today’s multi–core chip interconnects, allowing for better communications between the cores and delivering more processor performance.

この画像を見れば80個のコアが二次元上にきれいに配置されている(10×8で)。もう少し詳しいことはこちらのプレゼン資料に記されているが、東西南北方向のコアとメモリへルーターから合計5つのポートが用意されて 80GB/s(4GHz時)の転送速度になっている。
1つのコアには二つの浮動小数点計算エンジンと命令用とデータ用のメモリ、さらに前述のルーターがある。また強力なパワーマネジメント機能で 62W で 1TFlops を達成できるとしている。
3.16GHz で 1TFlops だが、5.7GHz(1.81TFlops, 265W)も予定されている。

Frequency Voltage Power Aggregate Bandwidth Performance
3.16 GHz 0.95 V 62W 1.62 Terabits/s 1.01 Teraflops
5.1 GHz 1.2 V 175W 2.61 Terabits/s 1.63 Teraflops
5.7 GHz 1.35 V 265W 2.92 Terabits/s 1.81 Teraflops

このように概略を見ただけでも Cell と Intel のチップは目指す性能は同じでも(1TFlops 越え)、かなり異なる構成や設計であることがわかる。


コメント   トラックバック (3)
この記事をはてなブックマークに追加

PS3 と Cell SDK 2.0 と libspe2.0.1

2007年02月18日 03時56分48秒 | Weblog
Cell での開発ツール SDK も 1.1 から 2.x に移行しつつあるので、PS3 に Cell SDK 2.0 をインストールし直した。インストール方法は x86 系のマシン(Fedora Core 5)に SDK 2.0 をインストールするのとほぼ同じ。ただし PS3 は本物の Cell マシンなので Cell シミュレーターはインストールしなくても良い。また SDK 2.0 に所属の libspe2.0.1 にはバグがあるので、パッチをあてた最新のファイルで更新する必要がある。
SDK 1.1 と 2.0 では API の使用なども随分と変化したので、もう一度初めから学び直すぐらいの気合が必要になる。雰囲気的には 2.0 の方が主流になるので(またいつ大幅に変更になるのかわからないが)、これからはこちらを学ぶことが推奨されている。また libspe 1.2 も PS3 にインストールしたので、昔の SDK 1.1 で作成したソフトウェアも問題なく動作する。
コメント
この記事をはてなブックマークに追加

卒業&修了証明書

2007年02月17日 03時24分20秒 | Weblog
人事の関係で卒業&修了証明書が必要になったので、某私大と某国立大に同時に郵送による申し込みを行った。
2月8日午後に同時発送(条件同じ:ただし前者は手数料 300円/1通で後者は手数料無料)
某私大 2月9日午後に到着で同午後に返送(予想) → 10日昼到着(速達)
某国立大 2月9日午後に到着で13日午後に返送(予想) → 14日昼到着(速達)

某私大の方はほぼ最短コースでこんなにすぐに返ってくるとは思わなかった。某国立大の方でも遅くはないと思うが、自分が在籍しているときと随分サービスが変わったような気がする(時代の流れか?)。某私大は昔は学生一流、設備二流、教員三流、職員?流などと言われていたが、今は職員と教員の位置が逆転しているのかもしれない。
コメント
この記事をはてなブックマークに追加

Cell プロセッサの将来 その2

2007年02月16日 01時52分21秒 | Weblog
前回のブログの紹介した SC06 に関する記事だったが、インターネットの検索したところ、これらの発表資料に近いと思われる資料が二つ見つかった。
Cell Broadband Engine - Introduction
Cell Broadband Engine

両方に重複したスライドもあるが、興味のある方は両方目を通されることをお勧めする。特に後者の方が Cell に関しても詳しい。前者のスライドの9ページを見ると現在の Cell は倍精度の浮動小数点演算では PentiumD や Athlon64 とあまり差はないが(それでも Cell の方が速い)、単精度の浮動小数点演算や整数演算(16bit と 32bit)では圧勝している。ただし SPE を利用したときの性能なので PPE 単体ではおそらく Athlon64 あたりに負けるだろう。14ページ目には Los Alamos 研究所に構築される Opteron と Cell の Hybrid スパコンの解説もある(ピーク性能 1.6PFlops)。
また後者の 17 ページ目には Cell のロードマップが出ている。

2007年 Cell BE (1PPE + 8SPE 90nm から 65nm スケールへ)
2008年 Enhanced Cell BE(1PPE + 8SPE 65nm : SPE での倍精度演算強化)
2010年 Next Gen. Cell BE? (2PPE + 32SPE 45nm : ピーク性能 1TFlops)

Cell は PS3 を始めとして、ゲームやデジタル家電などの用途に使われると予想されるが、2008年以降は科学技術計算などの分野でも使われていくかもしれない。
コメント   トラックバック (1)
この記事をはてなブックマークに追加

Cell プロセッサの将来

2007年02月15日 18時34分33秒 | Weblog
少し古い話だが、昨年の11月にアメリカのタンパビーチで行われた SC06 の中で Cell の関する招待講演があった。かねてから言われていた噂どおりに SPE の倍精度の浮動小数点演算を強化したチップが計画されている。今でも SPE 上で倍精度の計算は行えるが、SPE では 128bit(16byte)単位で SIMD 処理を行うので、倍精度(double)だと一度に2個の変数しか処理できない。さらに SPE を 32 個搭載(現在の4倍)して 1TFlops を狙うチップも計画されている。現在でも 8SPE, 4GHz で 256GFLops(ただし単精度)なので 32個の SPE で十分 1TFlops は狙えるだろう。

CELLプロセサのロードマップ

CELLプロセサの将来方向として、2007年には65nmプロセスにシュリンクしたチップを作り、2008年にはAdvanced Cell BEという名前で、各SPEが倍精度の浮動小数点演算を行うチップを開発していることを明らかにした。このチップはテープアウト間近で、2007年の中頃にはサンプルが出来る予定と述べた。さらに2010年には45nmプロセスを使い、2個のPowerPCと32個のSPEを集積し、1チップで 1TFlops級のプロセサを作るというロードマップを示した。
コメント   トラックバック (1)
この記事をはてなブックマークに追加

80コアプロセッサ

2007年02月14日 03時46分53秒 | Weblog
以前、インテルが開発中と発表していた 80 コアプロセッサだが、以下のように国際会議で技術的詳細が発表になるらしい。今の Cell でさえ 8 個のコアへの DMA 転送に苦労しているのに 80 個になったらどうするのか、メモリはどうするのか、コアの中身(浮動小数点演算や SIMD ユニットなど)はどうなるのかなど興味は尽きないが、いずれ発表されれば詳しいことはわかるだろう。Core2Duo のようなホモジニアスコアではなく Cell のようなヘテロジニアスコアになると思われるが、どちらにしても実際に製品として出てくるまでには、まだ時間がかかりそうだ。

米インテル、テラフロップの80コアプロセッサを開発

 半導体最大手米インテルは11日、1.01テラフロップ(1秒間に1兆回の演算を行う)というスーパーコンピューター並みの性能を持ちながら、消費電力は家電製品程度だという80コアのプログラマブル・プロセッサを開発したと発表した。将来のパソコンやサーバでテラフロップの性能を実現することを目的とした同社の「テラ・スケール・コンピューティング」研究の成果として開発された。技術的詳細は、今週サンフランシスコで開催される国際固体素子回路会議(ISSCC)で発表される。
コメント   トラックバック (1)
この記事をはてなブックマークに追加