最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

新 Linux ディストリビューション2

2006年09月30日 17時56分24秒 | Weblog
Fedora Core 6 test3 のインストールには成功するが、起動時にカーネルパニックが発生(ドライブ構成が複雑だと / のドライブ情報の伝達にミスがあるのか?)、あるいは起動途中で突然再起動がかかって永遠にこのプロセスを繰り返すという現象も発生した。とにかく test3 と正式版では大きく変わることもあるので、正式版を待つことにしよう。momonga linux はインストールや起動は正常に行うことが出来るが、Xgl を使おうとしたらトラブルが発生した。
# gnome-xgl-switch --enable-xgl --auto
とするとハードウェアのアクセラレーションが行われていないかのように表示等が極端に遅くなる。GNOME でログイン出来なくなった等の事態が発生した。
結局 Xgl は普通に Fedora Core 5 で試したら正常に動作した。Vine Linux 4.0b2 は結構完成度が高そうだ。Vine Linux は新しいソフトを使うよりも安定したものを選んでいるようで(別に古くはないが)、Fedora とは対照的だ。日本語や TeX などの環境は良いと思っているのだが。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新 Linux ディストリビューション

2006年09月29日 02時15分35秒 | Weblog
Linux の中で主に使用しているのは Fedora Core と Vine Linux だが、両者共に新バージョンがリリースされようとしる。Fedora Core は Ver 6 が 10月11日にリリースされることになっている。また Vine Linux の 4.0 beta2 までがダウンロードできる(こちらの正式リリースは10月31日)。また Momonga Linux も ver 3 の正式版が入手可能である。Momonga は Kondara Linux の流れを汲んでいると思われる(昔はよく Kondara Linux を使用していたが突然無くなってしまった)。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

大容量光ディスク

2006年09月28日 10時20分47秒 | Weblog
次世代の光ディスクは HD と Blue Ray の二つの規格が主流を目指して争っているが、Blue Ray 陣営の TDK から発表された。この試作品は CEATEC Japan 2006 でも展示されることになっている。HD DVD は既存の DVD と生産設備が共有できたりと、移動する際のコストの安さが大きな利点になっている。しかし、将来性や拡張性は Blue Ray の方が大きい。それにしても片面6層(学会発表では8層までらしい)とは何とも凄い。6層まで光が透過していき凹凸を読み取るわけだが、今よりも厚みは増すことになるのだろうか。


世界初、TDKが6層青色光ディスク 容量200GB

 TDKは27日、データの記録層を世界で初めて片面6層にし、記録容量を200ギガ(1ギガは10億)バイトに高めた青色光ディスクの開発に成功したことを明らかにした。すでに試作品も完成しており、数年内の実用化を目指す。家庭用パソコン1台に匹敵するデータを1枚のディスクに保存でき、ハイビジョン映像を18時間録画できるという。次世代DVD規格「ブルーレイ・ディスク(BD)」に対応しており、「HD DVD」との規格争いにも影響を与えそうだ。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Global Competitiveness Report 2006-2007

2006年09月28日 03時59分04秒 | Weblog
Global Competitiveness Report 2006-2007 が発表されている。スイスの機関で作成してスイスが1位なのは非常怪しい気がするが、そのため北欧が上位に来るような基準になっている。インターネットからもレポートの一部が入手できる。

1位 スイス
2位 フィンランド
3位 スウェーデン
4位 デンマーク
5位 シンガポール
6位 アメリカ
7位 日本
8位 ドイツ
9位 オランダ
10位 イギリス 

これが総合国力ならばアメリカ、日本、ドイツ、イギリス辺りがこのランキングの上位国に負けるわけがないと思う。小さくコンパクトにまとまっている国に有利なようだ。日本の報道ではあまり大きく扱っていないが(やはりマゾなのか?)、Innovation factors(総合技術革新度)と Health and Primary educations (保健衛生と初等教育)で1位になったのは大変大きなことではないだろうか(特に前者)? 反対に言えばこの二つがしっかりしていれば、他の要素は立て直せると思う。技術革新で下位に落ちていったら日本は本当に危機的だ。
ちなみに Innovation factors は Business sophistication (ビジネス分野の洗練度:日本は2位)、Innovation (技術革新:日本は1位)の平均値になっている。良いところも報道しなさい(本当にマゾか?)

経済競争力:日本は7位に上昇 首位はスイス
 スイスの民間経済研究機関「世界経済フォーラム(WEF)」は26日、世界125カ国・地域の経済的な競争力を比較した2006年版の「経済競争力報告」を発表した。首位はスイスで、日本は7位に上昇した。WEFは今年から新しい指標を導入し、前年の順位も修正、日本の前年順位は12位から10位になった。
 日本は技術革新、保健衛生の分野で1位となったが、マクロ経済分野で91位、特に財政赤字が114位と大きく足を引っ張った。

中略

新しい指標は制度的環境、社会基盤整備、マクロ経済、保健衛生・初等教育、技術革新など9分野にまたがり、合計90項目。(ジュネーブ共同)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Cell シミュレータ3

2006年09月27日 11時15分46秒 | Weblog
こちらのページあるいは SONY などが配布している開発者用のマニュアルでも良いと思うが、様々なドキュメントが用意されている。現在は動画処理や 3D 計算用などを主目的としているので倍精度はあまり重視していないかもしれないが、将来的には倍精度強化版が出てくるかもしれない。
SPE や SIMD 命令を用いて地道に並列化、高速化していく作業は大変だけれども楽しい作業だ。SDPA などはベクトルの内積計算が多いので、こういった高速化は効くと思うし、SDPA が高速化できれば SDPARA なども MPI と SPE & SIMD の二重並列化が効いてくると思う(DMA 転送の速度に依存するが)。その他の最適化手法(ダイクストラ法、
メタ解法)なども同じ発想で出来そうだ。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Cell シミュレータ2

2006年09月26日 01時15分14秒 | Weblog
Cell シミュレーター(Cell BE SDK)の動作環境は、Fedora Core 5 になっていて X86, X86_64, PPC64(PowerPC 64bit), Cell BE Blade であるが、X86 と X86_64 での動作を確認した。エミュレーターではなくシミュレーターなので速度自体は尋常ではない遅さだ。実際には Cell 上で1秒ぐらいの実行でも数分かかる。実機でプログラミング出来るのは大分先だろうから、しばらくこれで開発等を行っていくしかないだろう。
PPE は PowerPC G5 互換なので、初めは PPE だけ使用すれば既存のソフトウェアをとりあえず Cell 上で動作させることは難しくないと思われる。その後で SPE での並列化に向いている部分を SPE に移動していく方法になるだろう(Ninf の並列化みたいである)。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Cell シミュレータ

2006年09月25日 04時21分12秒 | Weblog
Cell プログラミングに関して大変役に立つ Wiki ページがある。Cell シミュレーターが提供され始めたのは約1年前だが、様々な場所でも取り上げられて、PS3の発売や Cell 搭載のスーパーコンピュータの計画発表などによって注目度を増している。Intel の CPU と違ってパソコン専用に開発されたわけではないので家電などにも幅広く使用されていく可能性がある。
Cell シミュレーターを実際に使用しようと思って調べていたら、CellSDK も更新されていて(Fedora Core 4 から 5 になっている)、上記のページあるいは月刊 ASCII 7月号の特集とはインストール方法がやや異なる。いろいろ試してみたが結局この文書の手順に沿って行っていくのが確実だ。こちらのページから cellsdk などのファイルを持っていく必要があるが、これには簡単な登録が必要だ。あとは cellsdk のスクリプトを起動すれば BSC から必要なファイルを自動でダウンロードする。場合によっては事前に次のようにする必要がある。

yum install freeglut-devel tk

インストールが終わったら systemsim を起動する。

mkdir sandbox
cd sandbox/
cp /opt/IBM/systemsim-cell/run/cell/linux/.systemsim.tcl .
export PATH=/opt/IBM/systemsim-cell/bin:$PATH
systemsim -g &

確かに Cell 3.2GHz の Dual 構成になっている。

[root@(none) ~]# cat /proc/cpuinfo
processor : 0
cpu : Cell Broadband Engine, altivec supported
clock : 3200.000000MHz
revision : 5.0 (pvr 0070 0500)

processor : 1
cpu : Cell Broadband Engine, altivec supported
clock : 3200.000000MHz
revision : 5.0 (pvr 0070 0500)

timebase : 3200000000
machine : CHRP IBM,CPBW-Mambo, Simulated-System

マンデルブローのプログラムを実行してみると以下のようになった。

Cell 3.2GHz : 1175554 micro sec (1.18秒)
Pentium 4 2.6GHz : 7.76秒
Pentium 4 (64bit) 3.9GHz : 5.79秒

大規模な問題を解くときは SPE のメモリの少なさと DMA 転送のコストなどが気になるのだが。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

東京ゲームショウ 2006

2006年09月24日 00時35分10秒 | Weblog
幕張メッセまではそんなに遠くないのだが高速道路で行くと必ず竹橋, 箱崎, 小菅、堀切、11号台場線などの超渋滞区間のどこかを通る必要があるので、大変時間がかかる。2 + 2 車線を 2 車線で合流させるとか、直線で2方向をクロスさせるとか、料金所の直後で車線を減らすとか、かなり無茶苦茶である。もう何十年もこんな状態なのに根本的に改善しようとかいう発想はないらしい(地震が来るのを待っているのではないだろうか?)。結局今後何十年もかけて周辺部に環状線を構築していくことになるだろう。
東京ゲームショウは大変な混雑で CEATEC Japan などとは比較にならない。以前よりも外国人の訪問者がかなり増えている。一応キッズコーナーなどがあるが、小さい子供が行くのは大変である(実際幼児以下はかなり少なかった)。PS3 のゲームは確かに画面も綺麗で動作も速いがすぐに飽きてしまいそうで、どうしても買いたい物はない。任天堂のゲームなどは新技術が少ないのでさらに魅力を感じない。世間の評判とは違うのかもしれないがどうせゲームしている時間もない。
ところで PS3 はあのハード(Cell、メモリ、GPU、BD)で5万円は(いろいろな意味で)大変なことだ。そんなに時間が経たなくても PS3 で動作する Linux が出てくるだろう。いろいろなゲーム以外のソフトウェアを開発&動作させることが出来るようになりそうだ。もちろん Cell 搭載のブレードサーバーが安価で出てくればその方が良いが、ゲーム以外でも楽しみなハードである。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

東京ゲームショウ 2006 & PS3 値下げ & グリッド

2006年09月23日 00時17分38秒 | Weblog
東京ゲームショウ2006 が開催中である(一般参加は23、24日)。前売り券を買ってあるので明日行くことにした。ソニーが完全に赤字覚悟で PS3 の下位機種(HDD 20GB)の値段を 49,980円(税込)にすることになった。しかも HDMI 端子付きになっているが、最近のほぼ全部のハイビジョン対応テレビには HDMI が搭載されている。もう映像は D端子で音声は別に接続するという時代でもないので、良い判断ではないだろうか。
気になるのは下記にもあるグリッドの動向である。また Cell シミュレーターでソフトウェアを開発するのも大変なので PS3 でも開発出来るキットなどがあると大変助かる(PS2 のときもあった)。

「PS3値下げ」のサプライズに場内拍手・久多良木SCE社長講演――東京ゲームショウから

 ソニー・コンピュータエンタテインメント(SCE)の久多良木健社長は22日、「東京ゲームショウ2006」で「PS3が創る次世代のエンタテインメント」と題した講演を行った。講演後に行ったモデレーターとのトークセッションで、11月に発売予定の「プレイステーション3(PS3)」の下位機種にも「HDMI」の端子を搭載したうえで、5万円を切る価格に設定することを表明した。

中略

単にゲームをするだけでなく、高性能半導体「セル」の能力を生かして各家庭にあるPS3を連結し、グリッドコンピューターとして利用する可能性についても話した。病気を解決するための科学技術計算など社会貢献にも役立てることができるという。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新司法試験2

2006年09月22日 14時00分40秒 | Weblog
やはりこういう意見が出てきた。本来はもっと定員を少なくし質を上げて、修了者の7,8割は合格出来るレベルにするという話だったので当然出てくる意見と言えよう。弁護士が増えることには功罪があるだろう。海外から日本へ進出を狙っている人達もいるようだし、アメリカのような極端な訴訟社会にならないようにしたい。

杉浦法相「法科大学院、将来淘汰も」

 杉浦正健法相は22日の閣議後の記者会見で、21日に新司法試験の合格者が発表されたことに関し「結果が思わしくない法科大学院に行く人は減っていくので、将来、淘汰も有り得ない話じゃない。結果を踏まえ、(合格率が)良くなかった大学院は頑張って努力してもらいたい」と述べた。
 また小坂憲次文部科学相は合格者ゼロの法科大学院が4校あったことに「設置計画の履行状況調査や第三者評価を通じて、教育水準が適切に確保されているか見守っていきたい」と述べた。 (13:48)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

新司法試験

2006年09月22日 00時21分38秒 | Weblog
個人的にはほとんど関係ないが(教え子が今度法科大学院を受験すると言っていたが)、新司法試験の合否結果が発表された。旧制度よりも簡単になったと言われているが、法科大学院に入ること自体が相当難しいので最難関の試験の一つであることには変わりない。多くが弁護士志望だと予想されるので弁護士が溢れて仕事が無くなるという心配もされている。
学費も某大学院では初年度に200万円もかかるようだ(2年目は入学金が無いので170万円)。大学を卒業した上でさらに高い学費がかかり(私立理系の大学院の学費は学部よりも安い)、受験できる回数にも制限があって、合格平均年齢28.9歳となるとかなりの博打である。大学院の博士課程に行くのも同じようなリスクがあって、博士が1万人ぐらい溢れているようなので、こちらも良く考えた方が良い。弁護士も博士も制度として量産しているのだから進路を作って誘導していくことも必要なのかもしれない。それが不可能ならば入口を絞るべきであろう。
ところで法科大学院は地方でも難関大学出身者が多く受験するので、大学の偏差値と法科大学院のレベルは必ずしも連動していないようだ。早稲田は3年コースが主体ということで今年は不戦敗に近い。来年度からは旧制度と同じように東大、中央、早稲田、慶応、京大あたりが5強になるのだろうか。

新司法試験、合格率48%・合格者は1009人

 法務省は21日、法科大学院の修了者を対象に今年初めて実施した新司法試験の合格者1009人を発表した。合格率は約48%。受験生の出身校、全国58 法科大学院のうち最も多かったのは中央大で131人。東大(120人)と慶応大(104人)が100人を超え、京大(87人)、一橋大(44人)が続いた。京都産業、神戸学院、東海、姫路独協の4校は合格者がいなかった。
 合格者の平均年齢は約28.9歳で、前年の旧試験より約0.1歳下回った。最高齢は58歳。女性は228人で22.6%を占めた。
 新試験の合格率について、法務省司法試験委員会は05年2月、06年を「900―1100人(5割程度)」、07年を「06年の2倍程度」とする目安を示していた。今回の結果はこれに沿った形で、合格率は旧試験の3%台から大幅に上昇した。
 法科大学院は04、05年に計74校が開校。大学の法学部卒業者らを対象とした既修者コース(2年制)と未修者コース(3年制)があり、今年の新司法試験は04年に入学した既修者コースの修了生2091人が受験した。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

CEATEC Japan 2006

2006年09月21日 03時11分26秒 | Weblog
毎年恒例?になっている CEATEC Japan 2006 だが、今年も行く予定になっている。学生も結構興味を持っているようだが、なかなか予定が合わない。10月3日から7日だが社会人の人も誘うと7日(土)になりそうだ。ちなみに昨年最終日の午後すぎには一番早くブースを閉じていた某大学は今年も出展するそうだ。やる気もないのに付き合いだけで金を使う必要は無いと思うのだが。
昨年は Cell、プラズマディスプレイ、ロボットなどで盛り上がっていたが、今年の目玉な何なのだろうか?テーマはデジタルコンバージェンスになっている。こまめに探せば何か面白いものがあるはずだ。毎年いろいろ発見している。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

64bit と 32bit その2

2006年09月20日 02時27分04秒 | Weblog
前回の続きだが、flops.c という FLOPS を測定するプログラムを用いて 32bit と 64bit を速度差を見てみよう。バイナリとコンパイルオプションは適当に選択して以下の通りである。

環境1(デフォルト) OS : Fedora Core 4, CPU : Opteron 270(2GHz) : メモリ 4GB : gcc 4.0.2
環境2 OS : 多分 SuSE, CPU : Opteron 246(2GHz) : メモリ 4GB : gcc 3.3.3

flops-m32 gcc -O3 -m32 flops.c
flops-m64 gcc -O3 -m64 flops.c
flops-m32-1 gcc -O3 -m32 -march=opteron flops.c
flops-m64-1 gcc -O3 -m64 -march=opteron flops.c
flops-m32-2 gcc -O3 -m32 -march=opteron -msse -msse2 flops.c
flops-m64-2 gcc -O3 -m64 -march=opteron -msse -msse2 flops.c
flops-m32-3 gcc -O3 -m32 -march=opteron -m3dnow flops.c
flops-m64-3 gcc -O3 -m64 -march=opteron -m3dnow flops.c
flops-intel1 icc -O3 -static flops.c
flops-intel2 icc -O3 -static -axW -ipo flops.c
flops-intel2 icc -O3 -static -parallel -axW -ipo flops.c
flops-pgi pgcc -O3 -fast -tp amd64 flops.c

いろいろな測定値が出てくるが、FADD 39回, FSUB 2回, FMUL 50回のループからなるFLOPS値の測定値を見てみよう。結果は画像を見ていただくとしよう。この実験だけだと良くわからないが可能性としては以下のような物が考えられる。

1: 64bit にした方が悪くはならないというはほぼ正しい。ただし Opteron 用に tune して SSE2 などを使用すると 32bit と 64bit の差はなくなる。
2: 64bit で 3dnow の使用は危険なのか?
3: 環境1と2の flops-m32 と flops-m64 を比べると gcc 3.3.3 と gcc 4.0.2 の差は大きいように見える。
4: 環境1の Intel コンパイラは非商用無料版なので(関係あるのか?)、性能が良くない。環境2の Intel コンパイラの性能は良い(-parallel の自動並列も含めて)。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

64bit と 32bit その1

2006年09月19日 01時40分03秒 | Weblog
普段 SDPA で何気なく 64bit モードでコンパイルして実行しているが、64bit で makeして実行した方が 32bit よりも最低でも遅くはならないという感覚でやっている(実際 SDPA では速度に有意差があるとは思えない)。ただ SDPARA などではメモリの使用量が膨大なので(それでも1個の配列で 2GB 超えるものは無いが)、64bit モードが必須になる。良く雑誌なども出ていたが、32bit (IA32)と 64bit(X86_64 と IA64)で各変数のバイト数を調べると以下のようになっている。

32bit
sizeof(char) = 1
sizeof(short int) = 2
sizeof(int) = 4
sizeof(long int) = 4
sizeof(float) = 4
sizeof(double) = 8
sizeof(long double) = 12
sizeof(int*) = 4

64bit
sizeof(char) = 1
sizeof(short int) = 2
sizeof(int) = 4
sizeof(long int) = 8
sizeof(float) = 4
sizeof(double) = 8
sizeof(long double) = 16
sizeof(int*) = 8

幸か不幸か int と double は同じバイト数なので移植は大変楽だが、64bit にしても別に精度が上がるわけではない(long を付ければ別だが)。それでもポインタが 64bit になっているのは大変魅力である。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

来年度の計算機設置場所

2006年09月18日 03時55分36秒 | Weblog
来年度の計算機設置場所の電源と空調について何とかなりそうな雰囲気になってきた。しかし、実際にどのくらい電源容量が取れるかなどについては、まだはっきりしていない。物理的に言っても現在の計算機の寿命から言っても規模を縮小した形で再出発することになるだろうが、計算機管理などの面から言っても今よりは”まし”な環境になるだろう。いろいろと根回しが大変だった。
そういえば最近のテレビの待機電力がもの凄く少ないことに気が付いた。主電源スイッチを切れば良いのだが、リモコンスイッチだけで切っておくと待機電力が発生する。日本中のテレビの待機電力をゼロに出来れば相当 CO2 の排出量を減らせるそうなので、各メーカーとも開発に力を入れている。例えば26インチの液晶テレビで消費電力 109W で待機電力は 0.05W だそうだ。
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする