最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

タブレットデバイス Xperia(TM) Tablet S

2012年09月15日 01時55分30秒 | Weblog
富士通の携帯電話 ARROWS X も CPU は Tegra 3 を搭載しているが、こちらはクロック周波数は 1.5GHz となっている。搭載メモリも 1GB なので、携帯電話とは言っても相当高いスペックを持っていることがわかる。ただし、Graph500 などのグラフ探索を目的とするとメモリ 1GB は少ないので、メモリ 2GB 搭載タブレットの早期発売が望まれるところ。とりあえず以下の SONY タブレットの購入も検討中。

タブレットデバイス Xperia(TM) Tablet S
OS 名称 Android 4.0
プロセッサー 名称 NVIDIA Tegra 3モバイル プロセッサ
動作周波数 1.3GHz
メインメモリー 搭載容量 1GB
液晶表示装置 サイズ/解像度 9.4型 WXGA(1280×800)
パネル種別 TFTカラー液晶
液晶タッチパネル 仕様 タッチパネル機能搭載
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

第24回 RAMP シンポジウム 事前登録締切まもなく終了

2012年09月14日 02時12分01秒 | Weblog
以下の第24回 RAMP シンポジウムですが、事前登録締切まもなく(9月14日)終了となります。参加予定の方はお忘れのないようにお願いします。

-------------------------------------------------------------------------------
RAMPシンポジウムは,日本オペレーションズ・リサーチ学会の数理計画研究部会
(RAMP: Research Association of Mathematical Programming) によって
年一度開催される,最適化・数理計画に関するシンポジウムです.
今年は仙台にて9月の27,28日に開催されます.

シンポジウムのプログラムも充実したものとなっておりますが,
懇親会の方も仙台ならではの食べ物,日本酒を用意しております.
懇親会の参加人数を見積もる都合上,懇親会参加申し込みがまだの方は
メールで構いませんので,事前に実行委員会までご連絡いただければ幸いです.

日時 : 2012年9月27日(木),28日(金)
会場 : 東北大学 片平キャンパス・さくらホール
(仙台駅から近いキャンパスでの開催です)
http://orsj.or.jp/ramp/2012/index.html

実行委員長:
村松 正和(電気通信大学)
塩浦 昭義(東北大学)

参加申し込みの受付を受け付けています.下記のサイトから登録可能です.
http://orsj.or.jp/ramp/2012/register.html

参加費は以下の通りです.
事前申し込みの方がお安くなっております.

シンポジウム参加費   一般     学生
事前振込(9月14日まで) ¥5,000 ¥2,000
当日払い ¥7,000 ¥3,000
(東北大大学院情報科学研究科,経済学研究科の構成員は参加費無料(登録は必要))

なお,シンポジウム初日セッション終了後にさくらホール1階にて懇親会を行います.
奮ってご参加下さいますようお願い申し上げます.
懇親会につきましては人数に限りがありますので,お早めにお申し込みください.

懇親会参加費   一般 学生
事前・当日払いともに ¥5,000 ¥2,000
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

SDPARA-G 用の新クラスタ

2012年09月13日 01時17分39秒 | Weblog
SDPARA-G 用の新クラスタが完成した。以下の 4台、8 CPU(Intel Xeon X5690)、16 GPU(Tesla C2075 x 8枚 + C2070 x 8枚)という構成になっている。SDPARA-G の性能についてはまた後日掲載する予定。

◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(4台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband(FDR) x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64




コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

AMD 系 CPU と Graph500 測定値

2012年09月12日 00時46分15秒 | Weblog
以下の AMD 系 CPU 搭載の計算サーバを用いて Graph500 測定を行った。グラフのサイズは Scale 24 とする。

○計算サーバ1
CPU : AMD Opteron 2356 2.3GHz x 2 (2CPU x 4 コア = 8 コア)
Memory : 32GB
OS : CentOS 6.3 for X86_64
median_TEPS: 1.06533244135995173e+09

◯計算サーバ2
CPU : AMD Opteron 2384 2.7GHz x 2 (2CPU x 4 コア = 8 コア)
Memory : 32GB
OS : CentOS 5.8 for x86_64
median_TEPS: 1.44020217810197926e+09

○計算サーバ3
CPU : AMD Opteron 2435(2.6GHz / 6MB L3)x 2 (2CPU x 6 コア = 12 コア)
Memory : 64GB(16 x 4GB / 800MHz)
OS : Fedora 17 for x86_64
median_TEPS: 1.38218656489444637e+09

○計算サーバ4
CPU : AMD Opteron 8439 (2.80GHz / 6MB L3) x 4 (4 CPU x 6 コア = 24 コア)
Memory : 128GB (32 x 4GB / 800MHz)
OS : Fedora 17 for x86_64
median_TEPS: 2.00383601032628226e+09

○計算サーバ5
CPU : AMD Opteron 6174 (2.20GHz / 12MB L3) x 4 (4 CPU x 12 コア = 48 コア)
Memory : 256GB (16 x 16GB / 1066MHz)
OS : Fedora 17 for x86_64
median_TEPS: 6.02233660837044525e+09
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

全米道路ネットワークでの最短路計算の消費電力

2012年09月11日 00時58分59秒 | Weblog
以下の計算サーバの SCALE 21 (点数 2,097,152 ≒2^21 、 枝数 67,105,930 ≒2^26 ) グラフでの BFS 性能から考えると、全米道路ネットワークの最短路計算(任意の始点と終点を選ぶ)に要する電力量はわずか 3W 程度。特に SandyBridge-EP マシンは非常に GTEPS/kW の値が高くなっている。

◯計算サーバ
SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.3

◯全米道路ネットワーク

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Android タブレット

2012年09月10日 01時02分01秒 | Weblog
某測定用のマシンとして、以下の2台の Android タブレットを用意しました。性能(速さ)はそこそこ出るようですが、非常に省電力な仕様なので、どういう結果になるのか興味があるところです。

SONY Tablet S シリーズ SGPT112JP/S
CPU : NVIDIA Tegra 2 モバイル プロセッサ 1GHz
メモリ : 1GB
OS : Android 4.0.3
9.4型ワイド液晶 1280×800

ASUS Transformer Pad Infinity TF700T
CPU : NVIDIA Tegra 3 モバイル プロセッサ 1.7GHz
メモリ : 1GB
OS : Android 4.0.3
10.1型 LEDバックライト 1,920×1,200ドット(WUXGA)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

2012年度 第1回 ORセミナー 『Excelで学ぶOR』

2012年09月09日 02時21分05秒 | Weblog
以下の OR セミナーの講師を担当することになっておりますが、セミナーのテキストについてはすでに7日に提出しました(3人分)。全部で 157ページ(3人分)ありますので、時間内に全てを説明できないと思いますが、出きるだけ多くの内容に触れたいと考えております。

日 時 2012年9月21日(金) 10:00~17:40
会 場  (株)構造計画研究所 本所新館(地下1階 レクチャールーム) 
〒164-0011 東京都中野区中央4-5-3 Tel.03(5342)1065
≪交通≫ 東京メトロ丸の内線「新中野」駅 1番出口徒歩約1分
≪地図のURL≫ http://www.kke.co.jp/corporate/profile/map/tokyo.html
コーディネータ
司会 (株)構造計画研究所 斉藤努
プログラム
(敬称略)
1) 10:00~10:05 開会挨拶

2) 10:05~12:05 講演1(途中休憩あり)
題目: 「基本編(モデリングと定式化及び Excel ソルバーの使い方)」
講師: 中央大学 藤澤克樹
概要: ORの基本ツールである数理計画問題を使うためのモデリングや定式化の方法を学習する。さらに代表的な数理計画問題やシミュレーションの紹介を行い、Excel ソルバーを用いて実際にこれらの例題を解きながら問題解決の方法も同時に学習していく。

3) 12:05~13:15 昼休み

4) 13:15~15:15 講演2(途中休憩あり)
題目: 「応用編1(不確実性下の意思決定と評価のための方法論)」
講師: 中央大学 後藤順哉
概要: 前半ではExcelソルバーの応用として、2次計画として記述されるポートフォリオ最適化問題を中心に学習する。後半ではLPを用いた評価法として知られるDEA(包絡分析法)について学習する。

5) 15:30~17:30 講演3(途中休憩あり)
題目: 「応用編2(都市・交通のデザインと計画・運用のための最適化手法)」
講師: 中央大学 吉良知文
概要: 前半は交通網のデザインやソーシャルネットワークの解析など様々な応用をもつ最短路問題と最大流問題を中心に、後半はExcelソルバーを用いながら乗務員の最適な割り当てや顧客への商品の配送などに用いられる「効率よいスケジュール」を作成する手法を学習する。

6) 17:30~17:40 まとめ

テキスト 当日会場にて配布 
参加費
(テキスト代込) 正・賛助会員(協賛学会員を含む)10,000円,
学生会員 2,000円,非会員 20,000円

たくさんの方に参加していただけるように参加費を下げております。ぜひ、ご参加ください。
協賛学会 情報処理学会、経営情報学会、電子情報通信学会、日本経営工学会 (交渉中)
定 員 50名 定員になり次第締め切らせていただきます。
申込先 日本OR学会事務局 E-mail: jimukyoku@orsj.or.jp 
お名前、ご所属先、正会員/学生会員/賛助会員/協賛学会員/非会員、お支払予定日 (9/14までにお振込みください。)を記入してメールにてお申込みください.
申込締切 2012年9月14日(金)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Gurobi Optimizerソリューション セミナー2012 受付中

2012年09月08日 00時58分18秒 | Weblog
以下の Gurobi Optimizerソリューション セミナー2012 で”高速化と省電力技術で今後大きく変化する最適化ソフトウェア”というタイトルで講演させていただく予定です。すでに発表資料については提出済みです。参加者数についても順調に増えているようなので、参加を予定されている方は早めに申し込み下さい。

Gurobi Optimizerソリューション セミナー2012

開催日程 平成24年10月4日(木)
受付開始 9時10分~
開催時間 9時40分 ~ 17時40分 (受付開始:9時10分~)
参加費 無料
会場 東京コンファレンスセンター品川 大ホール B (アレア品川 5F)
会場アクセスマップ 地図
協賛 Gurobi Optimization Inc. / Paragon Decision Technology B.V.
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Gurobi と CPLEX と電力性能 その4

2012年09月07日 00時55分24秒 | Weblog
電力測定の最後として、大型計算サーバや省電力PCでもなく、普通のデスクトップを用いて測定を行った。

◯問題 net12.mps
Gurobi 5.0.1
実行時間:363.43s
有効電力量(kWh):0.02
皮相電力量(kVAh):0.03
CO2排出量(kg):0.01

CPLEX 12.4.0.0
実行時間:786.00s
有効電力量(kWh):0.04
皮相電力量(kVAh):0.06
CO2排出量(kg):0.02

◯問題 gmpl-10-0.2.mps
Gurobi 5.0.1
実行時間:1185.12s
有効電力量(kWh):0.06
皮相電力量(kVAh):0.09
CO2排出量(kg):0.02

CPLEX 12.4.0.0
実行時間:416.36s
有効電力量(kWh):0.02
皮相電力量(kVAh):0.03
CO2排出量(kg):0.01

◯計算サーバ
CPU : Intel Core i7 860 2.8GHz(4コア)
Memory : 8GB
OS : VineLinux 6 for x86_64

コメント (1)
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Gurobi と CPLEX と電力性能 その3

2012年09月06日 00時16分08秒 | Weblog
今回は省電力PCとして、Intel Atom を用いてみた。Intel SandyBridge-EPIntel Westmere-EX の結果と比較すると問題を解くための総電力量では必ずしも Atom が有利ではないことがわかる。

◯問題 net12.mps
Gurobi 5.0.1
実行時間:2014.16s
有効電力量(kWh):0.02
皮相電力量(kVAh):0.05
CO2排出量(kg):0.01

CPLEX 12.4.0.0
実行時間:2737.88s
有効電力量(kWh):0.03
皮相電力量(kVAh):0.06
CO2排出量(kg):0.01

◯計算サーバ
CPU : Intel Atom 330 1.6GHz(2コア)
Memory : 2GB
OS : VineLinux 6 for x86_64
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Graph500 電力測定中 その5

2012年09月05日 01時22分08秒 | Weblog
前回の続き。すでに Westmere-EX 40 コアマシンでは 10G median_TEPS を越えている。

◯計算サーバ1
SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.3



generation_time: 1.81703820228576660e+01
construction_time: 1.80730698108673096e+01
nbfs: 64
min_time: 7.08382129669189453e-02
firstquartile_time: 7.84854292869567871e-02
median_time: 8.04195404052734375e-02
thirdquartile_time: 8.51001143455505371e-02
max_time: 1.12041950225830078e-01
mean_time: 8.30455683171749115e-02
stddev_time: 9.15681533829734023e-03
min_nedge: 5.36865498000000000e+08
firstquartile_nedge: 5.36865498000000000e+08
median_nedge: 5.36865498000000000e+08
thirdquartile_nedge: 5.36865498000000000e+08
max_nedge: 5.36865498000000000e+08
mean_nedge: 5.36865498000000000e+08
stddev_nedge: 0.00000000000000000e+00
min_TEPS: 4.79164720819212723e+09
firstquartile_TEPS: 6.37201305233825874e+09
median_TEPS: 6.72670511869961357e+09
thirdquartile_TEPS: 6.93357701081905937e+09
max_TEPS: 7.57875552635289097e+09
harmonic_mean_TEPS: 6.46470978378468323e+09
harmonic_stddev_TEPS: 8.98062894583898038e+07

◯計算サーバ2
CPU:Intel Xeon X5690 3.46GHz(6 Core) x 2
Memory:DDR3 1600 ECC REG 192GB(16GB × 12)
GPGPU:Tesla C2075 (CUDA 4.2) x 4
OS:CentOS 6.3

generation_time: 2.90828330516815186e+01
construction_time: 2.87002689838409424e+01
nbfs: 64
min_time: 1.54311180114746094e-01
firstquartile_time: 1.65050148963928223e-01
median_time: 1.87003970146179199e-01
thirdquartile_time: 1.96828305721282959e-01
max_time: 2.80951023101806641e-01
mean_time: 1.87719404697418213e-01
stddev_time: 2.95150950213036410e-02
min_nedge: 5.36865498000000000e+08
firstquartile_nedge: 5.36865498000000000e+08
median_nedge: 5.36865498000000000e+08
thirdquartile_nedge: 5.36865498000000000e+08
max_nedge: 5.36865498000000000e+08
mean_nedge: 5.36865498000000000e+08
stddev_nedge: 0.00000000000000000e+00
min_TEPS: 1.91088643163779855e+09
firstquartile_TEPS: 2.73192067276214075e+09
median_TEPS: 2.94410055026934052e+09
thirdquartile_TEPS: 3.26507573207789040e+09
max_TEPS: 3.47910953438879633e+09
harmonic_mean_TEPS: 2.85993607781446218e+09
harmonic_stddev_TEPS: 5.66527595394927785e+07
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Gurobi と CPLEX と電力性能 その2

2012年09月04日 01時36分10秒 | Weblog
Gurobi と CPLEX で今度は Westmere-EX x 4 CPU マシンで実行時間と電力量などの測定を行った。SandyBridge-EP x 2 CPU の結果と比較していただきたい。

◯問題 net12.mps
Gurobi 5.0.1
実行時間:91.20s
有効電力量(kWh):0.02
皮相電力量(kVAh):0.02
CO2排出量(kg):0.01

CPLEX 12.4.0.0
実行時間:556.26s
有効電力量(kWh):0.11
皮相電力量(kVAh):0.11
CO2排出量(kg):0.05

◯問題 gmpl-10-0.2.mps
Gurobi 5.0.1
実行時間:774.07s
有効電力量(kWh):0.18
皮相電力量(kVAh):0.18
CO2排出量(kg):0.08

CPLEX 12.4.0.0
実行時間:389.07s
有効電力量(kWh):0.07
皮相電力量(kVAh):0.07
CO2排出量(kg):0.03

◯計算サーバ:Intel Xeon Westmere-EX 40 コアマシン
CPU Intel Xeon E7-4870 2.40GHz 30M L3 cache x 4
Memory ACTICA DDR3 1333 ECC REG 512GB( 16GB x 32)
HDD 3.5" Enterprize 1TB SATA HDD x 4 : RAID5構成
VGA GLADIAC GTX 580 1.5GB
Supermicro 4 way 4U Tower Server
1400W redundant 電源
OS : CentOS 6.3
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

6CPU + 12GPU v.s. 32CPU

2012年09月03日 01時12分45秒 | Weblog
以下の DNN 緩和問題に対して GPU 計算サーバ(6CPU + 12GPU) 3 台と OPT クラスタ(32CPU) の比較実験を行った。GPU計算サーバが3台あると、OPT クラスタに対して性能面でかなり有利になる。

◯QAPLIB (tai27a.dat-s) の DNN 緩和問題
mDIM = 247131
nBLOCK = 2
bLOCKsTRUCT = -324592 677

○ OPT クラスタ
Time(sec) Ratio(% : MainLoop)
Make bMat time = 1853.442709, 1.254029
Cholesky bMat = 145600.023573, 98.512174
Main Loop = 147799.016273, 100.000000

◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(3台)
Time(sec) Ratio(% : MainLoop)
Make bMat time = 8977.100682, 8.706893
Cholesky bMat = 85170.470684, 82.606873
Main Loop = 103103.371226, 100.000000

○ OPT クラスタ
1:PowerEdge M1000e(ブレードエンクロージャー) x 1台
2:PowerEdge M710HD(ブレードサーバ) x 16台
ブレードサーバの仕様:
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
NIC : GbE x 1 & Inifiniband QDR(40Gbps) x 1
OS : CentOS 5.8 for x86_64



◯ GPU 計算サーバ:Intel Xeon + 4 GPU マシン(2台)
CPU:Xeon X5690(3.46GHz,6コア)×2
メモリ:192GB(16GB×12)
HDD:SATA500GB×2(システム、システムバックアップ)
NIC : GbE x 1 & Inifiniband x 1
GPGPU:Tesla C2075(C2070)×4
OS:CentOS 6.3 for x86_64

コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

intel_iommu=on

2012年09月02日 21時59分12秒 | Weblog
CentOS 6.3 では、インストール時にアプリケーションの選択によっては、カーネルパラメータに以下のオプションが追加される。

intel_iommu=on

この場合では、SDPARA のように CUDA を利用して GPU を多数回利用するアプリケーションでは DMA 関係のエラーが発生して OS 自体が異常停止するあるので、上記のオプションは外した方が良い。


コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする

Graph500 電力測定中 その4

2012年09月01日 02時06分48秒 | Weblog
最新の結果です。

◯計算サーバ1
SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.3



median_TEPS 値:最大電流は 4.3A程度
◯ gcc 4.4.6
scale 24 : 6.57G
scale 25 : 6.81G
scale 26 : 6.59G
◯ icc 12.1.5
scale 24 : 6.26G
scale 25 : 6.35G
scale 26 : 6.11G


◯計算サーバ2
SandyBridge-EP マシン:Intel Xeon E5-2650 2.00GHz : 8 Core 20M L3 cache x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
OS : CentOS 6.3



median_TEPS 値:最大電流は 3.7A 程度
◯ gcc 4.4.6
scale 24 : 5.60G
scale 25 : 5.74G
scale 26 : 5.62G
◯ icc 12.1.5
scale 24 : 5.26G
scale 25 : 5.29G
scale 26 : 5.17G
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする