最適化問題に対する超高速&安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

IBM Blue Gene/Q

2012年09月23日 21時44分58秒 | Weblog
IBM の Blue Gene/Q は各 CPU からラックまでが以下のような構成になっている。

http://news.mynavi.jp/articles/2011/12/13/blugeneq/index.html


IBM BG/Q(Sequoiaのピーク性能):4 FPU x 2演算(FMA) x 16コア x 1.6GHz (ここまで 1CPU = 204.8GFlops) x 32 カード x 16 ノード x 2 ミッドプレーン x 96 ラック = 20.133PFlops

BG/Q チップの特徴
◯16+1 core SMP:OS 用のコアが一つある
◯Each core 4-way hardware threaded:データインテンシブ系のアプリでは巨大な疎データに対するランダムアクセスが発生するので、スレッドを多数作って、レイテンシを隠蔽するやり方は有効

その他の特徴
◯Transactional memory and thread level speculation
◯Quad floating point unit on each core
◯204.8 GF peak node
◯Frequency: 1.6 GHz
◯563 GB/s bisection bandwidth to shared L2(Blue Gene/L at LLNL has 700 GB/s for system)
◯32 MB shared L2 cache
◯42.6 GB/s DDR3 bandwidth (1.333 GHz DDR3)
コメント
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする