IBM の Blue Gene/Q は各 CPU からラックまでが以下のような構成になっている。
http://news.mynavi.jp/articles/2011/12/13/blugeneq/index.html
IBM BG/Q(Sequoiaのピーク性能):4 FPU x 2演算(FMA) x 16コア x 1.6GHz (ここまで 1CPU = 204.8GFlops) x 32 カード x 16 ノード x 2 ミッドプレーン x 96 ラック = 20.133PFlops
BG/Q チップの特徴
◯16+1 core SMP:OS 用のコアが一つある
◯Each core 4-way hardware threaded:データインテンシブ系のアプリでは巨大な疎データに対するランダムアクセスが発生するので、スレッドを多数作って、レイテンシを隠蔽するやり方は有効
その他の特徴
◯Transactional memory and thread level speculation
◯Quad floating point unit on each core
◯204.8 GF peak node
◯Frequency: 1.6 GHz
◯563 GB/s bisection bandwidth to shared L2(Blue Gene/L at LLNL has 700 GB/s for system)
◯32 MB shared L2 cache
◯42.6 GB/s DDR3 bandwidth (1.333 GHz DDR3)
http://news.mynavi.jp/articles/2011/12/13/blugeneq/index.html
IBM BG/Q(Sequoiaのピーク性能):4 FPU x 2演算(FMA) x 16コア x 1.6GHz (ここまで 1CPU = 204.8GFlops) x 32 カード x 16 ノード x 2 ミッドプレーン x 96 ラック = 20.133PFlops
BG/Q チップの特徴
◯16+1 core SMP:OS 用のコアが一つある
◯Each core 4-way hardware threaded:データインテンシブ系のアプリでは巨大な疎データに対するランダムアクセスが発生するので、スレッドを多数作って、レイテンシを隠蔽するやり方は有効
その他の特徴
◯Transactional memory and thread level speculation
◯Quad floating point unit on each core
◯204.8 GF peak node
◯Frequency: 1.6 GHz
◯563 GB/s bisection bandwidth to shared L2(Blue Gene/L at LLNL has 700 GB/s for system)
◯32 MB shared L2 cache
◯42.6 GB/s DDR3 bandwidth (1.333 GHz DDR3)