研究日誌。
大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。
○ Graph500 & Green Graph500
・November 2013:
Single-node (SGI Altix UV1000 @ JAIST) で最速の 50 位 (SCALE30 で 37.66 GTEPS)
Single-server (Intel(R) Xeon(R) E5-4650 x 4 sockets @ 中大) で最速の 51 位 (SCALE27 で 31.65 GTEPS)
Green Graph500 Small Data category で, Xperia-A-SO-04E で 1位 (153.17 MTEPS/W and 0.478 GTEPS) を達成.
・June 2013:
公式リストとして世界最高 64.12 MTEPS/W を記録し、1, 2, 3, 4, 5 位を独占
(上位12エントリー中, 6位以外の11エントリーを独占).
・November 2012:
CPU のみを使用した Single-node で最高位 (52 位) SCLAE26 / 10.4953 GTEPS を達成。
非公式 Green Graph500 で、世界最高 51.619 GTEPS/kW を達成, 1, 2, 3, 4, 5 位を独占。
2013年3月公式ウェブページ上に Unofficial list として公開。
・June 2012:
Single-node (CPU のみ) では 32位の SCLAE29 / 5.68 GTEPS が最高速。
その後リストの更新があり、SCALE 26 8.15 GTEPS として 25 位にランクイン。
Single node では CPU/GPU/FPGA 含めても世界最高速。
○ NUMA (Non-uniform Memory Access) アーキテクチャを考慮した並列アルゴリズムの高速化
・NUMA を考慮するためのライブラリ ULIBC (Ubiquity library for intel- ligently binding cores)
・並列 Simpath アルゴリズムに対する高速化
・半正定値計画問題に対する汎用高性能ソルバ SDPA に対する高速化と性能解析
○ NETAL (最短路問題 & 中心性計算)
・NETAL (NETwork Analysis Library) の開発
・9th DIMACS の参照実装に比べて、同一メモリ要求量で4倍の高速化を達成したダイクストラ法 (SSSP)
・9th DIMACS の参照実装の 229 倍の性能を達成した最短路"長"計算 (Multi-Source Label-Correcting + NUMA)
・全米道路ネットワーク USA-road-d.USA.gr に対する全対全最短路長計算を 7.75 日で終了
・複数の指標 (Closeness, Graph, Stress, and Betweenness) を同時に計算しつつ GraphCT の数十倍の性能
大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。
○ Graph500 & Green Graph500
・November 2013:
Single-node (SGI Altix UV1000 @ JAIST) で最速の 50 位 (SCALE30 で 37.66 GTEPS)
Single-server (Intel(R) Xeon(R) E5-4650 x 4 sockets @ 中大) で最速の 51 位 (SCALE27 で 31.65 GTEPS)
Green Graph500 Small Data category で, Xperia-A-SO-04E で 1位 (153.17 MTEPS/W and 0.478 GTEPS) を達成.
・June 2013:
公式リストとして世界最高 64.12 MTEPS/W を記録し、1, 2, 3, 4, 5 位を独占
(上位12エントリー中, 6位以外の11エントリーを独占).
・November 2012:
CPU のみを使用した Single-node で最高位 (52 位) SCLAE26 / 10.4953 GTEPS を達成。
非公式 Green Graph500 で、世界最高 51.619 GTEPS/kW を達成, 1, 2, 3, 4, 5 位を独占。
2013年3月公式ウェブページ上に Unofficial list として公開。
・June 2012:
Single-node (CPU のみ) では 32位の SCLAE29 / 5.68 GTEPS が最高速。
その後リストの更新があり、SCALE 26 8.15 GTEPS として 25 位にランクイン。
Single node では CPU/GPU/FPGA 含めても世界最高速。
○ NUMA (Non-uniform Memory Access) アーキテクチャを考慮した並列アルゴリズムの高速化
・NUMA を考慮するためのライブラリ ULIBC (Ubiquity library for intel- ligently binding cores)
・並列 Simpath アルゴリズムに対する高速化
・半正定値計画問題に対する汎用高性能ソルバ SDPA に対する高速化と性能解析
○ NETAL (最短路問題 & 中心性計算)
・NETAL (NETwork Analysis Library) の開発
・9th DIMACS の参照実装に比べて、同一メモリ要求量で4倍の高速化を達成したダイクストラ法 (SSSP)
・9th DIMACS の参照実装の 229 倍の性能を達成した最短路"長"計算 (Multi-Source Label-Correcting + NUMA)
・全米道路ネットワーク USA-road-d.USA.gr に対する全対全最短路長計算を 7.75 日で終了
・複数の指標 (Closeness, Graph, Stress, and Betweenness) を同時に計算しつつ GraphCT の数十倍の性能