以下は藤澤G、鈴村G、佐藤Gから1つずつ選んだ Best paper です(2011/11 〜 2014/12)。
Katsuki Fujisawa, Toshio Endo, Hitoshi Sato, Makoto Yamashita, Satoshi Matsuoka and Maho Nakata “High-Performance General Solver for Extremely Large-Scale Semidefinite Programming Problems”, Proceedings of the 2012 ACM/IEEE conference on Supercomputing, SC’12, 2012年11月[DOI: 10.1109/SC.2012.67]
大規模な数理最適化問題 (半正定値計画問題: SDP) に対する並列ソルバの開発と評価。SDPは現在最も注目されている数理最適化問題の一つであり、組合せ最適化、データマイニング、量子化学,制御分野など非常に幅広い応用を持っている。今回、計算量とデータ移動量の正確な推定、疎性やサイズなどのデータ特性と性能値の見極め等のアルゴリズムを開発することによって、世界最高性能の並列ソルバの開発に成功し、東工大スパコン TSUBAME2.0上で 533TFlops(4080GPU)を達成した。
Koji Ueno and Toyotaro Suzumura "Highly Scalable Graph Search for the Graph500 Benchmark" HPDC 2012 (The 21st International ACM
Symposium on High-Performance Parallel and Distributed Computing), 2012/6, Delft, Netherlands
Graph500 においてスケール可能な2次元分割をTSUBAME2.0上に提案・実装を行った。512ノードで頂点数2^36(68.7 billion),エッジ数2^40(1.1 trillion)のグラフ(Graph500のScale 36)のBFS(幅優先探索)を24.12秒で計算した.
Keita Iwabuchi, Hitoshi Sato, Yuichiro Yasui, Katsuki Fujisawa, Satoshi Matsuoka, “NVM-based Hybrid BFS with Memory Efficient Data Structure”, 2014 IEEE International Conference on BigData (IEEE BigData 2014), 2014. (in press)
不揮発性メモリデバイス向けのHybrid BFS Algorithmに対し、省メモリなデータ構造とI/Oの最適化を行うことにより、
ホストのメモリ容量の4倍程度を超えるようなさらなる大規模グラフサイズでも14%程度の性能低下に抑えられることを示した。
Katsuki Fujisawa, Toshio Endo, Hitoshi Sato, Makoto Yamashita, Satoshi Matsuoka and Maho Nakata “High-Performance General Solver for Extremely Large-Scale Semidefinite Programming Problems”, Proceedings of the 2012 ACM/IEEE conference on Supercomputing, SC’12, 2012年11月[DOI: 10.1109/SC.2012.67]
大規模な数理最適化問題 (半正定値計画問題: SDP) に対する並列ソルバの開発と評価。SDPは現在最も注目されている数理最適化問題の一つであり、組合せ最適化、データマイニング、量子化学,制御分野など非常に幅広い応用を持っている。今回、計算量とデータ移動量の正確な推定、疎性やサイズなどのデータ特性と性能値の見極め等のアルゴリズムを開発することによって、世界最高性能の並列ソルバの開発に成功し、東工大スパコン TSUBAME2.0上で 533TFlops(4080GPU)を達成した。
Koji Ueno and Toyotaro Suzumura "Highly Scalable Graph Search for the Graph500 Benchmark" HPDC 2012 (The 21st International ACM
Symposium on High-Performance Parallel and Distributed Computing), 2012/6, Delft, Netherlands
Graph500 においてスケール可能な2次元分割をTSUBAME2.0上に提案・実装を行った。512ノードで頂点数2^36(68.7 billion),エッジ数2^40(1.1 trillion)のグラフ(Graph500のScale 36)のBFS(幅優先探索)を24.12秒で計算した.
Keita Iwabuchi, Hitoshi Sato, Yuichiro Yasui, Katsuki Fujisawa, Satoshi Matsuoka, “NVM-based Hybrid BFS with Memory Efficient Data Structure”, 2014 IEEE International Conference on BigData (IEEE BigData 2014), 2014. (in press)
不揮発性メモリデバイス向けのHybrid BFS Algorithmに対し、省メモリなデータ構造とI/Oの最適化を行うことにより、
ホストのメモリ容量の4倍程度を超えるようなさらなる大規模グラフサイズでも14%程度の性能低下に抑えられることを示した。