HPC(High Performance Computing)の分野でも Cell に注目している人は多いようだ。まだ Cell の実機に触れることが出来る人は少ないと思うが、BSC から配布されている Cell BE SDK を用いてシミュレーションしてみることは出来る。Cell は 4GHz で動作させて、8個の SPE を全て使用した場合の演算性能は、単精度で 256GFlops (Pentium IV 3.8GHz で 15.2GFlops)、倍精度で 26GFlops (Pentium IV 3.8GHz で 7.6GFlops)になる。
Cell はもともと PS3 のようなメディア処理用として開発されているので、ソフトウェアにより分岐予測も含めて HPC に向いているかどうかは良くわからないことが多い。8個の SPE に上手に負荷分散できるようにプログラミングする必要があるが、SPE 内のキャッシュの有効利用と Load/Store 命令の削減が鍵になるようだ。
Cell はメインの PPE だけでは演算性能は PenIV にも劣るらしく、昨日触れたスパコンも汎用計算用の Opteron と特殊計算用の Cell の両方を搭載する。Cell も巷ではいろいろと評価されているが、プログラミング次第で性能が大きく上下するというのはプログラマーとしては面白い。
Cell はもともと PS3 のようなメディア処理用として開発されているので、ソフトウェアにより分岐予測も含めて HPC に向いているかどうかは良くわからないことが多い。8個の SPE に上手に負荷分散できるようにプログラミングする必要があるが、SPE 内のキャッシュの有効利用と Load/Store 命令の削減が鍵になるようだ。
Cell はメインの PPE だけでは演算性能は PenIV にも劣るらしく、昨日触れたスパコンも汎用計算用の Opteron と特殊計算用の Cell の両方を搭載する。Cell も巷ではいろいろと評価されているが、プログラミング次第で性能が大きく上下するというのはプログラマーとしては面白い。