2007年10月15日のブログ記事一覧-研究日誌。

Cell での BLAS (DGEMM) - その３。

2007-10-15 22:49:13 | Weblog

前回は、DGEMM と言いながらα、βがそれぞれ１としていた。
もちろん処理もその分少なくなってしまう。

今回はα、βの演算、さらには SIMD も用いている。まずは実行時間だが、SIMD による高速化の効果が表れている。また、行列Ａ、行列Ｂを２行ずつ扱うことで、少しだが DMA 転送に対する処理の割合を大きくすることにした。その結果、前回に比べ、実行時間が半分ほどに改善されている。

２行ずつ扱ってはいるが、Double Buffer モデルのように、DMA 転送完了待ちと、処理を並列しているわけではないので、まだまだ早くなりそうである。

gcc　　　　　　　　　　　　　　　[msec]
SPE　512X512　1024x1024　2048x2048
　1　　　370　　　 2750　　　　21500
　2　　　215　　　 1550　　　　11500
　3　　　165　　　 1150　　　　 8500
　4　　　140　　　　900　　　　 6800
　5　　　125　　　　800　　　　 6050
　6　　　120　　　　720　　　　 5450

2007年10月
日	月	火	水	木	金	土
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

研究日誌。

大規模なグラフ処理に対してメモリ階層構造を考慮した高性能なソフトウェアを開発。

Cell での BLAS (DGEMM) - その３。