GotoBLAS 1.22 から Cell 正式対応になっている。Cell(PS3 上)において、GotoBLAS 1.22 以前では ppc970mpp として make を行っていたが、1.22 では普通に quickbuild.64bit で作成できるようになった。
1: SDPA 7.0.5 rev3 + LAPACK(BLAS) 3.1.1
2: SDPA 7.0.5 rev3 + ATLAS 3.8.0
3: SDPA 7.0.5 rev3 + GotoBLAS 1.21(ppc970mpp)
4: SDPA 7.0.5 rev3 + GotoBLAS 1.22(cell)
○問題 mcp500-1
1: 1m41.067s
2: 0m29.301s
3: 0m28.876s
4: 0m20.913s
○問題 theta3
1: 1m8.500s
2: 0m14.678s
3: 0m14.650s
4: 0m12.280s
○問題 r2S_broydenTri600
1: 0m20.795s
2: 0m21.809s
3: 0m21.709s
4: 0m21.324s
通常は GotoBLAS 1.22 > GotoBLAS 1.21 = ATLAS 3.8.0 > LAPACK(BLAS)3.1.1 だが、r2S_broydenTri600 のように SparseCholesky 分解を用いる場合は BLAS を使う比率が少ないので、あまり差がでない。
1: SDPA 7.0.5 rev3 + LAPACK(BLAS) 3.1.1
2: SDPA 7.0.5 rev3 + ATLAS 3.8.0
3: SDPA 7.0.5 rev3 + GotoBLAS 1.21(ppc970mpp)
4: SDPA 7.0.5 rev3 + GotoBLAS 1.22(cell)
○問題 mcp500-1
1: 1m41.067s
2: 0m29.301s
3: 0m28.876s
4: 0m20.913s
○問題 theta3
1: 1m8.500s
2: 0m14.678s
3: 0m14.650s
4: 0m12.280s
○問題 r2S_broydenTri600
1: 0m20.795s
2: 0m21.809s
3: 0m21.709s
4: 0m21.324s
通常は GotoBLAS 1.22 > GotoBLAS 1.21 = ATLAS 3.8.0 > LAPACK(BLAS)3.1.1 だが、r2S_broydenTri600 のように SparseCholesky 分解を用いる場合は BLAS を使う比率が少ないので、あまり差がでない。