様々な改良を行った結果、大きな問題では Sparse SCM の各要素を計算するときのマルチスレッドの計算が有効になってきた。ただし小さな問題ではシングルスレッドの方が速いことは変わらない。
○問題 s5000n0r05g2FD_R.dat-s
1 スレッド : 424.50秒
改良前 12 スレッド : 599.81秒
改良後 12 スレッド : 240.18秒
○計算サーバ
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
OS : CentOS 5.5 for x86_64
○問題 s5000n0r05g2FD_R.dat-s
1 スレッド : 424.50秒
改良前 12 スレッド : 599.81秒
改良後 12 スレッド : 240.18秒
○計算サーバ
CPU : インテル(R) Xeon(R) プロセッサー X5670(2.93GHz、12MB キャッシュ、6.4 GT/s QPI) x 2個
メモリ: 128GB (16X8GB/2R/1333MHz/DDR3 RDIMM/CPUx2)
Disk : 73GB x 2(1台のみ 300GB x 2)
OS : CentOS 5.5 for x86_64