昨日の続きで、全体時間ではなく具体的な中身(ボトルネックとなる二つの部分)の比較を行う。CHOLESKY の部分は基本的に 7.3.6 と 7.4.0 で違いが無いので、性能的にもほぼ同じ。ELEMENTS の部分は疎な SCM の場合のマルチスレッド化が比較的良く成功している。
◯ SDPA 7.3.6 (LP64)
◯ SDPA 7.4.0 (ILP64)
◯問題:BroydenBand400.dat-s
◯実行結果:ELEMENTS (SCM の生成)
![](https://blogimg.goo.ne.jp/thumbnail/29/ec/1070b49a40362995a1c1417561e44e1b_s.jpg)
◯実行結果:CHOLESKY (SCM の分解)
![](https://blogimg.goo.ne.jp/thumbnail/23/df/054d1ab831b20fe145f31c9b9753659d_s.jpg)
◯SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz 8 Core 20M L3 cache x 2
CPU Fan INTEL 純正水冷クーラー x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
SSD 120GB SSD(起動・OS用)
HDD Enterprize 1TB SATA HDD
DVD DVD-RAM
GPGPU NVIDIA GeForce 580搭載 3GB Memory
電源 850W 以上の80PLUS 高効率電源
OS : CentOS 6.2
◯ SDPA 7.3.6 (LP64)
◯ SDPA 7.4.0 (ILP64)
◯問題:BroydenBand400.dat-s
◯実行結果:ELEMENTS (SCM の生成)
![](https://blogimg.goo.ne.jp/thumbnail/29/ec/1070b49a40362995a1c1417561e44e1b_s.jpg)
◯実行結果:CHOLESKY (SCM の分解)
![](https://blogimg.goo.ne.jp/thumbnail/23/df/054d1ab831b20fe145f31c9b9753659d_s.jpg)
◯SandyBridge-EP マシン:Intel Xeon E5-2690 2.90GHz 8 Core 20M L3 cache x 2
CPU Fan INTEL 純正水冷クーラー x 2
Memory DDR 3 1600 ECC REG 256GB (16GB x 16)
SSD 120GB SSD(起動・OS用)
HDD Enterprize 1TB SATA HDD
DVD DVD-RAM
GPGPU NVIDIA GeForce 580搭載 3GB Memory
電源 850W 以上の80PLUS 高効率電源
OS : CentOS 6.2