前回の続きで Intel の Sandy Bridge (Corei7 2600K) 上での Intel MKL ライブラリの性能差を計測した。Sandy Bridge に対する MKL の性能は少し上がっているように見える。
○問題1:theta6.dat-s
SDPA 7.4.0 + GotoBLAS2 for Sandy Bridge : 9.089秒
SDPA 7.4.0 + GotoBLAS2 1.13(Nehalem) : 13.428秒
SDPA 7.4.0 + Intel MKL 10.3.3-174 : 10.036秒
SDPA 7.4.0 + Intel MKL 10.3.4-191 : 9.833秒
○問題2:FH2+.1A1.STO6G.pqgt1t2p.dat-s
SDPA 7.4.0 + GotoBLAS2 for Sandy Bridge : 105.293秒
SDPA 7.4.0 + GotoBLAS2 1.13(Nehalem) : 107.935秒
SDPA 7.4.0 + Intel MKL 10.3.3-174 : 111.08秒
SDPA 7.4.0 + Intel MKL 10.3.4-191 : 105.68秒
○問題3:nug12_r2.dat-s
SDPA 7.4.0 + GotoBLAS2 for Sandy Bridge : 111.237秒
SDPA 7.4.0 + GotoBLAS2 1.13(Nehalem) : 189.667秒
SDPA 7.4.0 + Intel MKL 10.3.3-174 : 128.29秒
SDPA 7.4.0 + Intel MKL 10.3.4-191 : 125.55秒
○計算サーバ (1 CPU x 4 コア = 4 コア)
CPU : Intel Corei7 2600K (3.50GHz / 8MB L3) x 2
Memory : 8GB (4 x 2GB)
OS : Fedora 14 for x86_64
○問題1:theta6.dat-s
SDPA 7.4.0 + GotoBLAS2 for Sandy Bridge : 9.089秒
SDPA 7.4.0 + GotoBLAS2 1.13(Nehalem) : 13.428秒
SDPA 7.4.0 + Intel MKL 10.3.3-174 : 10.036秒
SDPA 7.4.0 + Intel MKL 10.3.4-191 : 9.833秒
○問題2:FH2+.1A1.STO6G.pqgt1t2p.dat-s
SDPA 7.4.0 + GotoBLAS2 for Sandy Bridge : 105.293秒
SDPA 7.4.0 + GotoBLAS2 1.13(Nehalem) : 107.935秒
SDPA 7.4.0 + Intel MKL 10.3.3-174 : 111.08秒
SDPA 7.4.0 + Intel MKL 10.3.4-191 : 105.68秒
○問題3:nug12_r2.dat-s
SDPA 7.4.0 + GotoBLAS2 for Sandy Bridge : 111.237秒
SDPA 7.4.0 + GotoBLAS2 1.13(Nehalem) : 189.667秒
SDPA 7.4.0 + Intel MKL 10.3.3-174 : 128.29秒
SDPA 7.4.0 + Intel MKL 10.3.4-191 : 125.55秒
○計算サーバ (1 CPU x 4 コア = 4 コア)
CPU : Intel Corei7 2600K (3.50GHz / 8MB L3) x 2
Memory : 8GB (4 x 2GB)
OS : Fedora 14 for x86_64