マルチスレッド計算(SCM が疎な場合)に関する改善後と改善前の結果について。
◯実行結果:改善後
1スレッド : 13155.50s
2スレッド : 9607.08s
4スレッド : 7716.14s
8スレッド : 6856.89s
16スレッド : 7054.77s
32スレッド : 8411.57s
◯実行結果:改善前
1スレッド : 14492.80s
2スレッド : 10331.28s
4スレッド : 8118.21s
8スレッド : 7402.06s
16スレッド : 7392.43s
32スレッド : 8437.92s
◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3
◯問題
* SDPA sparse format data
* mDim = 25724, nBlock = 37
* size of bVect = 1 * 25724
* size of sparseMatrix = 471309 * 5
25724
37
-5460 -24289 363 323 323 323 323 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78
◯実行結果:改善後
1スレッド : 13155.50s
2スレッド : 9607.08s
4スレッド : 7716.14s
8スレッド : 6856.89s
16スレッド : 7054.77s
32スレッド : 8411.57s
◯実行結果:改善前
1スレッド : 14492.80s
2スレッド : 10331.28s
4スレッド : 8118.21s
8スレッド : 7402.06s
16スレッド : 7392.43s
32スレッド : 8437.92s
◯計算サーバ:Intel Xeon SandyBridge-EP 32 コアマシン
CPU Intel Xeon E5-4640 (8-core 2.40GHz 16MB cacheTDP:95w) x 4
Memory 512GB ACTICA製HPC専用メモリ DDR3 1600Mhz (16GB x 32枚) x 32
OS : CentOS 6.3
◯問題
* SDPA sparse format data
* mDim = 25724, nBlock = 37
* size of bVect = 1 * 25724
* size of sparseMatrix = 471309 * 5
25724
37
-5460 -24289 363 323 323 323 323 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78 78