実行結果。残念ながら、Pthreads とはかなり差が付いてしまった。特に OpenMP ですべてのコアを使わなかったときの性能が良くないのは、なぜだろうか。バグが書き方がよろしくないのか、ひとまず晒しておく。
icc : 11.1
gcc : 4.1.2
icc : 11.1
gcc : 4.1.2
◆OpenMP [sec.] [1] [2] [4] [8] gcc 4.546 6.148 4.605 2.951 icc 4.631 5.350 6.073 2.918
◆Pthreads [sec.] [1] [2] [4] [8] gcc 4.769 2.424 1.220 0.687 icc 4.528 2.280 1.142 0.674