2008年11月15日のブログ記事一覧-最適化問題に対する超高速＆安定計算

SDPA のマルチスレッド化と numactl その１

2008年11月15日 02時08分28秒 | Weblog

SDPA のアルゴリズムの中で Schur complement 行列の全要素（正確には上三角行列の全要素）を計算する必要があって、多くの場合ではこの部分がボトルネックになっている。図のように問題の疎性に応じて上から F1 式(密な場合), F3 式(疎な場合)を用いて計算を行っていく。各行の計算は独立に行うことができるので SDPARA ではこの部分を MPI などを用いて並列化を行っている。最近は 1 ノードでもマルチコアなので、MPI ではなく pthread を用いて同じように行単位の計算をマルチスレッドで行ってみた。この F3 の計算式が曲者で、計算量は少ないがデータ移動量は非常多い。この F3 計算式の並列化を普通に行うと全く性能が上がらないので、CPU の演算能力ではなく、２次キャッシュやメモリのバンド幅などがボトルネックの原因になっていると推測される。
しかし、この行単位の計算では列方向（つまり行列 A_j) のデータは共通に使えるので、特に隣接性が高い隣り合った二つの行の計算を２次キャッシュを共有する形で並列計算を行うと高速化されるようだ。具体的な計算結果についてはその２以降で報告する。

2008年11月
日	月	火	水	木	金	土
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

アクセス
閲覧	224	PV
訪問者	179	IP
トータル
閲覧	4,997,823	PV
訪問者	1,258,642	IP

最適化問題に対する超高速＆安定計算

大規模最適化問題、グラフ探索、機械学習やデジタルツインなどの研究のお話が中心

SDPA のマルチスレッド化と numactl その１

カレンダー

Twitter

最新記事

検索

ログイン

バックナンバー

ブックマーク

文字サイズ変更

アクセス状況

goo blog おすすめ

goo blog お知らせ