SDPA-GMP では、BLAS の関数を GMP の変数を用いて書き換えた関数が含まれているが、この部分だけ抜き出してももちろん他のプログラムで使うこともできる。もとのソースは BLAS/LAPACK 3.1.1 なので、通常のループ文(for文)が多く、簡単に OpenMP 化を用いてこの部分を並列化することができる。適当に短時間で変えただけなのだが、これでも数倍の高速化になる。OpenMP に関しては、やはり gcc よりも Intel コンパイラの方が性能が良い。SDPA-GMP は SDPA と比べて実行時間が数百倍から数千倍も遅くなるので焼け石に水だが、それでも数倍速くなるのは効果的だ。
カレンダー
最新記事
- 自己紹介と重要リンク
- IOWN、日台間3000kmで17msecの超低遅延通信を実現
- ゲーム「DOOM」のプレイ画面をリアルタイムに生成するAI プレイも可能 米Googleが開発
- NHR Center@ZIB
- なぜネコは閉じているドアを嫌うのか?
- 後継者不足の“COBOL言語”を生成AIに引き継ぎ 政府や銀行の“いにしえのプログラム”を近代化へ
- OpenAIが複雑な推論能力をもつAIモデル「OpenAI o1」と「OpenAI o1-mini」を発表、プログラミングや数学で高い能力を発揮
- 2024 IEOM Awards – 5th Asia Pacific Conference on Industrial Engineering and Operations Management
- 台湾が電力不足を理由に、北部の大規模データセンターの認可を停止
- ソフトバンクが生成AIエージェント「satto」のベータ版、9月以降順次提供へ
検索
バックナンバー
アクセス状況
アクセス | |||
---|---|---|---|
閲覧 | 801 | PV | |
訪問者 | 503 | IP | |
トータル | |||
閲覧 | 5,058,650 | PV | |
訪問者 | 1,295,117 | IP |