録画人間の末路 -

人は記録をしながらじゃないと生きていけない

1スロ最強? GT640のCUDAエンコードと実力

2012-08-11 02:04:50 | 意味なしレビュー
今回は山のようにおみやげ(自分用(笑))を買ってきたので、まだ全部ほどいてません。全部がここで取り上げるようなものでもありませんが。
そんな中で、一番使うのを楽しみにしていたのが、GeForce GT640搭載のグラフィックボードです。
わたしは基本GPUはオンボードかCPU内蔵ばかり使っています。Core i7 2600Kは内蔵のHD3000で使ってますし、AMDのAPUも使ってます。ここ最近の取り上げ方を見てもわかるように第2世代APUのTrinityのデスクトップ版も楽しみにしています。
ただ、一応メイン機であるFX8120だけはGPUを内蔵していないため、グラボは必須です。GPU内蔵チップセットでFXに対応しているのは880Gくらいなものですが、あらゆる意味で古すぎますし。今まではそこにGeForce9800GTを使ってました。ここ最近のグラボは2スロット占有型がほとんどですが、内部に圧迫もありますし拡張性も落ちますので、少ない選択肢の中から1スロットのものだけを選んで使っていたのです。nVIDIA独自のGPGPU機能であるCUDAが使え、かつ1スロなグラボはZOTACの9800GTがベストだったのです。

"ファンの大きさだけで2スロット占有するようなやつはともかく、外部への排気ができるタイプなら内部に熱がこもらないし、安定動作のためにはそっちの方がいいからほとんどがそうなったんじゃないの?"
"大体いまどきそれほど拡張スロット使わないだろ。チューナーとキャプチャー+アルファで3つも空けば十分。グラボの隣まで使う必要はない"
"CUDAなんて結局使わないよ"

あーあー、どこからか雑音が聞こえてきますが、気にしない気にしない。圧迫感のない1スロがいいんですよ! こだわりなんです。CUDAが使える環境にしておきたいんです!!

さて、長らく9800GTを使ってきましたが、いい加減これのアーキテクチャも古くなってきたのも事実。そろそろ新しいアーキテクチャのものがほしいなぁと思っていたら、ようやく出ましたGeFroce GT640。ロークラスのGPUが旧アーキテクチャの焼き直しが中心なのに対し、640から上は新アーキテクチャKeplerを採用しています。1スロが使える低発熱モデルと新アーキテクチャ、そのちょうど境にあるのがGT640なんです。出たのは2ヶ月くらい前ですが、ちょうど前回東京を引き上げた直後のことだったので買いそびれました。なので、今回は購入したんです。
そのスペックは9800GTと比べてみても

GT640(ZOTAC)
CUDAコア 384ユニット
メモリ    DDR3 2,048MB
メモリインターフェース 128ビット
コアクロック 900MHz
メモリクロック 1,782MHz
バスインターフェース PCI Express 3.0 x16
ディスプレイ出力端子 DL-DVI-I×1、DL-DVI-D×1、mini-HDMI×1
補助電源 なし
消費電力 65W
DirectX11

9800GT(ZOTAC)CLLOERMASTERモデル
CUDAコア    112ユニット
メモリ     DDR3 512MB
メモリインターフェース 256ビット
コアクロック  623MHz
メモリクロック 1.8GHz
バスインターフェ-ス  PCI Express 2.0 x16
ディスプレイ出力端子  DVI-I x 2
補助電源必要 消費電力不明
DirectX10

と、大幅に進化しています・・・メモリインターフェースのbitだけ低下しているのが気になりますが。ちなみに今回もZOTAC製です。玄人志向からも1slotのGT640は出ていますが、ロープロファイル対応の代わりにメモリが1GBしかありません。一方、ZOTACはロープロでは使えませんがメモリは2GBあります。値段はほとんど一緒でしたので少なくとも性能が上なのと過去の信頼からZOTACにしました。
9800GTと比べた場合、少なくともゲームを動かすのならかなりの差があると思うんです。でも、ここは「録画人間の末路」ゲーム対応性はネタにしません。使うのはエンコード能力ですよ、CUDAの。さて、CUDAを使ったエンコード速度を試して見ましょう。使うシステムは

FX8120/Windows7 HomePremium 64bit/DDR3-1333 12GB/SSD(C300-CTF DDAC128MAG)/990FX Extreme4

という一応メインで使っているシステム。ここに前の9800GTとGT640を差し替えながら比べます。ドライバは301.42。たぶん執筆時点で最新と思います。

まずは、定番TMPGEnc Video Mastering Works5。これのCUDAを有効にし、

MPEG2-TS/30分29秒/1920x1080

を、

H.264/AVC(5Mbps)/サイズ固定(1920x1080)/インターレース保持

にCUDAエンコードして時間を計ってみましょう。どれだけ速度が上がるか楽しみです。

9800GT 31分10秒   GT640 30分41秒

・・・あれ? ほとんど早くなってない・・・? たった30秒の速度アップ、これじゃ誤差の範囲ですよ~。今度は同じTSをSDサイズ、720x480にリサイズするエンコードをやります。ビットレートは1Mbpsにダウン。

9800GT 20分11秒   GT640 18分59秒

うーん、少し差が広がりましたが、やはり大きな差とは言いがたいものです。
じゃぁ次はソフトを変えてみましょう。とはいえ、かつてCUDA対応ソフトの雄であったbadaboomは事実上終了してしまい、あまり選択肢は残っていません。これまた定番であるMediaCoderを使うのが鉄板でしょう。バージョンはx64の0.8.14.5270、条件はTMPGEncと同じ。

9800GT
1920x1080 20分19秒(Speed 1.64x) 720x480 13分57秒(2.37x)

GT640
1920x1080 14分29秒(Speed 2.26x) 720x480 13分18秒(2.46x)

1920x1080保持でのエンコードでようやく差がつきました。MediaCoderはビットレート指定ではなく、VideeoQuolity指定のエンコードも可能ですので、TMPGEnc MPEG Smart Renderer 4を使ってカット編集→MediaCoderでエンコードというパターンもありですから、ここで差かついただけでも良かったと言えます。

うーん、少なくとも9800GTに負けてなかったので、他の改良点(電源不要、小型など)を含めてGT640は買ってよかった製品ですが、肝心のCUDAエンコードの数字は思った以上に伸びないものでした。すでに頭打ちということでしょうか? それともCUDAの最適化をnVIDIAが進めていないのが原因でしょうか。CUDA目的でGT640を買おうという人は、それなりに注意が必要です。

990FXチップセットがPCI-Express3.0非対応な点が足を引っ張っていた可能性ももちろん無きにしも非ず、です。どっちにしても、メモリサイズはあまり関係ないみたいですね。

コメント (21)    この記事についてブログを書く
  • X
  • Facebookでシェアする
  • はてなブックマークに追加する
  • LINEでシェアする
« おめでと・・・ おめでとう ... | トップ | 日本では使われなかったオリ... »

21 コメント

コメント日が  古い順  |   新しい順
Unknown (Unknown)
2012-08-11 08:05:11
GT640 Kepler cuda速度で検索したら以下のブログが出てきて、詳しい解説がありました。

こまぷろぐ
http://plaza.rakuten.co.jp/comapple/diaryall/

ここの「GeForce GT 640は1スロット派nVidia信者を救うのか?」シリーズでCUDAのベンチ結果などもあります。

まぁ結果はkrmmk3さんが書かれた物と一緒なのですが・・・(^_^;)
ただメモリがDDR5版が出てきてメモリインターフェスが大きくなれば、また違うのかもしれませんが・・・・

ご参考になれば幸いです。

・・・・えっ自分は?
自分は・・・・今後PT3とHDDと電源と660Tiか650買おうかなぁ・・・・?(汗)
返信する
Unknown (megalith)
2012-08-11 08:13:12
すいません、上のコメント名前入れ忘れていました。
返信する
Unknown (Unknown)
2012-08-11 10:41:03
私も同じ目的でGT640を検討していたのですが微妙な結果ですね
今後に希望があるとしたらTMSR側のKepler最適化でしょうか
退役した9800GTGEの後継がなかなか現れてくれません
返信する
Unknown (tsgr7)
2012-08-11 10:49:10
GTC japan 2012で色々聞いてきましたが、大学で大規模計算してる方々はKeplerは今はFermiとあんまり変わらない性能か若干遅いぐらいと言っておりました。どうやらKepler世代が本気出すのはCUDA5.0から、らしいです。
あと経験的には、世代が変わってcompute capabilityが変わったら以前やっていたチューニングは無効というか、載せ替えただけではそれなりにしか速くならなくて、前より速い新しいプログラムの組み方が可能になるため劇的に速度向上、という具合です。
ですから、昔から使っている同じソフト同士で比較すると新世代は実力出し切れないという意味で不利になってしまいます。
返信する
Unknown (Beep)
2012-08-11 11:17:12
9800からだと音声も単体でHDMIに流せるのも違いかな?
GT640は温度の方はどうでしょうか?
nVIDIAは1スロでもファンありが選べるのが良いですね。
以前使ってた5450ファンレスは自身は大丈夫なのでしょうけど、周囲の温度特にHDDまで上がってしまうのは困りものです。
結局少ない選択肢からMSIのファンあり6450に買い直しました。
返信する
Unknown (emanon)
2012-08-11 14:02:03
 高精度映像ノイズ除去のGPU使用率はどうかとか
CUDAエンコード比較をデジカメ動画使用で 再生支援 画質比較いろいろ考え付くのですけどね バンディングの出具合比較とか… 進歩してないはずは無いと思うのですよね 

HDMI 2本で3D BD再生対応してるのでしょうね 
返信する
Unknown (Unknown)
2012-08-11 21:43:40
うちのPCは現在Core i7 970(OC4Ghz)とGTX570ですが、Tvmw5でソフトエンコすると熱が酷い事に・・・
返信する
Unknown (○りすがりの暇人)
2012-08-11 21:45:06
久々にコメントを書こうとしたら以前のHNが禁止ワードに…?
返信する
Unknown (krmmk3)
2012-08-11 22:32:38
>megalithさん
リンク先、見ました。ずいぶん細かく調べてありましたね。TMPGだとやっぱり差が出てませんね。足引っ張ってるのはメモリでしょうか。

>2012-08-11 10:41:03さん
一応GT640は9800GTGEの後継と言っていい仕様になっていると思うんですが、CUDAが個人向けとしては思ったほど使われていないこともあってあまり最適化が進んでいないのが問題ですね。

>tsgr7さん
むしろ遅いこともあるんですか。ヘタするとCUDAによる計算はもう頭打ちで、次はOPEN CL期待ってことになるんでしょうか。
旧世代のソフトが新アーキテクチャに対応しきれないというのはありそうな話ですね。でも、使い慣れているというのはソフトを使うのに重要な要素なんですよねぇ。

>Beepさん
640挿したら急に音が出なくなってビックリしました。もちろん640+ディスプレイへの方に規定の音声が移っていたのが原因でしたが、あれはあせります。
温度の方は測っていませんが、ファンの音の方はそれほど気にならない感じです。RADEONだと、1スロでよさそうなのは7750ですね、今は。

>emanonさん
なかなか使ってくれないんですよ。最近のCPUだとフィルターくらいじゃCUDAより速いらしくて。
どっちかというと、モバイル向けのエンコードのほうを向いて設計しているのかな? という気がしてます。QSVと違ってリサイズに強いですから。
3D BDくらいは当たり前のように対応しているようです。USBの3Dディスプレイじゃダメなんですが(笑)

>2012-08-11 21:43:40さん
i7 970は相当なものでしょうね。FX8120もかなりなものです。メーターがジリジリ上がっていくのはある意味楽しいですけど(笑)。

>○りすがりの暇人さん
すいません、「の暇人」の前の単語を使い、「どうせ二度と来ない」を前提にした高飛車なコメントが何度かありましたので、NGワードにしてしまいました。ブログ管理人としては使ってほしくない単語でもありますし。
返信する
Unknown (WRX)
2012-08-11 22:56:28
私はゲーム等するのでほぼハイエンドに近いような構成ですが。
ゲームは出来ればいいという理由で9600GTGEからGT460にしてしまいまして。
2スロット選挙してPCI-e1個潰してしまいました…
やっぱりケースの中がスッキリするのとスロットが多く使えるは重要だと思うのです…
6ch同時録画もしたいですし(笑)
返信する

コメントを投稿

意味なしレビュー」カテゴリの最新記事