このところエンコードをするよりMPEG2-TSのまま保管しておいて、Fluid Motion Videoが使いたい動画だけ24fps化のためにエンコードすればいいじゃないか、と考えるようになって前よりエンコードを熱心にやらなくなっているkrmmk3です。まぁ録画のしすぎでエンコードするのが追い付かなくなっているというのも大きな理由にはありますが(^^;)
MPEG2-TSに対応し、カットなどの編集処理からエンコードまで一つのソフトで処理できて人気なソフトと言えばPEGASYSのTMPGEnc Video Mastering Works 6(TVMW6)。最新版の6は64ビット専用になり、H.265にも対応しましたが前バージョン5との差は少なく、古いもので十分と考えている人も多いかと思います。
そのTVMW6が、本日過去のPEGASYSソフトを通じて初めてAMDのエンコーダーであるVCEに対応しました。なお、同時にデコードにも対応していますが、これはカット編集専用ソフトのTMPGEnc MPEG Smart Renderer 5に続いて二例目となります。なお、デコードに対応したといってもUVDの画質補正機能が使えるという感じではなく、あくまで編集作業を快適にするためのもののようです。
さて、VCEエンコードをさっそく試してみましょう。と、言っても画質面ではまぁそれなり・・・の域は出ないでしょうから速度を中心に見てみます。機種としては
A10-7850K/内蔵GPU/DDR3-2133x2 8GB/Windows8.1
FX8370/RADEON R7 250XE/DDR3-166x2 8GB/Windows8.1
に交代でTVMW6をインストール・アンインストールを繰り返しつつ計測してみます。比較対象として
Core i7 4770/内蔵GPU/DDR3-1600x2 8GB/Windows10
の機種も用意しました。これはあくまで参考用としてください。
エンコード用素材としては昔から使っている1440x1080、48分のMPEG2-TSファイルを使用し、そのままの解像度で出力・・・をしたかったのですがTVMW6のVCEでは画面の出力1:1しかできず、1440x1080で16:9の出力という我々としては普通に使っているモードでは出力できないのです。そこでやむなく1280x720にリサイズしてみました。出力モードは「CBR」「VBR」の他、固定量子モードが選べますが、今回はVBRの4Mbps出力を使います。速度の調整はできません。比較用として同じソフトのx264出力をFX8370、QSVをCore i7 4770でも行っておきます。速度は「標準」です。
A10-7850K(VCE) 20分57秒
FX8370+250XE(VCE) 19分30秒
Core i7 4770(QSV) 18分33秒
Fx8370(x264) 38分30秒
以前SandyとRichlandで比べたとき、速度面ではQSVが上、ということは確認できていました。それにしては検討していると言っていい速度なのではないでしょうか。3者の差は大きくありません。FX8370を使ったx264の標準と比べても半分の時間で終わっていますし、悪くない印象です。
もちろんうちは某商業サイトではないのですから、リサイズエンコードだけですべてを語るようなことはしません。リサイズなしのエンコードテストも同時に行います。こちらは1920x1080の24分30秒のMPEG2-TSという、やはりよくありそうなものをリサイズせず、QSVの"標準"と比較します。
A10-7850K(VCE) 12分06秒
FX8370+250XE(VCE) 11分53秒
Core i7 4770(QSV) 9分11秒
リサイズなしだと事前の予想通り、IntelのQSVの力を見せつけられました。面白いのはA10-7850KとFX8370+250XEの差がさらに縮まり、ほとんどないに近くなっていることです。リサイズなしの場合、CPU部分の能力の差はあまり発揮されず、内蔵エンコーダーの能力がそのまま出ているようですね。250XEはたしかKaveri内蔵GPUよりワンランク上の能力を持っているはずですが、VCEの差はほとんどないみたいですね。
sar・parに相当する能力がないこともあってあまり使い勝手がいいとは言えないTVMW6のVCEですが、対応したというだけで画期的と言っていいでしょう。それにQSVと違ってどちらかと言えばゲーム動画の記録配信用前にとAMDは考えているようですし。前にAMDで話を聞いたときは「VCEよりOPEN CLでの対応をお願いしている」と言っていたのですが、それが実現しなかったのは残念。でもまぁしないよりはいいかと。高速なCPUと外部RADEONを使っているような人がそのためにわざわざ買うようなものではないですが、APU派の人は購入を検討してもいいかも知れません。TVMW6自体は64bitソフトではありますが、Avisynthとの相性も悪くない印象ですし、まずは試してみてもいいかと。
MPEG2-TSに対応し、カットなどの編集処理からエンコードまで一つのソフトで処理できて人気なソフトと言えばPEGASYSのTMPGEnc Video Mastering Works 6(TVMW6)。最新版の6は64ビット専用になり、H.265にも対応しましたが前バージョン5との差は少なく、古いもので十分と考えている人も多いかと思います。
そのTVMW6が、本日過去のPEGASYSソフトを通じて初めてAMDのエンコーダーであるVCEに対応しました。なお、同時にデコードにも対応していますが、これはカット編集専用ソフトのTMPGEnc MPEG Smart Renderer 5に続いて二例目となります。なお、デコードに対応したといってもUVDの画質補正機能が使えるという感じではなく、あくまで編集作業を快適にするためのもののようです。
さて、VCEエンコードをさっそく試してみましょう。と、言っても画質面ではまぁそれなり・・・の域は出ないでしょうから速度を中心に見てみます。機種としては
A10-7850K/内蔵GPU/DDR3-2133x2 8GB/Windows8.1
FX8370/RADEON R7 250XE/DDR3-166x2 8GB/Windows8.1
に交代でTVMW6をインストール・アンインストールを繰り返しつつ計測してみます。比較対象として
Core i7 4770/内蔵GPU/DDR3-1600x2 8GB/Windows10
の機種も用意しました。これはあくまで参考用としてください。
エンコード用素材としては昔から使っている1440x1080、48分のMPEG2-TSファイルを使用し、そのままの解像度で出力・・・をしたかったのですがTVMW6のVCEでは画面の出力1:1しかできず、1440x1080で16:9の出力という我々としては普通に使っているモードでは出力できないのです。そこでやむなく1280x720にリサイズしてみました。出力モードは「CBR」「VBR」の他、固定量子モードが選べますが、今回はVBRの4Mbps出力を使います。速度の調整はできません。比較用として同じソフトのx264出力をFX8370、QSVをCore i7 4770でも行っておきます。速度は「標準」です。
A10-7850K(VCE) 20分57秒
FX8370+250XE(VCE) 19分30秒
Core i7 4770(QSV) 18分33秒
Fx8370(x264) 38分30秒
以前SandyとRichlandで比べたとき、速度面ではQSVが上、ということは確認できていました。それにしては検討していると言っていい速度なのではないでしょうか。3者の差は大きくありません。FX8370を使ったx264の標準と比べても半分の時間で終わっていますし、悪くない印象です。
もちろんうちは某商業サイトではないのですから、リサイズエンコードだけですべてを語るようなことはしません。リサイズなしのエンコードテストも同時に行います。こちらは1920x1080の24分30秒のMPEG2-TSという、やはりよくありそうなものをリサイズせず、QSVの"標準"と比較します。
A10-7850K(VCE) 12分06秒
FX8370+250XE(VCE) 11分53秒
Core i7 4770(QSV) 9分11秒
リサイズなしだと事前の予想通り、IntelのQSVの力を見せつけられました。面白いのはA10-7850KとFX8370+250XEの差がさらに縮まり、ほとんどないに近くなっていることです。リサイズなしの場合、CPU部分の能力の差はあまり発揮されず、内蔵エンコーダーの能力がそのまま出ているようですね。250XEはたしかKaveri内蔵GPUよりワンランク上の能力を持っているはずですが、VCEの差はほとんどないみたいですね。
sar・parに相当する能力がないこともあってあまり使い勝手がいいとは言えないTVMW6のVCEですが、対応したというだけで画期的と言っていいでしょう。それにQSVと違ってどちらかと言えばゲーム動画の記録配信用前にとAMDは考えているようですし。前にAMDで話を聞いたときは「VCEよりOPEN CLでの対応をお願いしている」と言っていたのですが、それが実現しなかったのは残念。でもまぁしないよりはいいかと。高速なCPUと外部RADEONを使っているような人がそのためにわざわざ買うようなものではないですが、APU派の人は購入を検討してもいいかも知れません。TVMW6自体は64bitソフトではありますが、Avisynthとの相性も悪くない印象ですし、まずは試してみてもいいかと。
OpenCLが、普及しない原因のひとつですが、
OpenCLは、CUDAに比べて、面倒なんですよ。
・ソースコードで、2~3倍の記述が必要。
・それにデバッグも大変。
・パフォーマンスは、CUDAとOpenCLで基本的に同じ。
現場レベルで、「なら、CUDAでいいや。」というところでしょうね。
動画編集ソフトで一部OpenCLがサポートされてますが、まだまだですね。
で試してみましたが、インターレース解除の方法をアニメ補間系や逆プルダウン系にするとパフォーマンスが極端に落ちますね。
デフォルトの適応補完で10分程度のエンコードがいきなり40分近くになったりします。
ちなみに適応補間(高精度)でも40分程度。
アニメ補間や逆プルダウンってこんなに重いフィルタでしたっけ?
早速手持ちのRADEON R9 380にてエンコードを試してみました。
参考程度にどうぞ。肝心の画質はx264と比較するとさすがに酷ですが
誰かに渡したい動画を手早く作るといった用途では結構役に立ちそうな感じです。
私の環境ではIntelのQSVを使うとシステムがクラッシュする、エンコードが途中で止まったりと
まったく使い物にならなかったのでAMD Media SDKは非常に安定しているので安心して使えそうです。
CUDAでは実装当初からフィルタ処理にも適用できていたので
RADEONでのOpenCLでの処理にも対応できるよになればいいなと期待しています。
CPU:Intel Core i7 4790K
RAM:DDR3 1600 8GBx2 16GB
GPU:SAPPHIRE R9 380 2G GDDR5 PCI-E DI/DD/H/DP DUAL-X [PCIExp 2GB]
M/B:ASUS H97M-E
OS:Windows10 Pro 64bit
SSD(OS):Samsung SSD 950 Pro 256GB
HDD:WD30EZRX (WDGreen 3TB)
エンコード素材:サンテレビ(1920x1080 MPEG2) 某アニメ 4分00秒
AMD Media SDK インタレース解除方法:適応補間
1920x1080 29.97fps VBR(平均ビットレート)VBV無し 6Mbps
所要時間 1分14秒 ファイルサイズ:176MB(184,592,520byte)
x264(標準速度) インタレース解除方法:適応補間
1920x1080 29.97fps VBR(平均ビットレート) 6Mbps 最大8Mbps
所要時間 3分50秒 ファイルサイズ:176MB(184,580,920byte)
AMD Media SDK 24fps化(動き優先) インタレース解除方法:適応補間(高精度)
1920x1080 23.976fps VBR(平均ビットレート)VBV無し 6Mbps
所要時間 2分53秒 ファイルサイズ:176MB(184,641,412byte)
x264(標準速度) 24fps化(動き優先) インタレース解除方法:適応補間(高精度)
1920x1080 23.976fps VBR(平均ビットレート) 6Mbps 最大8Mbps
所要時間 4分17秒 ファイルサイズ:175MB(184,420,378byte)
AMD Media SDK 処理速度(x264エンコード比)
3.1倍(フィルタなし時) 1.48倍(フィルタあり時)
4Kのテストはやらないのかなと? ネットで配布している20秒のソースがどの位で処理できるかだけでもやっておくとよいかなと
CPUでやるとTMPGEnc Video Mastering Works6が最低限無ければ話にならないのが良く分かる結果が出るかと
メモリーが16Gは欲しくなり32Gへと夢は膨らむ 最高の沼みたいですよw
AMDではCUDAをOPEN CLへ変換するコンバーターも用意しているようですが、自動変換のパフォーマンスが最適なわけがないですから、結局手直しの手間が・・・と考えるとすでに環境が確立しているCUDAからの移行が大手以外ではなかなか進まないのも仕方ないというところですか。ただ、Intelも明らかにAPU思想に近づきつつあることから、今年あたりから改善はみられると思っています。
>2016-02-02 18:07:05さん
フィルタが重いというよりCPU処理とのデータのやり取りが頻繁に繰り返されるほどエンコーダーとのデータのやり取りが無駄な処理を生んで遅くなる、ということだと思います。特に24fps化はその傾向がありますね。HSAはその無駄を埋める手段の一つですが、TMPGはOPEN CL化されていないようで対応していないらしく、APUでも状況は変わらないです、残念。それでもQSVよりパフォーマンスの低下は少ないみたいですが。
>makitaさん
やっぱり24fps化すると速度がだいぶ落ちますね。ただ動画の時間が長いものだと少しの時間短縮でもありがたいですから。AMD環境でもそれが可能になるのは素直に嬉しいです。
>emanonさん
4KだとたいていH.265で上がっていたりしますので、エンコードする意味はないかなぁと思いまして。
メモリはそろそろ8GBだと物足りなくなってきましたね。ガボガボ入れたい。
APU名 CPU GPU
A10-7850K 3.7GHz 720MHz
A10-7870K 3.9GHz 867MHz
A10-7890K 4.1GHz 867MHz 新クーラー
GPUクロック据え置きで、CINEBENCHあたりはほとんど変わらないでしょうね。
クロックが上昇した以外は変わらないと思います。あくまで新クーラーを同梱させたことが最大の特徴ではないかと。mini-ITXマザーに合わないと必ず企業サイトで語られる新クーラーですが、逆に小型クーラーと合わせること前提に価格の下がった旧型がねらい目だと思います。