引き続き購入したIntel第11世代CoreCPU、Core i7 11700(以下11700と表記)を見てみます。
組立てが終わればまず性能チェック、CPUの性能チェックと言えば当ブログでは須らく動画エンコードであるべし、ということでワンパターンの約49分で1440x1080のMPEG2-TSファイルをx264を使ったH.264/AVCへの変換速度とx265を使ったH.265/HEVCへの速度を調べてみます。以前なら主なエンコードソフトは、わたし愛用のMediaCoderをメインとして使い、それ以外を補助のデータ用として使う、というのが筋だったんですが、前回の調査でMediaCoderがx265使用時に8コアを使ってくれない不具合が発生し、かつそれが直っていないようなので、今回はHandBrakeを全面的に使用し、かつ他のソフトの並列をやめ、代わりにPreset・速度設定を変えたデータを掲載します。Placiboはちょっと省略させていただき、Ultra FastからVery Slowまで、ビットレート1Pass4000Kbpsで、エンコード終了までにかかった時間をlogをもとに計測しました。なんでもPresetが低速モードほどマルチコアの性能差が出、高速だとシングルコアの性能が出るとかいう話がありましたので。比較対象としてはAMDのAPU、Ryzen 7 PRO 4750G(以下4750G)を搭載したPCを使います。CPUコアはすでに旧世代となったZen2ですが実用上は問題なく、かつGPU内蔵型としては現状AMDとしては最高性能であることに変わりはなく、同じく内蔵GPUを使って動作させる11700とは実際販売価格も近いので競合関係にありますので、比較用として良いものと思われます。
両者の機材はこんな感じ
Intel機
CPU:Core i7 11700
メモリ:DDR4-3200 8GBx2(Gear1にBIOSで変更)
CPUクーラー:虎徹 MarkII
マザー:H570 Phantom Gaming 4
OS:Windows10 Pro
AMD機
APU:Ryzen7 PRO 4750G
メモリ:DDR4-3200 8GBx2
CPUクーラー:Ryzen7 1700付属のリテールクーラー
マザー:ROG STRIX B550-F GAMING
OS:Windows10
それでは測定したデータを見てみましょう。なお、特にマザーボードやチップセットによってCPUは全く違う挙動を見せることが稀にあるため、全く同じ結果が他の環境でも出る、とは限りません。過去にA10-7800が異なるマザー・チップセットで速度の傾向が違うという体験をしたことがあります。ただ、ウチではテストのためだけに複数の環境を用意できるほど経済的余裕がないため、結論を出す際には今回の挙動を「一般的な動作」とみなして行います。ご了承ください。
ビットレート設定は1Passで4000Kbps、フレームレートのみSameおよびConstantに変更し、あとはデフォルトのままです。
H264/AVC
Very Slow
11700:57分36秒
4750G:45分37秒
Slower
11700:41分31秒
4750G:32分53秒
Slow
11700:29分22秒
4750G:22分2秒
Medium
11700:21分31秒
4750G:17分3秒
Fast
11700:18分35秒
4750G:14分52秒
Faster
11700:15分39秒
4750G:13分7秒
Veryfast
11700:12分35秒
4750G:10分38秒
Superfast
11700:9分51秒
4750G:8分33秒
Ultrafast
11700:9分17秒
4750G:7分36秒
いや、予想外の結果です。まさかここまで11700が4750Gに歯が立たないとは思ってませんでした。ならば次はx265を使ったテストならどうでしょうか。Core i7 8700の時は、なんだかんだ言ってもまだAVX2に関してはIntelに一日の長があり、同じ6コア12スレッドのRyzen 5 3600と比べてもx265では若干有利だったので、こちらはどうでしょう。
なお、x265は重すぎるので"slow"までのPresetとさせていただきました。
H.265;HEVC
Slow
11700:1時間51分45秒
4750G:1時間33分0秒
medium
11700:49分33秒
4750G:43分35秒
Fast
11700:33分56秒
4750G:29分39秒
Faster
11700:30分22秒
4750G:26分39秒
Veryfast
11700:30分15秒
4750G:26分25秒
Superfast
11700:21分43秒
4750G:17分31秒
Ultrafast
11700:17分43秒
4750G:14分36秒
・・・AVX2の効率、悪くなってません? そうかどうかは後で調べるとして、この遅さの一因にあるのがクロックです。11700は、計測ソフトCore Tempによるとアイドル時の温度が各コア20~25度、クロック800Mhzくらいです。エンコードソフトを走らせるとこのクロックが一気に4.4GHzまで上昇、見るからに速いfpsを稼ぎますが、10~20秒後くらいにコアの温度が70度に達すると急に失速、そのあとはほぼ3~3.2GHz、温度は40~45度で推移。ここからほとんどクロックも温度も変わることはなく終了まで続きます。一方、4750Gは最初から最後までほとんど4.2GHzおよび温度70度強で動作します。このクロック数の差がエンコード速度の差に出ているものと思われます。正直IntelCPUはCPUに対して過保護です。CPUクーラーに虎徹 MarkIIを使っていることもありますが、正直発熱にはまだ余裕があるはずです。なので、当ブログのポリシーには反しますがちょっとだけ活入れを行います。
今回のマザーの場合、UEFIのOCツール項目の中に"Dual Tau Boost"というものがあります。これを有効にした場合、cTDP機能を使ってTDPを変更できるのです。AMDAPUではcTDPは下に下げるもので省電力化のためにあった機能ですが、IntelCPUではむしろ上げるために使うもののようです。これをデフォルトの65Wから80Wまで上げてみました。OverClockならぬOverTDPで過保護すぎる熱管理をちょっぴり解放してみよう、というわけです。これがCPUにどの程度過度な負担になるかは分かりませんが、少なくとも保証外動作にはなるでしょう。ただ、それでもリミッター解除のPL2にして224とかにする(PL2モードはそれがデフォルト、怖)よりはマシかと。x264のVeryslowとx265のslowのみ図って比べてみます。
H.264/AVC Veryslow
11700(80):51分39秒
11700(65):57分36秒
4750G:45分37秒
H.264/HEVC Slow
11700(80):1時間42分7秒
11700(65):1時間51分45秒
4750G:1時間33分0秒
TDPを80Wまで上げるとクロックが増し、4.4GHzのブースト時間が終わっても3.5GHz以上のクロック数を保ち続けます。ただし、CPU温度はアイドル時でも25度程度、エンコード時50度前後まで上がりますが、まだ余裕がある印象です。デフォルト時に比べればだいぶ伸びましたが、それでも4750Gにおよびません。もはやIntelCPUのAVX2効果が衰えているのでは? と疑いたくなります。と、言うことで、エンコードソフトをPEGASYSのTMPGEnc.Vider Mastering Works7に変更し、AVX2およびAVX512の有効無効を切り替えて計測してみることにしましょう。UEFIでもAVX2は無効にできるんですが、そっちだとウチのマザーではAVX2とAVX512がセットになって無効化されてしまうので、AVX2を残したままAVX512だけ無効にすることが可能なTMPGEncにしています(ちなみにAVX512だけ残してAVX2のみ無効はできません、やっても両方無効になります)。フォーマットはx265を使ったH.265/HEVCへのものにしますが、エンコードソフトが違うためにHandBrakeの結果と直接の比較はできないし、過去のデータと比較しやすいMedium相当の"標準"にしています。ビットレートは1PASS・CBR4Mbpsで、TDPは80W。
x265(11700 80W)
全有効:48分32秒
AVX512無効:46分29秒
AVX2無効:59分41秒
参考用の過去データ
4750G:41分08秒
Ryzen5 3600:48分29秒
Core i7 8700 :47分22秒
さすがに初代RyzenのようにAVX2を切ったほうが速い、とまではいきませんでしたが、AVX512は切った方が速くなるデータが取れてしまいました。これは過去の8700で同じテストを行ったことがないので断言はできませんが、これまではAVX512はそれほど効果が高いわけではないけど速くなる、とされていたように思います。そうでなくなったということは、明らかにAVX2、少なくともAVX512担当部分の能力は落ちています。しかも、TDP80Wと盛っているにも関わらず通常ソフトと同じ条件ではAVX2のやや苦手な3600と同程度・同じIntelですが3世代も前の8700には負け、AVX512が切れる特殊なソフトを使ってやっと上回るというのはあまりに信じがたいデータです。ソフトのアップデートは行われているのでそれが響いた可能性ももちろんありますが、それでも3600や8700って6コア12スレッド、しかもリテールクーラーですからね。8コア16スレッドの最新コアでクーラーを定評のあるものに変えたものがやっと互角にしかならないというのは、IPC19%アップどころか落ちているとしか判断のしようがありません。
もう少し盛ってみましょう。TDPを95Wまで上げてみます。ここまで上げるとアイドル時でも30度前後になり、負荷時には50度を常時超えるくらいの温度になります。計測はまたHandBrakeに戻してx264:VerySlowとx265:Slowのみ。
x264:VerySlow
65W:57分36秒
80W:51分39秒
95W:50分29分
x265:Slow
65W:1時間51分45秒
80W:1時間42分7秒
95W:1時間40分7秒
なんか伸びが鈍化してしまいました。計測温度がTDPに応じて順調に上がっているわりにクロックはあまり変化していないので、PL1ではこの辺が頭打ちなんでしょう。リミットを解除してPL2動作させればもう少し上がるかも知れませんが、それは「性能を図る」ことを第一とする当ブログのやり方とは違いますし、マザーやチップセットもミドルクラスかそれ以下向けを使用しているのでやめておきます。
最後にGPUテスト。GPUは今世代から全く新しいアーキテクチャに変更されたディープラーニング向けのXeが搭載されています。モバイル向けは同じくモバイル向けのRyzenの内蔵GPUを上回る、とIntelの発表や記事でのテキストでは書かれています(具体的な検証結果を見たことはありませんが)。ただ、デスクトップ向けはダイのスペースが足りないため、Irisのブランドが付いているモバイル向けほどの性能はないようです。その計算能力を見たかったのですが、ドライバの関係かはたまた全く対応していないのか、検証ソフトのGPUPIではOPEN CLの計算対象に今回の内蔵GPUが指定できないのです。一応ドライバはIntelのWEBサイトから直接落としてきたのでこの時点で最新と思われますが、使えないのは残念。しょうがないのでとりあえずゲーム向け3D性能のベンチマークソフト結果だけでも見ておきますか。比較対象はもちろん4750Gの内蔵。ベンチマークソフトは、凝った調査をする気はないのでとりあえずドラゴンクエストベンチマークとFFXVベンチマークの二つ。TDP65Wと80Wの両方見てみました。
ドラクエ(最高品質:1920x1080:フルスクリーン)
11700(60W):5084
11700(80W):5188
4750G:10118
80Wにしても伸びは少ないですね。多分GPU側のクロックは上がっていないのでしょう。ドラクエは4750Gに対して半分のスコアしか出ておらず、これはまぁ仕方ないでしょう。それだけにFFXVのベンチスコアは納得いきません。どっちにしても重いのですが、何度やっても11700の方が4750Gより少しいいのです。以前からFF系ベンチはGeForceに最適化されていてRADEONではスコアが伸びない、と言われてきました。ひょっとしたらそれは半分だけ正解で、RADEONだとスコアが出ないように作られているのでは? と疑いたくなる結果です。これ以上はやめておきますが。(申し訳ありません。どうやら指しておいた別のRADEONが悪さして高速化していたようです。お詫び申し上げます)
以上、新コアを使ったIntelの新CPUの性能を、Core i7 11700を使ってみてみました。CPUやマザー・チップセットの個性のせいでこうなっているのでは? を願ってしまうような性能、としか言いようがありません。なにせ比較対象の4750GはZen2でしかなく、AMDにはこの上にZen3が控えているのですから。少なくともZen3がZen2に単純性能で負けているということはないでしょうから、今回のRocket Lake-SがZen3に比較できる余地はない、という結果は見えています。何度も言いますが組み合わせによっては別の結果が出ることはあり得ます。それでも、わたしが見る限りRocket Lake-Sの性能はお勧めできないものでした。素直に第10世代を買った方がコストパフォーマンスの面では上だと思います。
全く見るところがない、というわけではないのですよ。実はMediaCoderを使ったx264計測では、シングルコアの性能が強く出るとされている高速Presetでは11700が65Wでも4750Gを上回る結果が出ているのです。
Fast
11700:694.9sec
4750G:685.6sec
Faster
11700:556.7sec
4750G:575.2sec
このFastとFasterを境に逆転するのです(このクラスのCPUを使ってx264のFaster以上のPresetを常用する人はほとんどいないと思いますが)。クロックは変わっていないので、このあたりからはIntel新CPUの「IPC19%アップ」もまんざら嘘ではないな、という気がします。このデータを正式採用しなかったのは、前の検証からMediaCoderはx265時に8コアが生かされないことがあるため、検証用としては不十分、HandBrakeで統一したほうが良い、と判断したからです。あれを見る限りIPCの向上はあくまで部分的、シングルコアの性能がより強く出ている実行の場合はそれが出やすいですが、マルチコアの性能が強めだったり、ゲームによってはそれほど使われないだろうAVX2や512の影響が強く出る場合なら、ヘタすれば6コア12スレッドの8700並かそれ以下になってしまうという結果にさえ結びつきます。
どうもとりあえずゲームのスコアさえよければいいCPUだと思ってもらえる、と考えてそっちに全振りした感じがします。あるいはIPC向上を性能のアップではなく省電力に割り振ったか、でしょう。わたしは自分向けのデータが欲しかっただけなので十分満足していますが、第8世代以降のIntelCPUを使っている人は買い替える必要はないかと。それ以前のもので買い替えなければならない人や新規に買う人でも第10世代で十分・・・あるいは第12世代まで待った方がいいかも知れません。ただ、今後半導体が全面的に不足する、という予想があちこちから出ていて、今後大幅な値上げや供給不足になる可能性が低くないのです。その場合、一番安定供給が期待できるのはIntel自社生産の第11世代、ってことになるかも知れません。そこが一番の魅力、と言ってしまうと怒られるでしょうか。
供給は安定するかも知れませんが、性能はなんか不安定にも見えます。コメント欄で「性能のブレが大きい」と書きましたが、時々信じられないくらい性能が低くなることがありました。あまりに不自然な時~例えばx264のVerySlowで1時間20分もかかった時など~は他と比べて納得のいくデータになる方が多くなるまで、アイドリングの時間を十二分にとって何度もやりなおしてます。なので見た目の数倍手間がかかってます。ひょっとしたらCoreTempの計測より実際のCPU温度はずっと高いのかも知れません。
ここ最近のIntelの迷走ぶりはかつてのAMDのFXを思い出す、と言う人もいるかも知れませんが、FXはベンチマークや商業サイトの評価はともかく肝心かなめの動画エンコードが当時としては速かった、という利点がありましたのであれはあれで薦められる良いCPUでした。が、Intel第11世代に関して言えば、少なくともわたしの環境わたしのやり方ではそれがありません。ただ、GPUの再生画質などは世代を重ねるごとに上昇していますし、動画エンコードはQSVがあれば十分、という人も少なくないでしょう。特にx265は重いので、QSVでH.265/HEVCを使った方が結局実用的だったりしますし。そうした再生・エンコードの画質面のバランスで言えば、Fluid Motion Videoのような強力な再生能力こそないものの、Core i7 11700は割といい選択肢と言えます。もっとも、それならCPUコアは減るけど安くてGPUが同じCore i5 11500の方がいいんじゃない?と言われたら言い返す言葉がありませんが。そもそも最近のIntelなら一番コスパが良くてお買い得なのはCore i5なんですよねぇ。
気になるのは、Core i9 11900は11700と比べてどの程度性能が違うのか、という点。若干クロックは上がっていますがTDP65Wで8コア16スレッドに変わりはなく、それでいで値段がかなり高いので、本当に値段相応の性能差があるのか興味があります。ただ、商業サイトも実質プロなYoutuberもTDPの高い"K"付だけを比較対象にして同じやり方で同じことを言うばかり。せっかくメーカーから貸し出しをしてもらえたり、経費で購入できたりするんですから、個性のある検証、一部の人のは刺さるようなデータも提供してもらいたいものです。
最近はもうエンコなどパフォーマンスではAMD、ほったらかしPCは省エネなIntelという感じで使ってます。
今回のRocketはやはり14nm++の限界を感じますね
i9-9900が出たあたりからSkylakeアーキと14nm++の組み合わせだとTDP 65Wは6コアが限界で性能がほぼ上がらない
8コアはTDP 95W以上ないと性能が発揮できない感じでしたが
Rocketでは、11400F(6コア)の興味深いデータの動画があったりしました。
設定で定格のオールコア4.2GHzで使えるようにするとパッケージパワーが130W使うようです。
低電圧化してようやく100Wを切る程度。
ということは11700(8コア)の性能を美味しく頂こうとするとTDP 170Wぐらいは必要で
低電圧化してもTDP 130W設定ぐらいは必要な感じだと思います。
Zen3という存在を無視して、ワッパ良く使おうと思ってもRocketのアーキと14nm++では
6コアでTDP 95W程度、8コアでTDP 125W必要な感じかと(6コアで8コア並みの性能があることを踏まえ)
まあ、クロックが伸びないならGPU側にそちらが得意なCPUでも良いのではないかなと思いますけどね 環境としては整ってきているはずですしメモリーが共用できるのはGPUだけとは限らないと思うので
自腹なんで用意できる環境に限界があるんですけどね。
Intelはアイドル時のクロックが低いのが利点ですから、録画サーバーにはいいかも知れないですね。ただ、今回スタンバイからの復帰だとクロックがなかなか下がらず、かつ動作が遅くなる現象も出ていますので、第11世代はまだ挙動があやしいです。
>2021-04-18 21:25:57さん
ベンチマークとかだとそこまで上げればそこそこ数値は出るみたいですが、動画エンコードだと、そもそもそれに適した部分を縮小している手ごたえだったので、効果は薄いように思います。
>emanonさん
まさかIntelともあろうものが、世代交代する際に性能を落としてくるとは思いませんでした。
QSVがそうした発想なんでしょう、動画エンコードはそっちでやればCPUは必要ないだろうと。ますますi7の意味がない・・・。