動機
第9世代ゲームコンソールが登場したのは2020年後半のことである。これは3年=36ヶ月以上というムーアの法則でいえば2回分相当で、つまり集積回路の集積度は2倍×2回=4倍を達成できる計算になる。
そこで、本稿のテーマは廉価ゲーミングコンソール(Xbox Series S)相当の性能を同価格帯のPCで代替できないか検討することとなる。
2020年時点のPCでもフルスペックのゲーミングコンソールと同等以上の性能を達成することは可能だったが2倍程度の費用が必要だった。つまり本稿の検証内容とは、3年間を経て廉価PCの性能が底上げされて廉価ゲーミングコンソール相当の性能を同価格帯のPCで代替できないか?というものである。
結論から言えば、机上のスペックに基づくと2024年現在どころか現在の路線のCPU/GPUでは3年先まで達成できそうにない。ただし、ユーザー体験というのは机上のスペックの話だけではないので、その辺りも併せて考えてみたい。
尚、本稿では可能な限り高いコストパフォーマンスを達成するためAmazon・AliExpressなどのオンラインショップで販売されているAMD APU搭載PCをベースに検討している。
スペックの比較検証
以下は比較的手頃なAMD製APUと、ローエンドのゲームコンソールとを比較したものである。一見して判るのは、RDNA2以降のAPUではスペックシート上ではXbox Series S相当の理論上の演算性能(GFLOPS)を達成可能だが、その一方でメモリー帯域が低くBytes/FLOPSは悪化し続けている。
PC 7840HS | PC 7640HS | PC 7735HS/6800H | PC 5700U | Steam Deck | Xbox Series S | |||||
Price range | ? | > EUR 500 | ? | ? | ? | > EUR 350 | > EUR 200 | EUR 450 | EUR 250 | |
SoC codename | Phoenix | Rembrandt | Lucienne | Aerith | Scarlett | |||||
CPU | uArch | Zen 4 | Zen 3+ | Zen 2 | ||||||
core# | 8 | 6 | 8 | 8 | 4 | 8 | ||||
Base freq | 3800 | 4300 | 3200 | 1800 | 2400 | |||||
Turbo freq | 5100 | 5000 | 4750 | 4300 | 3500 | 3400 | ||||
GPU | uArch | RDNA3 780M | RDNA3 760M | RDNA2 680M | GCN5 Vega8 | RDNA2 | RDNA2 | |||
CU | 12 CU 768 SP | 8 CU 512 SP | 12 CU 768 SP | 8 CU 512 SP | 8 CU 512 SP | 20 CU 1280 SP | ||||
Base freq | 800 | 800 | 400 | 300 | 1000 | |||||
Turbo freq | 2700 | 2600 | 2200 | 1900 | 1600 | 1565 | ||||
GFLOPS (FP32) | 8294 | 5324 | 3380 | 1900 | 1600 | 4000 | ||||
Memory | Type | LPDDR5X-7500 | DDR5-5600 | LPDDR5X-7500 | DDR5-5600 | LPDDR5-6400 | DDR5-4800 | DDR4-3200 | LPDDR5 | GDDR6 |
Config | x32 4ch | x64 2ch | x32 4ch | x64 2ch | x32 4ch | x64 2ch | x64 2ch | x32 4ch | x256 | |
Capacity | N/A | N/A | N/A | N/A | 16 GB | 10 GB | ||||
Bandwidth | 120.0 GB/s | 89.6 GB/s | 120.0 GB/s | 89.6 GB/s | 102.4 GB/s | 76.8 GB/s | 51.2 GB/s | 88 GB/s | 225 GB/s | |
B/F | 0.0145 | 0.0108 | 0.0225 | 0.0168 | 0.0303 | 0.0227 | 0.0269 | 0.0550 | 0.0563 |
あまり話題になることがないが、メモリーの性能とは大まかに「遅延」と「帯域」であり、膨大な数の座標データやテクスチャーなどを扱うGPU性能に関わるのは主に「帯域」の方である。
ゲーミングコンソールやPC用dGPUで高コストながら広帯域のGDDR系メモリー256~512 bit幅で接続されているのはこのためで、上の表でもゲーミングコンソールではBytes/FLOP(B/F)が0.05以上が確保されている。これに対し、汎用的なPC用メモリーを使うAPUではメモリー帯域により性能が制限される。
そもそも、Ryzen APUファミリーの場合、Zen世代~Zen3世代(2017~2022年)の5年間に渡ってGCN5系GPU最大8~11CUという構成で停滞してきたが、Zen3+世代"Rembrandt"~Zen4世代"Phoenix"/"Hawk Point"ではRDNA系GPUで理論上の演算性能は大幅に向上する一方でB/Fは大幅に悪化し続けている。DDR5/LPDDR5メモリーの採用によりDDR4/LPDDR4メモリー以上の帯域を確保できているが、AMD Ryzen APUファミリーのiGPUの性能向上がメモリー帯域の向上を上回っているためである。
以下の表の通り、過去のRyzen APUではBytes/FLOPSが概ね0.02付近で設定されてきたが、RDNA3 iGPU搭載の"Phoenix"世代APUから0.01程度に大幅に悪化している。
Family | Example | GPU uArch | GPU perf (GFLOPS) | DRAM Spec | DRAM Bandwidth (GB/sec) | B/F | |
---|---|---|---|---|---|---|---|
Ryzen 2000 | Desktop | Ryzen 2400G | GCN5 Vega 11 | 1760.0 | DDR4-2933 x 2ch | 46.93 | 0.0267 |
Mobile | Ryzen 2800H | 1830.4 | DDR4-2400 x 2ch | 38.40 | 0.0210 | ||
Ryzen 3000 | Desktop | Ryzen 3400G | GCN5 Vega 11 | 1971.2 | DDR4-2933 x 2ch | 46.93 | 0.0238 |
Mobile | Ryzen 3780U | 1971.2 | DDR4-2400 x 2ch | 38.40 | 0.0195 | ||
Ryzen 4000 | Desktop | Ryzen 4700G | GCN5 Vega 8 | 2150.4 | DDR4-3200 x 2ch | 51.20 | 0.0238 |
Mobile | Ryzen 4800H | 1792.0 | DDR4-3200 x 2ch | 51.20 | 0.0286 | ||
Ryzen 5000 | Desktop | Ryzen 5700G | GCN5 Vega 8 | 2048.0 | DDR4-3200 x 2ch | 51.20 | 0.0250 |
Mobile | Ryzen 5980HX | 2150.4 | DDR4-3200 x 2ch | 51.20 | 0.0238 | ||
Ryzen 6000 | Mobile | Ryzen 6980HX | RDNA2 680M | 3686.4 | DDR5-4800 x 2ch | 76.80 | 0.0208 |
Ryzen 7000 | Mobile | Ryzen 7940HS | RDNA3 780M | 8600.0 | DDR5-5600 x 2ch | 89.60 | 0.0104 |
Ryzen 8000 | Desktop | Ryzen 8700G | 8907.1 | DDR5-5200 x 2ch | 83.20 | 0.0093 |
ところで、調べていくとRDNA3がスペックシート上の性能と実際の性能とが乖離していることに気付かされる(この辺りの詳細な検証は別記事にする予定である)。
各メディアによる解説記事を見ると、RDNA3はRDNA2に比してCU内の演算ユニット数が倍増しており、同じCU数なら2倍の理論上の演算性能を発揮することになっている(参考:ASCII.jp・4Gamer)。このため、RDNA2世代のRadeon 680MとRDNA3世代のRadeon 780Mとでは同じ12 CUだが理論上の性能が2倍となっている。ところが、実性能では780Mと680Mとでは2倍も性能差は見られずGPUの動作速度向上とメモリー帯域の向上で説明がつく程度に留まっている。
以下はレビューサイトNotebookCheckに掲載されている3DMarkのGPU周りのスコアを抜き出したもので、RDNA2世代はGCN5世代・RDNA3世代はRDNA2世代と比較した伸び率を記載してある。
3DMark | Theoretical Performance (GFLOPS) | Time Spy Graphics | Ice Storm Unlimited Graphics | Cloud Gate Graphics | Fire Strike Standard Graphics |
---|---|---|---|---|---|
7840HS (RDNA3 780M) vs 680M | 8294 (+145%) | 2642 (+19%) | 430970 (+31%) | 44721 (+10%) | 7526 (+13%) |
7640HS (RDNA3 760M) vs 680M | 5324 (+58%) | 2116 (-4%) | N/A | 41767 (+3%) | 6142 (-7%) |
7735HS (RDNA2 680M) vs Vega8 | 3380 (+78%) | 2221 (+92%) | 329446 (+23%) | 40724 (+51%) | 6660 (+81%) |
5700U (GCN5 Vega8) | 1900 | 1156 | 267505 | 26945 | 3677 |
Vega8→680MはiGPU単体で理論上+78%の性能向上なのでシステム全体の実測値で+23%~+92%・平均+61%の性能向上ということで順当な結果となっているが、680M→780Mは理論上+145%の性能向上ながら+10%~+31%・平均+18%の性能向上に留まる。確かに性能は向上しているのだが、理論上の性能向上幅からすると疑問が残る数字となっている。
メモリー帯域の狭さによって性能向上が制限されているのでは?という疑問もあろうが、それは恐らく違う。なぜなら理論上ではGPU性能もメモリー帯域も上のはずのRyzen 7640HS(Zen 4 6コア+Radeon 760M)はRyzen 7735HS(Zen 3 8コア+Radeon 680M)に比して0~10%ほど劣っているからである(Ryzen 7640HS vs 7735HS・Radeon 760M vs 680M)。
恐らく、筆者の想像ではRDNA3には2種類のバージョンが存在し、下位モデルの構造はRDNA2と同等構成の改良版ではないかと想像している。実際、RDNA3=演算性能がRDNA2の2倍と想定しないならば780M・760Mの理論上の性能は680M比でそれぞれ+23%・-21%で、メモリーの性能向上も鑑みれば、それぞれ+10~+35%・-10~0%というのは概ね順当な数字に思える。
Ryzen 7735HS
スペックシート上の比較検証と説明は上述の通りだが、実際に実験する検証用マシンとしてRyzen 7735HS搭載機を使用することとする。
本稿の企画の趣旨からすると、2022年初頭に登場したAPUを採用というのもおかしな話だが、Ryzen 7840HS搭載PCは実際の性能が+10~35%ほど上回る一方で価格もRyzen 7735HS搭載PCの+45%程度・Xbox Series Sの約2倍ほど高価なため趣旨に反すると判断したためである。
次回はRyzen 7735HS搭載PCのゲームコンソール化を行っていきたい。
※コメント投稿者のブログIDはブログ作成者のみに通知されます