Qualcomm AI100
Qualcomm、データセンター向けのAI推論処理アクセラレータ「Cloud AI 100」 - PCwatch
Qualcommはマシンラーニング分野では出遅れていた印象がある。例えば、同社の得意とするスマートフォン用アプリケーションプロセッサーでいえば、同社はSnapdragon 855(2018年12月)で初めてHexagon Tensor Accelerator(HTA)というマシンラーニング専用アクセラレーターを初めてを導入しているが、これはAppleやHuaweiの1年超の遅れだった。
そんな中で登場したQualcomm製マシンラーニング専用アクセラレーターがデータセンター用で出てくることは意外である。データセンター用マシンラーニングアクセラレーターといえばGoogleが自社開発TPU・AWSが子会社AnnapurnaLabs製AWS Inferentiaを採用しているためMicrosoft Azureも何か必要だったということまでは理解できるのだが、そこでNVIDIAでもBroadcomでもMarvellでもなくQualcommの名がでてくるというのは非常に珍しい。そういえば同社がサーバー用CPU Centriq 2400を発表した際も最初の顧客はMicrosoft Azureだったか。
このAI100であるが、秘密主義の同社らしく詳細は判然としない。
当初、私はSnapdragon用マシンラーニング専用アクセラレーターをディスクリートとして分離したものを想像したのだが、そのHTAも詳細は不明なほか、「Hexagon」ブランドを冠する通りQualcommのDSP=Hexagonに統合されているから、ディスクリートプロセッサーとして分離するのも相当に難しそうである。
AI100が対応するデータ精度が不明であるが、性能だけ見れば後発に相応しい高性能である。2018年発表のGoogle TPUv3がbFP16対応・学習/推論両対応で90 TFLOPS・AWS InferentiaがINT8・FP16・bFP16対応で100 TOPS超というスペックに対し推論専用ながら350 TOPSとされている。
NVIDIA RC18
マルチダイ化へ向かうNVIDIAのリサーチチップ「RC 18」 - PCwatch
リサーチチップということで製品化されるモノではないが、将来のNVIDIA製品を推測(妄想?)する上では興味深い。MCM製品という事ではEpyc/Ryzen ThreadripperでAMDが先行した感があるが、研究という事では数年前まではNVIDIAの方が有名だった。
36チップレットというのは研究開発や理論実証という点では実用的なのだろうが、本文中に「実際のダイでは、GRSリンク群がかなりの面積を占めており」とある通り実用的とは言い難い(ファブリックにロジックを割かれて実行ユニットのロジックが削られてしまっては本末転倒である)。恐らくは2~4チップによるMCM構成から始めることになるのだろう。もっとも2~4チップではメッシュよりもバスやPoint-to-Pointやクロスバーの方が簡単な気がするし、実際、記事中の冒頭の図ではPoint-to-Pointのように見える。
ここで気になるのはメモリーインターフェースではないかと思う。
例えばAMDはRadeonのマルチGPU化する際にGDDRメモリーインターフェースを意図的に256-bitに制限した(※HBM実用化以前の話である)。当時も現在もハイエンドGPUのGDDRメモリーインターフェースは384~512-bitの間だが、マルチGPU化するとインターフェースはGPUの個数倍に増えてしまう。そこで256-bitに制限すると2GPU構成で512-bitとなる。恐らく同じことが起こり、記事中の図にあるように1GPUあたりHBM x2スタック程度となり、マルチGPUダイの合計で現在のハイエンドGPUに相当するメモリーインターフェースを持つことになるのだろう。
ところで、記事中には発表者としてDally氏の名が挙がっているのが、非常に懐かし(?)かった。かつてNVIDIAにはメディアに頻繁に登場するChief Scientist = David Kirk氏がいたが一説によると健康上の理由で退任した。同氏の後任としてNVIDIAが2009年にStanford Universityから引っ張ってきたのがDally氏だったのだが、記事で見た記憶が無い。
PlayStation 5に関するウワサ
Extraordinary PlayStation 5 details leaked: 7nm Ryzen CPU, 7nm Navi GPU - NotebookCheck.net News
もし2020年にPlayStation5(以降PS5)がリリースされると仮定するなら、という想定であれば妥当なCPU/GPU周りはスペックといえる(というか、大幅なアーキテクチャ変更が無い限りは、他に選択肢が無い)。
この予想スペックで怪しいのはGDDR6とDDR4の組み合わせである。GDDR6を充分に搭載できるのであればDDR4は無駄に思える。
2020年のハイエンドゲームコンソールであればRyzen 8コア+Navi GPUという組み合わせは順当で、TSMC 7FFで製造されるRyzen 3000シリーズとNaviにGlobal Foundries 12LPまたは14LPPで製造されるI/OダイをMulti-chip Moduleの形で組み合わせたものとなると思う。恐らくCPU chipletはPC=Ryzen/Server=Epycと共通で、I/OダイはGDDR6に対応したカスタム仕様となるのだろう。
PS4/PS4 ProではAMDの猫系アーキテクチャー(Jaguar/Puma)を搭載したが、PS5がAMD APUを搭載するのであればRyzenで間違いない。AMDは既に猫系アーキテクチャーの開発チームを失っており(Samsungに移籍)、メンテナンスする程度の人員しか残留していないといわれている。
不明なのはGPU=Naviで、アッパーミドルクラスのディスクリート用GPUを統合するのかAPU用のカスタム設計したものを統合するのかは分からない。AMDはCrossFire後継/NVIDIAのNVLink相当の技術としてInfinity FabricをGPUに統合しているはずで、理屈の上ではGPU-I/Oダイ間通信にInfinity Fabricを使える(つまり、理屈上はディスクリート仕様のGPUをAPUに転用できる)し、最近のAMDプロセッサーは共通のSerDesで複数の内蔵コントローラーからインターフェースを選択できる組込SoC的な仕様になっているから、PCIe接続のディスクリートGPUをインターフェースの設定だけ変更してAPUに持って来るということは十分に考えられる。
Naviは2020年に登場予定の第二世代(Navi 20)でレイトレーシングに対応すると言われているが、PS5が2020年の登場だとすれば間に合わないだろう。
メモリーであるが、PS4の純粋な後継であればGDDR6メモリーが16~24GBもあればDDR4は不要で、フラットでないメモリー空間はゲーム開発の妨げになるだけである。異種メモリーが必要となるのはXBox OneがeSRAM + DDR3メモリーであったように、安価で大容量だが帯域の狭いメモリーを帯域の広いメモリーで補う場合のみである。
もし、それでもDDR4が必要なケースがあるとすれば、それはシステム内にメインのゲームシステムとは別に動作するサブシステム(例:PS4に搭載されたCXD90025GセカンダリープロセッサーはARMベースのCPUに256MBのDDR3を搭載した)が存在する場合で、DDR4 4GBとなるとマシンラーニング/ビジョンプロセッシング関連の可能性が考えられる。