ALH84001

ALH84001

私的コラム&雑記(&メモ)

最近の興味深かった話題(2025年第03週)

2025-01-18 | 興味深かった話題

Nintendo Switch 2

Nintendo Switch 2 2025年発売予定 - 任天堂

 任天堂がNintendo Switch 2を正式発表したようなので、前回に引き続き分析した結果を書いておく。なお、ここで書く内容は現時点(2025年1月16日)で公式発表には沿っていないため誤りの可能性があることは断っておきたい。

 まず疑問に思うのは、現行Nintendo Switch比で性能はどの程度向上したか?それは何故か?ではないかと思う。以下に想定されるスペックを書いてみるが、動作周波数など不明な部分は同系列のSoCを使うNVIDIA AGX Orin/Jetson Orinのスペックを参考に推定している。


Nintendo SwitchNintendo Switch 2Estimated
Improvements
CPUArm Cortex-A57 x4
1.02 GHz
Arm Cortex-A78 x8
around 1.5 GHz?
x4 - x6 ?
GPUNVIDIA Maxwell
8SM (256MADs)
307 MHz, 236 GFLOPS (Undocked)
768 MHz, 393 GFLOPS (Docked)
NVIDIA Ampere
12SM (1536MADs)

1.0 GHz 3072 GFLOPS? (Docked)
x7.8 ?
NPUN/ATensorCore
NVDLA2
MemoryLPDDR4-1600 x64 25.6 GB/sLPDDR5X-7466 x128? 150.0 GB/s?x5.9
4 GB12 GBx3.0

予想スペックから見える、ゲームコンソールとしての性能

 恐らく、上述の通り性能の推定は不確かだが、それでも恐らく現行Nintendo Switchの3倍~8倍になると思われる。

 問題はメモリーが12GBで3倍にしか増えない点である。
 恐らく、Nintendo Switch 2ではネイティブで4K解像度がサポートされないことになる。恐らくネイティブでは1440p解像度までのサポートとなり、4K解像度はNVIDIA DLSS 3あるいは類似の超解像度技術でのサポートとなることだろう。
 現行Nintendo Switchではドック接続時で1080p解像度までサポートとなるが、Full HD/2Kと4Kとを比較すると、ゲーマー視点では縦2倍x横2倍の4倍でしかないが、演算量・データ容量としては縦2倍x横2倍x奥行2倍の8倍になってしまう。これは頂点の数やテクスチャーのデータサイズが8倍になるという意味である。現行Nintendo Switchを基準にすると、Nintendo Switch 2は演算性能・データ容量で8倍には僅かに届かず、特にテクスチャーを格納するメモリーは3倍の12GBしかない。これではネイティブで4K解像度サポートは厳しいと考えられる。

 とはいえ、仮に性能が最悪の条件で3倍としても概ね1080pの1.3~1.5倍の解像度までサポートできる(縦1.5倍x横1.5倍x奥行1.5倍 = 3.38倍)ので、WQXGA(2560x1600)か16:9解像度だとQHD(2560x1440)になる。
 これだと4K解像度に満たないが、NVIDIA DLSSやAMD FSR等で実装されている超解像技術ではネイティブ1440p程度から4K(3840x2160)へのアップスケーリングが推奨されることが多いため、案外綺麗な4K出力を得られるかもしれない(参考)。
 ネイティブで4Kをサポートしないのに超解像なら4Kをサポートできるのは、ネイティブだと3Dで縦2倍x横2倍x奥行2倍の8倍になってしまうのに対し、超解像技術は既にレンダリングが終わった画像を拡大するので2Dで縦2倍x横2倍の4倍にしかならない上に、拡大する元のデータも頂点とか元のテクスチャーの見えない部分を含ない画像データで相対的に小さいためである。

 超解像をサポートする上で嬉しいのが任天堂のパートナーがNVIDIAという点である。NVIDIA製GPUにはTensorCore・SoCにはNVDLA(NVIDIA Deep Learning Accelerator)が搭載されており、クラスとしては非常に高い推論性能を誇る。例えばWindows 11搭載PCの上位機種でサポートされる「AI PC」の要件はNPUで40 TOPS以上となっているが、Nintendo Switchに搭載されるNVIDIA OrinではNVDLA 2 x2基・TDP 10~25Wで40 TOPS・TDP 40Wなら80 TOPSを叩き出す。

NVIDIA AGX Orinとの比較(Nintendo Switch 2 T239の性能の妥当性)

 上記の性能は、リーク情報に加えてNVIDIA AGX Orin/Jetson Orinの性能を参考にしているが、これは性能のバランスを崩さないために重要と考えられ、ゲームで重要なメモリー帯域と演算性能の比(Bytes/Flops)もNVIDIA AGX Orinの性能を踏襲しているように見える。端的に言えば、Nintendo Switch 2のスペックはメモリー容量を除いてNVIDIA AGX Orinの3/4程度の性能に見える。


NVIDIA AGX Orin IndustrialNintendo Switch 2Comparison
CPUArm Cortex-A78 x12
2.0 GHz
Arm Cortex-A78 x8
1.5 GHz?
66 %
75 %
GPUNVIDIA Maxwell
16SM (2048MADs)
1.2 GHz
4915 GFLOPS
NVIDIA Ampere
12SM (1536MADs)
1.0 GHz
3072 GFLOPS

75 %
83 %
62.5 %
NPUTensorCore 64-coreTensorCore 48-core
NVDLA2 2x 1.6 GHzNVDLA2 2x 1.2 GHz?
MemoryLPDDR5-5100 x256 204.8 GB/sLPDDR5X-7466 x128 150.0 GB/s75 %
64 GB12 GB18 %
B/F0.0420.049

 LPDDR5X-7466というスピードは標準規格には存在しないが、LPDDR5Xよりも動作周波数と消費電力を落としつつx128インターフェースとLPDDR系メモリー2チップという最小のフットプリントで実現でき、性能のバランスも取れる賢い選択である。
 言い方を変えると、仮に例えばNVIDIA Orinのフルスペックのマシンを作ることは技術的には可能だとしても、そのCPU・GPUの演算性能を引き出すためにはLPDDRメモリー x256インターフェース(4チップ)が必要で、そうすると筐体サイズとコストが増えてしまう。
 比較的低コストで入手可能な最高速メモリーLPDDR5Xメモリー x128インターフェースで低コスト・省サイズを実現しつつ、NVIDIA AGX Orinの性能のバランスを維持したまま実現したのがNintendo Switch 2のスペックだったとすると妥当な結果と思われる。

他のゲームコンソールとの比較


Nintendo Switch 2Xbox Series SPlayStation4 ProPlayStation4
CPUArm Cortex-A78 x8
1.5 GHz?
AMD "Zen 2" x8
3.4 GHz
AMD "Tiger" x8
2.1 GHz
AMD "Jaguar" x8
1.6 GHz
GPUNVIDIA Ampere
12SM (1536MADs)
1.0 GHz
3072 GFLOPS
AMD RDNA2
20 CU (1280 MADs)
1.565 GHz
4000 GFLOPS
AMD GCN4
36 CU (2304 MADs)
911MHz
4150 TFLOPS
AMD GCN2
18 CU (1152 MADs)
800MHz
1840 GFLOPS
MemoryLPDDR5X-7466 x128
150.0 GB/s
GDDR6 x256
225 GB/s
GDDR5 x256 1700 MHz
217.6 GB/s
GDDR5 x256 1366 MHz
176.0 GB/s
12 GB10 GB8 GB8 GB
B/F0.0490.0560.0520.096

 1~2世代ほど前の据置型ゲームコンソールと比較した結果である。PlayStation 4よりはやや上・Xbox Series SやPlayStation 4 Proよりは下という性能に見えるが、概ね性能の傾向としては同じに見える(ゲームコンソールなのだから当然である)。
 やや異なるのがメモリー容量である。上の節の説明ではメモリー不足の指摘と読めたかもしれない(「現行のNintendo Switchのアップグレードでネイティブ4Kに対応するには」という意味ではそれで正しい)が、このように過去の同程度の性能のゲームコンソールと比較すると実は+20~50%ほども大容量という事が解る。恐らくこれは超解像技術に代表されるAI推論機能のためのモデルを格納するためではないかと邪推する。

 PlayStation 4が登場したのは2013年頃は4K解像度が規格化され始めた時期で、2016年のPlayStation 4 Proで初めて4K解像度に対応した(スペック的に近いXbox Series Sが1440pまでという点を見る限り、実質的にはネイティブ4KなゲームはPS5/Xbox Series Xからフル対応と見做すのが正しいように思う)が、当時はネイティブ4K解像度対応のテレビ/モニターは多くなく対応は必須ではなかった可能性もある。
 しかし、Nintendo Switch 2は2025年の機種で、さらに次世代機まで待つとすれば2030年頃まで対応しないことになってしまうため、Nintendo Switch 2で4K解像度に対応は必須という判断だったのではないかと思われる。

Comment

最近の興味深かった話題(2025年第02週)

2025-01-14 | 興味深かった話題

次世代Nintendo SwitchとNVIDIA SoC

 Nintendo Switch 2のメインボードのリークとされる写真が話題となった。この内容が事実とするなら「現実的」ではあるが同時に「ツマラナイ」というのが率直な感想である。恐らくはリークされたままのスペックで登場するのではないかと推測している。

 巷に出回っている情報によるとSoCはNVIDIA T239だという。
 既知のNVIDIA SoCとしてはT234 = Orin・T241 = Grace・T26x = Thorが知られており、T239という型番からOrinの派生である可能性が高いと推測できるが、これはリーク情報のスペックCortex-A78 + Ampere GPUと合致している。このOrinだが2018年発表・2021年登場の4年前のSoCということになるが、そもそも現行Nintendo Switch自体が2015年登場のTegra TX1を採用して2019年登場したため驚くべきことではない。
 ちなみに、現行Nintendo Switchに採用されたTegra TX1はAndroidタブレット等での採用も狙った初登場時点でも低消費電力で性能も控え目の開発ボードがUS$ 600のSoCだったが、Orinは車載で自動運転を狙ったSoCのため初登場時点では非常に高性能で消費電力も高めの開発ボードがUS$ 2000するSoCだったため、同じ4年前のSoCでも2025年時点でのOrinの性能は2019年時点でのTegra TX1よりも相対的に条件は良い。

 もっとも、このNVIDIA T239(約200mm2)だが、NVIDIA Orin T234(約455mm2)よりも小さいようで、その点に関しても憶測が飛び交っている。
 筆者の推測では、2021年にSamsung 8LPPで製造していたNVIDIA Orin T234をSamsung SF4系かTSMC N5系に移したシュリンク版で、論理的なスペックはNVIDIA Orin T234と同一のCortex-A78 12-core CPU + Ampere 16SM GPUで、一部の機能を無効化しているのだろうと推測する。そうでもなければ2018~2020年頃のIPを今さら使いまわす理由が無く最新のIPを採用することだろう。
 それよりも、NVIDIA Orinの新ステッピングとしてしまった方が任天堂とNVIDIAにとって利点がある。NVIDIA視点で言えば相対的にライフサイクルが長い(供給保証が10年間超が多い)組込半導体であるNVIDIA Orinを公式スペックを変更せずに製造プロセスをリフレッシュすることでSoCの製造コスト・消費電力を抑えることができるし、任天堂視点で言えば既に車載SoCとして量産されているので新規開発に投資する必要がない。また、Cortex-A78 12-core のうち8-core、Ampere 16SM GPUのうち12SMが正常動作していればいいため高い歩留まりを達成しコストを抑えることができる。
 Orin T234(2021年)で採用されたSamsung 8LPPのトランジスター密度は61.18 MTr/mm2だが、Samsung 4LPE(SF4E)の場合は137.0 MTr/mm2・TSMC N5/N5Pなら138.2 MTr/mm2・TSMC N4/N4Pなら143.7 MTr/mm2と2倍以上になっているので、単純計算であれば193~203mm2にシュリンクする計算になる。もちろん実際には単純計算通りにはならないが、概ね辻褄は合っている(初出自、Samsung 4LPEのみで試算していました。NVIDIAはSamsung製IPへの依存がほぼ無いためTSMCでの製造が可能なはずで、TSMC N5系の場合の情報も追加しました)
 実はNVIDIAと任天堂のこういった動きは初めてではなく、現行Nintendo Switchでも2017年3月にNVIDIA Tegra X1(TSMC 20nm)を搭載して発売した後、2019年7月に電力効率が改善したTegra X1+(TSMC 16nm)搭載モデルに更新しており、この更新はNintendo Switchだけでなく同じSoCを搭載した他のNVIDIA製品にも適用されている。

 ところで、NVIDIAはGB10なるSoCを発表したのだが、筆者の予測ではこれが次々世代Nintendo Switchに載る候補になると推測している。
 実際、Nintendo SwitchとNVIDIA Orinの場合、初代Nintendo Switchが発表された時期(2019年)と同時期(2018年)にNVIDIA Orinが発表されている。2018年以降のNVIDIA SoCは車載用のため発表時点ではコスト・消費電力の両面でUS$ 400の携帯ゲーム機には載せられないが、発表から4~5年後であれば開発コストも償却済・半導体製造プロセスも進んで搭載可能になる。そのため、2025年にシステム全体でUS$ 3000のGB10(SoC単体の価格が不明)がシュリンクされて2030年頃の次々世代Nintendo Switchに搭載されたとしても不思議はない。

Comment

最近の興味深かった話題(2024年第52週)

2024-12-28 | 興味深かった話題

TP-Linkは何処の会社か?

 日本の大手ITニュースサイトでTP-Linkの「米国TP-Linkは中国TP-LINKとは無関係」という趣旨の声明を報じているのだが…TP-Linkの主張はそうだとして、それを鵜呑みにして報じるのはプロの仕事じゃない。

 筆者が軽く調べた結論を先に言うと、「米国TP-Linkと中国TP-LINKの関係は「不明」(→使うなら個人の自己責任で)」ということになる。もっとも、筆者からするとASUSやNetgearなど他の選択肢があるのにあえてTP-Link製品を選択する動機が解らないが。

 そもそもの話をすると、米国TP-Linkは同様の主張を以前から繰り返しており、英語版Wikipediaの項目を引用すると以下のようになる:

In a 2023 patent dispute lawsuit, a U.S. federal judge rejected the company's argument that there was no link between its U.S. and China businesses.
In May 2024, the government of India issued a warning saying that TP-Link routers present a security risk.
In May 2024, TP-Link announced the completion of corporate restructuring, with secondary headquarters in the United States and Singapore.

※以下筆者による抄訳
2023年の特許紛争の裁判で、米国裁判所は当該企業(注:TP-Linkのこと)の米国ビジネスと中国ビジネスに関係は無いという主張を却下した。
2024年5月、インド政府はTP-Link製ルーターのセキュリティーリスク存在するという警告を発行した。
2024年5月、TP-Linkは完了し第二ヘッドクォーターを米国とシンガポールに置く企業再編が完了したと発表した。

※英語版Wikipediaの書きっぷりは一貫して米国TP-Linkと中国TP-LINKを同一企業として扱っている。ただし、それは書き手の主張というより米国政府/司法の現時点での公式なステータスと一致している。

 要するに、米国TP-Linkは今回と同様の主張を以前から繰り返しており、2024年には企業再編が行われているものの、各国政府は懸念を取り下げていない。

 余談だが、少し調べてみても疑問は深まるばかりである。
 例えば米国TP-Link製品とソックリな製品が某中国系通販で中国TP-LINK製品かのように販売されていたり(例えばこれこれ。ただし、販売会社の不手際の可能性もある)、米国TP-Linkサイトには企業幹部の名前が表示されておらず、少し調べるとCEO等の幹部が中華系のように見える(ただし、家系図まで遡ってはいないので、中華系米国人やシンガポール等を経由した華僑という可能性もある)。

 ただ、そもそもTP-LinkはDJIのような「業界でダントツ」な製品を作っているわけでもなくASUSやNetgearなど他の選択肢があるので、あえてTP-Link製品を選ぶ必要性は薄いように思われる。
 いずれにせよ、企業の公式発表を裏取りもせず記事にするのはプロの仕事とは言い難い(ましてや企業の主張部分を太字で強調するとかどうなっているのか)。恐らくニュースメディアもコネなどシガラミはあり(広告主だったりとか)するのだろうが、こういうのはステルスマーケティングと同類なので、ちゃんと裏取りする気が無いのであれば「PR」等明示すべきである。

Intelの「AIシフト」と時系列

Intelの苦境と変わりゆくデバイス――“AIシフト”の影響を受け続けた2024年のテック業界 - ITMedia

 ITMediaの記事だが…2024年のニュースの総括という趣旨は理解できるのだが、なんだか時系列や因果関係がおかしい。
 Pat Gelsinger氏の退任が電撃的・衝撃的だったことは否定しないが、恐らくライターは時系列を勘違いしている。Pat GelsInger氏がCEOに就いたのは2021年で、NVIDIA等競合他社もIntelも既に「AIシフト(※それが何を意味するにせよ)」していた。

 例えばNVIDIAがTensor処理をVectorプロセッサーであるStreaming MultiprocessorからTensorCoreに処理を移したのがVolta/Turingで2017/2018年のことであるが、IntelがDeep Learningに舵を切り始めたのもNervana(2016年)・Movidius(2016年)・MobilEye(2017年)・HabanaLabs(2019年)の買収を通してである。またIntelは自社開発のData Center GPU Max "Ponte Vecchio"の開発にあたりRaja Koduri氏を雇ったのが2017年である。いずれもGelsinger氏がIntelに復帰する以前の話である。

 生成AI等のブームによる関連銘柄の株価暴騰は上述の2016~2019年時点では予測不可能にしても、Deep Learningの隆盛自体は見えており、「何時」「どの程度」かは予測できなかっただけだ。
 筆者が推測するに、IT業界で働いていてDeep Learningが隆盛すること自体は明確だったはずだ。これは「工業で冶金技術等の素材技術が鍵になる」というのと同じ話で、様々な分野に適用・応用でき、多くの経済的利益を生み出せる基盤技術が産業の鍵になる、という話である。
 Deep Learningの場合、従来人間が行っていた判断を数万~数億倍の速度で実行でき多種多様な場面に応用できる。例えば株取引では「数理モデルの出した予測」を参考に人が「過去の経験や知識に基づき判断」して取引していたところ、数理モデルとDeep Learningを組み合わせで、より高精度な判断を数万~数億倍の速度で実行できるならビジネスになると容易に予測できる。同様の応用例は幾らでも考えられる。疑問は「何時」「どの程度」である。
 これはAMDが良い例で、同社はCDNA = InstinctシリーズでDeep Leaning自体はサポートしたが、現在でもNVIDIA GPUと比較して最適化されているとは言い難く、その結果としてNVIDIAの後塵を拝している。悪い言い方をするなら「Deep Learningへの投資は判断できていた」ものの「NVIDIAに比べDeep Learningへの早期の傾倒が足りなかった」ということになる。

 ITMedia記事では何故か唐突にSoCの話が始まっているが…これは「AIシフト」とは直接は何の関係もない。
 半導体の統合=SoC化は、半導体の微細化とコストとユーザーの要求性能のバランスの問題でしかない。そもそも、PC用の半導体だって点数は減り続けており、2000年頃までは3チップソリューション(CPU + North Bridge + South Bridge)が基本だったが、現在ではすべて統合されたSoCも普通になった。
 半導体は微細化で集積度が上がるため、2000年頃の時点で既にNorth BridgeとSouth Bridgeがスカスカになってきており、North BridgeへのGPUの統合・North BridgeのCPUへの統合などの統廃合はロードマップに入ってきていた。ちなみに、Intelの場合、最先端製造プロセス=CPU用・一世代前の製造プロセス=North Bridge用・二世代前の製造プロセス=South Bridge用としていたため、チップセットの統廃合が行われると二世代前の製造プロセスが空いてしまう。それを社外に提供するサービスに転用しようという試みが2015年頃にIntelが推進していた初代Intel Foundryである。

 マイクロプロセッサーのSoC化自体はIntelの不振と直接関係は無いが、SoCが実現できるほどマイクロプロセッサーの性能・機能が成熟しているとなると、(1) マイクロプロセッサーの分散化 (2) CPUのバイパスが当然発生し、これはIntel CPUが売れない原因となりうる。
 アイデアは単純で、昨今のスマートフォンのレベルのマイクロプロセッサーが実現可能なら、わざわざネットワークの先にある一極集中されたサーバーと通信しなくても分散されたノード/エッジで可能な処理がでてくる。それが飛躍すると、一極集中されたサーバーとほとんど通信しなくても分散されたノードだけで通信して処理すれば通信コストが省けることになる。結果としてNVIDIAやAWS等の他社が投資してきた市場は拡大しており、Intel CPUの重要性・出荷台数は減ることになる。
 もっとも、それもRDMA(2011年)が登場した時点で既定路線で、2018年6月にTop500に登場したIBM SummitはCPUの搭載台数より多くのGPUの搭載台数でTop500首位を獲得した初めてのHPCだが、GPUはMellanox InfiniBandでGPUDirectによりCPUをバイパスして相互通信が可能である。Pat GelsingerがIntel CEOに就任した2021年や今年2024年に始まったような話ではない。

 Intelの場合、「Intelの不振」と一言で語られることが多いが、実際には問題は多岐に渡っている。例えば (1) 製造部門が成果を出していない (2) Intel Architecture(x86系)CPUビジネスから脱却できない、といった問題点は互いに無関係な別問題である。
 ITMedia記事では「リスク分散」についても指摘されているが、リソースは無限ではないので分散だけでなく「選択と集中」はある程度必要になる(バランスの問題)。そうなるとIntelが「AIシフト」で行っている、(後者)MobilEye独立・HabanaLabs NPUとData Center Max GPUの両方への投資は無駄が多過ぎるように感じられ、これらを別の問題(前者)Intel Foundryの問題と並列して対応するのだから大変である。ただし、上述の通り前者と後者には直接的な因果関係は無い。

 前者は半導体の微細化が進み製造技術の確立の技術的難易度が向上しているからである。ただし、関連するIntelの動きは業界の競合他社の神経を逆撫でし続けているようにしか見えない。以前も記事にしたが実績が散々なのに威勢だけがよかったり((1) (2))、当のGelsinger氏もTSMCから反感を買ったりしている。

 後者については「Intelが2006~2017年頃の経営判断でx86一本鎗を選択したのだから、経営判断の問題」だとしか言いようがない。
 Intelは2006年頃にx86への集中を選択したと見られ、ARMv5TE互換CPUコアXScaleを2006年を売却・2009年にはNVIDIA・AMDが進めつつあったGeneral Purpose GPU(GPGPU)もx86系CPUで実現すべくLarrabeeを発表している。IntelはGPGPUの標準化を狙って2009年に開発されたOpenCLのデモですらIntel CPUのAVXで実行させていた、根っからの反GPGPU/アクセラレーター派である。その態度が変わったのは上述のNPU・GPUへの投資の頃からだ。
 つまり2006~2024年の過去18年間において、Intelは2006~2017年の11年間は反GPGPU/アクセラレーター派でx86に固執し続けていた(CPUシェア90%の会社の主張なので、単に意見が対立したというよりPC自体がスマートフォンよりGPGPU/アクセラレーター対応が遅れた元凶と言って間違いない)。このためNVIDIAやAMDから対応が遅れているのは当然だし、過去の11年間の経営判断ミスが現在の経営状況の悪化に結びついているとしたら自業自得としか言いようがなかろう。
 ちなみに、Pat Gelsinger氏は2001~2009年のIntel CTOとしてIntelのCPU戦略を主導した人物であり他人事ではない。

Comment

Black Friday 2024

2024-12-12 | 買い物

戦果(?)を書いてみる。
※本稿はクリスマス頃 = 12月25日頃まで更新され続けます。

Elac Solano BS 283.2 (Elektrowelt24)

 PCと組み合わせて使用するブックシェルフ型のモニタースピーカーを探していたところ、衝動買い(ブックシェルフスピーカーだが、モニタースピーカーじゃない…)。時期は重なったがBlack Fridayとセールは無関係のように思われる。Elektrowelt24にて22%引きにて購入。

Keychron K8 Pro (Keychron Germany)

 筆者は仕事場と自宅でタイピング感覚を揃えるためキーボードは類似製品を2台揃えており、現在はCherry茶軸系スイッチメカニカルキーボードで統一しているのだが、自宅のキーボードが発生頻度は稀ながら不具合を起こすことがある。具体的には入力した文字が反映されなかったり、かと思えば遅れて20文字ぐらい入力されたりといった具合である。Keychron Germanyにて20%引きにて購入。

Kensington Expert Mouse (Bluetooth) (Amazon.de)

 筆者は25年ほど前からKensingtonトラックボールユーザーである。日本で会社員をしていた時代は自宅と職場とでExpert Mouse(USB有線)で揃えていたほどだが、現在は自宅ではExpert Mouse(USB有線)・職場ではエレコムのDEFT(独自無線)。今回は自宅トラックボールをUSB有線からBluetoothに変更する。上述のKeychron K8 Pro・Kensington Expert Mouse (共にBT)の更新により、自宅デスクが無線化されてスッキリする。Amazon.deにて23%引きで購入。

Whey Protein 2.27kg (Amazon.de)

 筆者は減量のため朝食をプロテインシェイク+サプリメントに移行しており、最近利用しているのがPBN・Amfitブランドのプロテインである。Amazon.deにて24%引きで購入。
 このPBN=Premium Body Nutritionなる会社の実態はよく判らない。PBNは旧ブランド名でAmazonに傘下になってAmfitブランドに改名したらしい。「らしい」というのは断片的な情報しかなくプレスリリースなどで明言されていないためである。Amfitブランドに改名した割にはPBNブランド製品が売られ続けているのが謎だが…。

Brütting Mount Bona High (Amazon.es)

 スイスでは身近に世界的に有名な山があったりするのでアウトドア趣味の無い人でもハイキングやスキーは楽しむ人が多く、かくいう筆者も週末のハイキングやスキーを(できる範囲で)始めた一人である。現在は独Jack Wolfskin Vojo 3を使用しているが、外観がいかにも登山!アウトドア!という感じのため、カジュアルな服装に合わせやすい・アウトドアスポーツ対応・防水の靴として購入。靴底がVibramなのも好感度が高い。

CWWK Mini PC (AliExpress), Micron DDR5 SODIMM (Amazon.de), WD NVMe SSD (Amazon.de)

 実験的なサーバーの構築を構想しており、そのベースとして購入。
 24時間/週7日間運用(ただし冗長性は考慮しない)を行うため低消費電力・必要なデバイスを拡張するための豊富なI/Oを備えた、DIYに適したコンピューターである。単に安価なMini PCが欲しいなら旧世代AMD Ryzen搭載機が御勧めだが、PCIe x4やSATAインターフェース等を鑑みると本機が最適と判断した。

Comment

最近の興味深かった話題(2024年第49週)

2024-12-08 | 興味深かった話題

Top500 2024年11月版

TOP500 List - November 2024 - Top500.org

 2024年11月版Top500が発表されたのが11月18日のことなので、3週間近くも遅れてしまった…。
 今回の目玉はようやく初登場したEl Capitanだろうが、興味深いのはEl Capitanそのものというよりも、El Capitan・Frontier・Auroraという米エネルギー省が導入した三大ExaFlops Systemの比較ではないかと思う。

SystemCoresRmax (PFlop/s)Rpeak (PFlop/s)Power (kW)
El Capitan11,039,6161,742.002,746.3829,581
Frontier (2024.11)9,066,1761,353.002,055.7224,607
Frontier (2024.06)8,699,9041,206.001,714.8122,786
Frontier (2022.06)8,730,1121,102.001,685.6521,100
Aurora9,264,1281,012.001,980.0138,698






EfficiencyRmax/RpeakPower/Rmax
El Capitan63.429 %16.981
Frontier (2024.11)65.816 %18.187
Frontier (2024.06)70.328 %18.894
Frontier (2022.06)65.375 %19.147
Aurora51.111 %38.239

 Frontierが2位なのは予想通りだが、密かに未だに構成に微調整がされ続けている点は興味深い。
 過去1位を獲得したSummitや富岳などフラッグシップHPCは導入後は数年に渡り最適化が行われ、Top500上でも数値の変動から垣間見えるのは普通のことではあるが、まさか3年間(2022年06月~2024年11月)に渡って最適化が続けられるとは思っていなかった。Frontierは初登場の2022年06月と比べノード数・コア数・Rmax・Rpeakが+20%程度増強されている。その一方で実効性能(Rmax/Rpeak)は7%低下・電力効率(Power/Rmax)も低下しており、まだまだ最適化の余地も見える。
 もっとも、IPの構成で見るとFrontierとEl Capitanは酷似しているから、Frontierで得られた知見をEl Capitanに反映させたり、逆にEl Capitanで行われた最適化をFrontierにフィードバックしたりということも可能だろうから、El Capitanありきでの最適化なのかもしれないが。

 気を吐くAMDと対照的なのがIntelである。驚くべきことに前回2024年06月のランキングから測定結果が変更されていない。ASCII大原氏の指摘する通り2024年06月の結果も不完全な状態での計測だっため、更新されて然るべきだったはずだが…。
 Auroraは、本来は3年以上前に初のIntel Data Center GPUを搭載して初登場1位を獲得して華々しくデビューするはずのシステムで、ここで本来は時間をかけて最適化し実績と経験値を積むべきところだろうが…遅延により政府に違約金を払い(大赤字)、1.5年前に未完成で登場し散々な結果を出したシステムだから、「損切り」として諦めて最適化を放棄したのかもしれない。
 Top500は悪く言えば余興で実運用・実アプリケーションからは乖離している。そのため、実運用で使えているなら問題無いのかもしれないが、Auroraは消費電力がEl Capitanを20%以上も上回るのでユーザー視点では電気代とか運用コストが馬鹿にならないだろうが…。

Pat Gelsinger氏がIntel CEOを退任

パット・ゲルシンガー氏がIntelから「卒業」しなければならなかった背景 - PC Watch

 各社報道を見るに「IDM2.0の達成率を客観的に評価できる人が必要」だと思い知らされる。特に日本のメディアはいずれも最悪だ。
 まったくの部外者の筆者が報道などを通して感じた個人的な感覚ではあるが、Intelの発表だけを鵜呑みにすれば達成率80%ぐらいに見えるかもしれないが、実態は20%以下といったところではないかと思う。

 言い換えれば本記事も含めた多くの報道記事が「Intelに忖度した偏向/提灯記事」としか見れない。

 まず、記事の問題点を指摘するとすれば、そもそもIDM「2.0」という名称にある通り「IDM」自体はなんら新らしいサービスではない。
 Intelは2014年頃にファウンドリーサービス=IDMを開始したのだが(参考 (1) (2) (3) (4))、これが2020年頃までに壊滅的に破壊されてしまった。その原因の一端はコロナ下の半導体不足によるファウンドリーとして主に信頼面で・同時期に10nmプロセスの躓いたことで主に技術面で大々的に失敗してしまい、「IDM (1.0)」の顧客企業が強制的にゼロになって有耶無耶になった。だから、その意味ではIDM2.0は最悪の実績からのマイナスからのスタートである。

 それでも、もし仮にIntelがIDM(1.0)かIDM2.0で現実のTSMC以上の優れたサービスを展開し、仮にTSMCが現実のIntel並にコケていれば、「IDM(1.0)/2.0」は上手く行った可能性もゼロではなかったのかもしれない。しかし現実の結果は前回の投稿でも触れた通り「Intelはファウンドリーサービスでトップ10に入らなかった」がすべてである。

 そこへ来て「こうしたIDM 2.0の戦略は着実に実行されてきており、4Y5NやIFSは、来年にIntel 18Aの製造が開始されると本格的に立ちあがるというところまでこぎ着けていた」とは冗談でも笑えない。
 まず、4Y5Nはほぼ「ペーパーランチ(発表だけで実態が伴っていない発表)」に近く他社どころかIntel自身すらロクに製品化できていない上に、2023年に登場した「Intel 3」はTSMC N3(2022年)と同世代に見せかけただけの実質TSMC N5(2020年)~N4(2022年)と同世代のプロセスで、それに続く「Intel 20A」は採用取り止めにより、2024年の新CPU "Lunar Lake" "Arrow Lake"は共にTSMCでの製造となった。

 そもそも「4Y5N」というのが中身のあまり無い目標である。というのも「5N」は5品目のプロセスノードを指すが、Intel 7→Intel 4→Intel 3→Intel 20A→Intel 18Aの5品目で、フルノード世代としては2世代・ハーフノード世代3世代も含めて5世代となる。ここでハーフノード世代の改良内容・性能向上は各ファウンドリーでまちまちなため、実質的には2フルノード世代だけ開発して残り3世代はペーパーランチでも「5N」は達成可能という、技術的には意味のない指標である(ちなみに、そういうカウント方法で良いなら、TSMCは2021年から現在までで6ノード=N5P/N4/N4P/N4X/N3B/N3Pを世に送り出している)。
 「Intel 7」はそれ以前の「Intel 10nm/10nm SuperFIN」の改良版・「Intel 20A」は既にコケているので、2024年現在で実際に達成できているのは1フルノード世代と2ハーフノード世代だけである。

 実際に製品が出ているIntel 7・Intel 4・Intel 3プロセスはペーパーランチではないのだろうが、これらも優れたプロセスかどうかは疑わしい。Intel純正製品以外に存在しないほか、2024年7〜9月期決算で赤字の原因の一端となった過剰投資した半導体製造設備があるにも関わらず、Intel自身が最新製品ではIntel FoundryではなくTSMCを多用している事実が、これらのプロセスの不完全具合を何より雄弁に物語っている。

 そして本人=Intelすら採用していないサービスを宣伝したところで誰も利用するはずがなく、その結果が「Intelはファウンドリーサービスでトップ10に入らなかった」であろう。「4Y5N」自体が成功と言える状況ではないので「IDM 2.0の戦略は着実に実行されてきて」いるはずがない(マトモに競争力のあるサービスが存在するかすら怪しい。利用する顧客がいるかどうか以前の話である)。

 Intel自身が株価対策で華々しくポジティブに発表するのは勝手だが、報道がそれを鵜吞みにしていては報道会社の存在意義がない。往年の将棋棋士 升田幸三の言葉を借りるなら「負けに不思議の負け無し」で、敗北した理由を分析すべきなのであって、そこで大本営発表を鵜呑みにして「IDM2.0は順調」という説明は無茶である。

 ゲルシンガー氏にとっての不運は、前任者のスワン氏が(少なくとも外部から見て)何の成果も挙げなかった点ではないか。
 そもそもIntelのCEOはオテリーニ氏(Paul Otellini. 5th Intel CEO, 2005-2013)までは技術部門出身者で占められており、その次の製造部門出身クルザニッチ氏(Brian Krzanich. 6th Intel CEO, 2013-2018)時代に14nmプロセス・10nmプロセスで失敗し、その次を引き継いだスワン氏(Bob Swan. 7th Intel CEO, 2018-2021)は財務部門出身であった。

 初の財務部門出身CEOに課せられた課題は部外者には知る由もなく想像するしか無いが、恐らく株主や取締役会の期待はバランスシートの健全化だったはずだろう。Intelのような最先端技術を扱う企業が不調に陥って財務部門出身者をCEOに起用するなら特別な任務があったと捉えるのが妥当なはずだ。ところがスワン氏時代のIntelが実践したのは (1) HabanaLabsの買収と (2) IDM(1.0)サービスの抹殺だけである。コロナ下の半導体不足という不運もあり製造能力を大幅に増強した結果、現在は生産能力過剰で財務状況悪化の原因になっている。
 Intelは軍需に関わりも深く、Intelの一存で決定できないことも多いだろうが、実のところ、スワン氏時代末期のIntel 10nm SuperFINノードの立ち上げ成功した時点が製造部門を売却する最後のチャンスだった可能性はある。Intel 4・Intel 3・Intel 20Aと御世辞にも成功とは言えない成果しか出していない現在のIntel Foundryに出資したい・買収したいという企業が登場するとはとても考え難く、米国政府がCHIPSで出資し続けているのも、軍需企業=Intelが倒産したら困る・半導体生産から撤退したら困るというだけではないかと思う。
 もしスワン氏時代に製造部門を成功裏に分離できていれば、状況は大きく違ったことだろう。ゲルシンガー氏時代で復調する未来もあったかもしれない。

Comment