HPEによる買収後のCray
Steve Scott Lays Out HPE-Cray Blended Product Roadmap - HPCwire
元CrayのCTOのSteve Scott氏がプレゼンテーションを行ったそうだ。
前提となるCray・HP Enterprise各社の現在の製品シリーズを説明すると、まずCrayはHPC製品のファミリーを主に2種類持っている。ひとつが独自規格ラックや独自インターコネクトを使用したもので、現行世代ではSlingshotインターコネクトを使用したShastaシリーズや前世代のAriesインターコネクトを使用したXCシリーズがこれにあたる。もうひとつがApproの買収により追加された標準19インチラックやInfiniBandといった標準的な部品で構成されたクラスターサーバーのCSシリーズである。
実は、Shastaに関して言えば、ソフトウェアから見たハードウェア構成は同一ながらも独自規格のラック・液冷・メザニンカード・スイッチを使用したMountain構成と、標準19インチラックに空冷ユニットや標準規格のPCIeカードを使用したRiver構成とがある。
次に、買収した側のHPEであるが、Cray以前にもコンピューター企業を多数買収したものの、製品シリーズの統廃合を行った結果、現行のHPC製品としてはApolloシリーズのみがある。
今回の発表で明らかになったのはCrayのShasta MountainとRiverのリネームで、前者がOlympus・後者がApolloとなり、後者がそのままHPE Apolloシリーズと統合され、今後はHPEのデザインを使うというものである。また、将来的にはCSシリーズはApolloに統合されるのだという。つまりCray 3シリーズとHPE 1シリーズの統廃合で2シリーズに集約される。
そのほか高可用性サーバーのSuperdome FlexやマイクロサーバーのMoonshotも同じSVP(元Cray CEO)傘下となるようだが、さすがにこれらは用途が異なるので統合はされないだろう。
個人的には歴史的に見てHPEは統廃合の上手な企業だとは思わないが、これは悪手に思える。
実際、HPEは過去にApollo Computer・SGIのほかCompaqを通してDEC AlphaServerとHPC・PCクラスターを手掛ける企業を多数手中に収めてきたが、いずれも現存しておらず、現在はPCサーバー=ProLiantシリーズの上位に設定される高性能サーバーApolloシリーズしかない(ただし旧Apollo Computerとは縁も所縁もなく、ブランド名を再利用しただけである)。SGIを買収した時はSGIからNUMAlinkインターコネクトなどを導入したが、標準製品で置き換えられ、現在でも残っているのはHPE MPIにリネームされた旧SGI MPIぐらいのものである。
同業種の企業が売買収された場合に重複する製品が統廃合されることは驚くことではないが、どちらかと言えばHPE ApolloシリーズはCray CSシリーズに近く、Cray Shasta River(新Apollo)と統廃合されるというのは理解に苦しむ。
ところで、個人的に興味深いのが記事中3枚目の写真である。
Crayは米エネルギー省(DOE=Department of Energy)の次世代HPC 4システムで全勝しており、1システム(Perlmutter)がAMD CPUノード+AMD CPU + NVIDIA GPU ノードのハイブリッド・2システム(Frontier・El Capitan)がAMD CPU + AMD GPU・1システム(Aurora)がIntel CPU + Intel GPUという構成になっているが、この3枚目の写真中の構成の組み合わせで実現される。
興味深いのはIntel CPU + Intel GPU構成では2 CPU + 6 GPUの組み合わせで恐らくCPU側からSlingshotに接続されるのに対し、AMD CPU + AMD GPU構成では1 CPU + 4 GPUの組み合わせでGPU側からSlingshotに接続している点だろう。
まずCPU+GPUの構成についてであるが、Intelの2 CPU + 6 GPUという構成は、例えば現在Top500首位のORNL/IBM Summitがそうである(IBM POWER9 x 2 + NVIDIA V100 x 6)ように現在の典型的な構成である。しかし、SummitのTop500ベンチマーク計測がそうであったように、現在のHPCではGPUだけで演算してしまうことが多く、乱暴に言えればCPUに対するGPUの比率が大きいほどノードあたりの性能を上げやすい。AMD CPU + AMD GPU構成(CPU:GPU = 1:4)はIntel CPU + Intel GPU構成(CPU:GPU = 2:6)よりもGPUの比率が大きく性能を上げやすい可能性がある。
次にインターコネクトの接続形態であるが、最近のGPUはネットワーク経由で直接GPU-GPU間コミュニケーションができ(Mellanox GPUDirect RDMA)、NVIDIAがMellanoxを買収したのもこれが理由のひとつと考えられる。機械学習などで多数のGPUでひとつの演算を分散して行う場合にCPUを介してアクセスするよりもCPU負荷を低減でき遅延も小さくなる。これまでもPCIeスイッチなどを介した実装は行われてきたが、CPU-GPU間接続とは独立してGPUに直接ネットワークインターコネクトを接続した例はなく、こちらも性能向上を期待できる。
富士通の気象庁気象研究所の新HPC
富士通の新スパコン、世界最高レベルの気象予測精度達成に向けて稼動開始 - 日刊工業新聞
富士通のHPCとはいってもA64FX系でもSPARC64系でもなくIntel Xeonで、GPUは使用していないようだ。
一見すると何の変哲もない構成に見えるが、興味深いのはIntel Omni-Pathを採用している点である。
Omni-PathはQLogicのInfiniBand部門を買収したIntelが開発したInfiniBand競合のインターコネクト技術であるが、昨年8月に開発中止を発表しており、普通に考えればそのような製品は採用しないであろうから実に不思議である。
ここからは筆者の推測であるが、Intelの在庫一掃で安価に入手したのではないかと邪推する。
実際、2019年3月にオーストラリアの石油探査企業DUGがHPCを導入する際にも8カ月ほど前に開発中止を発表していたXeon Phi(Knights Landing)のウェハ38000枚分を採用している。
ところで、CPUのみの構成を採用しディープラーニングに触れない点も興味深い。
筆者は気象予想には全く詳しくないが、気象予想は二種類の科学で構成されていると理解している。ひとつが流体力学であり、もうひとつが過去の気象データに基づく予測である。
流体力学は物理シミュレーションのため、数値の型でいえばFP64、精度を落として加速したければFP32の使用が考えられる。そのため、これまでの気象予測用HPCではFP64性能重視だったことは理解できる。
もう一方は過去の気象データで類似している現象に基づいて予測するもので、これはそのままディープラーニングの得意分野である。そして、ディープラーニングではほとんどFP64は使用されずFP32かbFP16で学習・bFP16かINT8で推論して結果を導き出す。
その考え方でいえば、FP64に強い高性能CPUの採用は理解できる一方で、FP32/FP16/INT8に強いGPUの採用がある方が自然に思えるが、あえてGPUが採用されていない点は興味深い。
4G ルーター
私事だが、同僚に4Gルーター(4G CPE)の貸し出しをしたので紹介したい。
新型肺炎=COVID-19に関連して勤務先社で2週間~1カ月の在宅勤務を言い渡された。
…と言っても、私や同僚が中国やイタリアに滞在したというわけではなく、欧州では身近にイタリアに渡航した人がいてもおかしくないはずで、在宅勤務で様子見というのは企業が事業を続けていく上で悪い選択肢ではない。そもそも欧州・米国では日本よりもテレワーク環境が普及している(というか法律で企業に義務付けている場合が多い)ので、突然、明日から在宅勤務となっても困ることは無い。
ところが、同僚の1人がスマートフォンしか自宅にインターネット接続が無いという話だったため、私が個人で所有している4G ルーターを貸し出した。
4Gルーターには、PCと共にホテルやカフェなどに持ち込んで使用する小型・バッテリー搭載のモバイルWi-Fiルーター(欧州ではMiFiとも呼ばれる)や宅内設置型でバッテリー非搭載だが通信性能が高いCPE(Customer Premises Equipment)などが考えられる。
前者は移動先でPCなどでインターネット接続するのに使用するわけだが、後者は自宅や事務所などに設置して使用する。4G/5Gになってブロードバンド並の速度も確保されてきているから、何らかの理由でADSLや光ファイバーによるインターネット回線を引くことができない場合、携帯電話回線を使ったブロードバンドルーターを利用したインターネット接続は選択肢のひとつである。
ところで、モデムは非常に門戸の狭い市場である。現在市場にいるプレイヤーだと端末側は米Qualcomm・韓Samsung・台MediaTek・中HiSilicon(Huaweiの半導体子会社)などである。最近はコモディティ化が進んでいるとはいえ、元を辿ればキャリアとの接続が保証できなければモデムを製品化することができず、言い換えればキャリアはQualcomm製チップセットでしかテストしないので端末メーカーもQualcomm製チップセットを採用するのが安心・安全である。
このため、モデムビジネスに参入しても撤退する企業は多い。2010年に芬Nokiaから事業を買収して参入したルネサスも2013年に撤退しているし(米Broadcomが買収)、2019年に米Appleが買収して話題となった米Intelのモデム事業も元は2010年に独Infineonから買収したものだし、2011年にモデムベンチャー米Iceraを買収して参入した米NVIDIAも2016年に撤退している。
ただし、誰もが持っている携帯電話と違い、4G MiFiやCPEはマーケットもプレイヤーも限定的である。
Huawei・Alcatel(ブランドのみ。中身は中国TLC)・中国ZTEなどが端末を出しているが、Huawei端末のモデムチップセットはHiSilicon製・AlcatelやZTEのモデムチップセットはQualcomm製である。3GまではHuaweiもQualcommチップセットを使っていたのだが、4Gになって自社製品に切り替えた。
私が所有している4GルーターはHuawei B528s-23aでHiSilicon製Balong 722モデムを使用している。
Huawei製というと昨今は情報漏洩リスクを指摘されそうだが、私のインターネットアクセスのほとんどはHTTPS(アプリケーション層)で暗号化されておりルーター(ネットワーク層)で情報を抜くことは困難である(言い換えると、Huawei製スマートフォンを購入する予定はない)。その一方で、Huawei製端末はQualcommチップセット搭載端末よりも対応するバンドが幅広く・高速な製品が相対的に安価で入手できる。