イスラエル・ハイテクベンチャーCEO兼CSの脱&非日本仲間日記

イスラエルの情報科学ハイテクベンチャー会社のCEO兼CSの脱日本&非日本仲間10名が発信する日本への警鐘!

「PEZY Computing スパコンは既に過ぎ去った幻影。実際のPOST-Kプロジェクト、Flagship・2020は2014年から始動している」

2018年03月10日 | 「新」サイエンス&テクノロジー

「PEZY Computing スパコンは既に過ぎ去った幻影。実際のPOST-Kプロジェクト、Flagship・2020は2014年から始動している」


Bushido : 大いなる勘違いの向きが多いから、正しておく。


1.実際のプロジェクト、Flagship・2020

2014年度から開始された文部科学省の「ポスト「京」開発事業(アプリケーションレベルで現在の「京」の最大100倍を目指す。フラッグシップ2020プロジェクト: FLAGSHIP2020 Project)」において、(1)スーパーコンピュータ「京」の後継機であるポスト「京」の開発・整備、および (2)ポスト「京」を用いて重点的に取り組むべき社会的・科学的課題(重点課題)に向けたアプリケーション開発がスタートしており、2016年6月には、萌芽的課題の実施機関が発表されている。プロセッサは、それまでのSUN SPARCから変わって、ARMの「命令セットアーキテクチャ」となる。25年前に、大崎博士が「アーキテクチャーと言うものは、文化的・宗教的背景の産物であり、日本人が世界の標準となるようなアーキテクチャーを生み出すことは難しい」と、POWERアーキテクチャーに関する特別招待講演で語っておられたことを思い出す。あらゆる分野で、それは言えるからだ。大崎博士ご自身はキリスト教徒であり、古典ヘブライ語・古典ギリシャ語の言語から聖書を読まれるお方で、思想性に於いては日本人離れしており、プロとしての実績の数々は控え目な影武者ながらも、傑出しており、文化的・宗教的な違いというものの差を感じさせられてきた。Post-Kの命令セットアーキテクチャーはARMで、キリスト教国の産物である。その前の「京」は米国SUNのSPARCアーキテクチャーであった。正直、妥当なところだ。

理研の計算科学研究機構は、(1)ポスト「京」の開発主体として、その開発・整備を進めており、2020年頃からの運用開始を目指すとしていた。「京」で得られた研究成果や技術、運用経験を活かしながら、汎用性のある世界最高水準のシステムを、アプリケーションと協調的に開発するという趣旨である。それを、所謂、「京コンピュータの次世代スパコンを開発するFlagship 2020プロジェクト」と呼称し、Post-Kと呼ばれるスパコンの開発が行われている。このPost-Kコンピュータについて、理化学研究所(理研)で開催された「New Horizons of Computational Science with Heterogeneous Many-Core Processors February 27-28, 2018」と題するワークショップでの発表の概要を以下に記す。
https://hetero-manycore.riken.jp/symposium2018/program/

尚、Flagship 2020プロジェクトのミッションは、京コンピュータに続く日本のフラグシップスパコンを開発し、社会的、科学的な問題の解決に役立つ広範なHPCアプリケーションを開発して、フラグシップスパコンで実行することで、その為に、Post-Kでは、京コンピュータの時と同様に、各分野で代表アプリを選定し、それらに対して性能が出せるように、アーキテクチャや実装とアプリのチューニングをすり合わせるコデザインを行う。それが特徴であり、また、当たり前の事である。PEZYにはそもそもそうした発想はなかった。アプリケーションには無知であり、試作品を自費負担で貸し出して場所代も払い、デバッグ、と言うよりも欠陥を迂回する「パッチワーク」の如き作業をやってくれるような貧乏人のモノ好きに依存する他ない有様であったから、実用機たり得なかった。


Figure-01:Flagship 2020 Project


Figure-2a:Target and Co-Design_01_Target Science ) Priority Issues


Figure-2b:Target and Co-Design_02_Target Science Exploratory Issues


Figure-2c:Target and Co-Design_03_Basic Design Phase 1


Figure-2d:Target and Co-Design_04_Target Applications


Figure-2e:Target and Co-Design_05_Basic Design Phase 2


Figure-2f:Target and Co-Design_06_R&D Organization


2.LINPACKから現実アプリケーション重視へ

Flagship 2020プロジェクトのミッションは、京コンピュータに続く日本のフラグシップスパコンを開発し、社会的、科学的な問題の解決に役立つ広範なHPCアプリケーションを開発して、フラグシップスパコンで実行することで、その為に、Post-Kでは、京コンピュータの時と同様に、各分野で代表アプリケーションを選定し、それらに対して性能が出せるように、アーキテクチャや実装とアプリケーションのチューニングをすり合わせるコデザインを行うから、ベンチマークがやっとのPEZYとは対照的に所謂LINPACK/HPLといった近視眼的な指標は無意味に近い。

ブログ記事の「くわしい人は知っている.Top500, Green500 の順位はもうスパコン性能の参考にならない」https://note.mu/rings/n/ne8b5a691940cにも指摘されているように、また、Jack Dongarra 自身が同ワークショップで語っているように、https://hetero-manycore.riken.jp/symposium2018/wp-content/uploads/dongarra-0218.pdf

<HPL has a Number of Problems>
(1) HPL performance of computer systems are no longer so strongly correlated to real application performance, especially for the broad set of HPC applications governed by partial differential equations.
(2) Designing a system for good HPL performance can actually lead to design choices that are wrong for the real application mix, or add unnecessary components or complexity to the system.

<Concerns / Limitations>
(1) The gap between HPL predictions and real application performance will increase in the future.
(2) A computer system with the potential to run HPL at an Exaflop is a design that may be very unattractive for real applications.
(3) Future architectures targeted toward good HPL performance will not be a good match for most applications.
(4) This leads us to a think about a different metric.


3.無関係のPEZYの扱い

ワークショップでは、
(1) Large-Scale HPC systems based on Heterogeneous multicore processors
https://hetero-manycore.riken.jp/symposium2018/wp-content/uploads/HeterogeneousManycoreEbisuzaki.pdf
(2)Heterogeneous Many Core Project: Large-Scale Computational Science on Heterogeneous Manycore Computers
https://hetero-manycore.riken.jp/symposium2018/wp-content/uploads/HeteroProjectHimeno20180227.pdf
(3)Realtime simulation of cerebellum
https://hetero-manycore.riken.jp/symposium2018/wp-content/uploads/yamazaki.pdf
といった、PEZYヨイショの「発表」もあったが、整合性の無い締まらない内容であった。

Flagship 2020プロジェクトのミッションは、京コンピュータに続く日本のフラグシップスパコンを開発し、社会的、科学的な問題の解決に役立つ広範なHPCアプリケーションを開発して、フラグシップスパコンで実行することで、その為に、Post-Kでは、京コンピュータの時と同様に、各分野で代表アプリを選定し、それらに対して性能が出せるように、アーキテクチャや実装とアプリのチューニングをすり合わせるコデザインを行う。と宣言しているのであるから、ワークショップで理研名で発表するものは、それに沿った内容であるべきである。そもそも2020プロジェクトでは、PEZYなどとは如何なる関係もない。にも拘らず、詐欺事件を引き起こしたPEZYの欠格品を使った、アプリケーションでのメジャーでないもの同士の協力関係とは何であるのか?私企業同士の関係ならばいいが、国立大(メジャーではない)やら、独法研究機関の人間が関わっているとなると、不純な関係を疑う。PEZYのアプリケーション事例の数稼ぎに加担していたと見なされて当然だ。わざわざPEZYのスパコンなるモノを自分のやってきた「研究に」唐突に使う理由がそもそも無い筈だ。検察当局による金の流れの捜査は拡張されねばならぬ。次世代スパコンに、PEZYなどの存在余地はどこにも無い。


4.POST-Kの概要

このFlagship 2020プロジェクトの開発主体は理研AICSで、実際の開発主体者は京同様に富士通である。また、米国のDoEを始めとして、国際的な協調を行うとしている。


Figure-3a:Project Overview


Figure-3b:International Collaborations

そして、現状は、基本設計が終わり、詳細設計と実装に入っている状態である。CPUのアーキテクチャとしては、Arm V8とArmのSVE(Scalable Vector Extension)を採用することを決め、シミュレータやコンパイラを使って性能評価を行っている。ここで、「命令セットアーキテクチャ」と「マイクロアーキテクチャ」について触れておく。「命令セットアーキテクチャ」とは、単純化すればハードウェアとソフトウェアのインターフェースと言える。同一の命令セットアーキテクチャのプロセッサでは、OSが同一であれば同じソフトウェアが走るのは当然である。arrowsやiPhoneといったスマートフォンには、ARM命令セットアーキテクチャのプロセッサがよく使われており、パソコンでは、殆どがx86命令セットアーキテクチャのプロセッサで、サーバ用プロセッサではより様々な命令セットアーキテクチャが使用されている。IBMではPOWER命令セットアーキテクチャのプロセッサを開発し、そしてインテルやAMDはx86命令セットアーキテクチャのプロセッサを、また、富士通やオラクルのSPARC命令セットアーキテクチャのプロセッサを、といった具合である。同様に、スパコン用プロセッサも様々である。

ここで重要なことは、「命令セットアーキテクチャはハードウェアとソフトウェアのインターフェースを定義しているだけで、プロセッサの内部構造は関係ない」ということである。内部構造は各プロセッサ毎に異なる。例えばIBMのPOWER命令セットアーキテクチャーでは、それによる様々なプロセッサ、汎用、ゲーム機、組み込み系からスーパーコンピューター向けまでを開発しているが、内部構造は各々異なる。このプロセッサの内部構造を「マイクロアーキテクチャ」と言う。マイクロアーキテクチャはプロセッサの特性、性能や信頼性を決定付けるから、プロセッササプライヤーにとっては重要なコアテクノロジーとなる。PEZYに関して言えば、「命令セットアーキテクチャ」も「マイクロアーキテクチャ」も、全く不明である。端から実用にはならぬ。

POST-KのCPU「命令セットアーキテクチャ」は、前述のようにARM V8に拠り、SVEも採用する。SVEは、特定のベクトル長を指定するよりは、CPU設計者が自分達のアプリケーションや市場にベクトルレジスタ当たりの最も適したベクトル長を128ビットから最大2048ビットまでの範囲で選択できるようにし、SVEはまた、有効なベクトル長に適応可能なvector-length agnostic (VLA)プログラミングモデルをサポートしている。VLAパラダイムの採用によって、一旦SVE用にプログラムをコンパイルまたは手書きすれば、将来より長いベクトルが現れた際に再コンパイルや書き換える必要無く、異なる実装性能の上でも実行させることが出来、これはアーキテクチャのライフ期間における開発コストを削減するもので、プログラムが正しく動作し、より広く、より高速に実行することに資する。

科学的ワークロードは伝統的にOpenMPプラグマや他のソースコード・アノテーションを注意深く使用して、データレベルの並列度をできるだけ上げるように慎重に記述されている。そのため、コンパイラにとってこのようなコードをベクトル化し、より広いベクトル・ユニットを十分に活用することは比較的容易であり、スーパーコンピュータは、より長いベクトル・ユニットに供給するのに必要な広帯域幅のメモリ・システムを使って構築されているので、SVEはより望ましい。


Figure-4a:POST-K Overview


Figure-4b:ARM SVE(Scalable Vextor Extention)


Figure-4c:ARM SVE 例

Kの中核である米国SUNのSPARCはオープンアーキテクチャであるがサポータが少なく、SPARC Linuxは富士通が開発せざるを得ない状況に成っている。これをARMアーキテクチャに変えることにより、Linuxはコミュニティのものが利用でき、将来的にはスパコン向けのSVEのサポートもコミュニティで行ってくれる可能性もあるというのが富士通の期待である。

そして、インターコネクトは、京コンピュータで開発したTofuインタコネクトの改良版を使用し、高いメモリバンド幅と理研や富士通のシステムソフトウェアと組み合わせて、バランスのとれたシステムを実現するとしている。

Post-Kシステムのハードウェアは、マッシブ・パラレル・プロセシング(「メニーコア」という単語は筆者は好まぬから、Massive Prallel Procxessing と書く)のプロセシングノードを6方向のメッシュトーラスネットワークで接続する。チップ動作の高度化や、ネットワークのバンド幅が向上されるのは当然であるが、基本的な大まかな考え方は京コンピュータと大差は無い。

ストレージは3レベルとなり、京コンピュータと比べると、SSDの層が追加されている。高バンド幅を持つ、SSDの追加は最近の傾向に沿ったものである。

Post-Kは、GPUなどのアクセラレータは搭載しない。米国の次期フラフシップスパコンであるSummitが、NVIDIAのGPUを搭載するのとは考え方が異なる。

また、CPUチップは、48+(2または4)コアである。48コアが計算コアで、それにLinux OSを動かしてファイルIOやネットワークでの通信を行う2または4コアが追加される。12個の計算コアに1個の制御用コアから成るグループが4個あり、それぞれにメモリが接続されている。そして、4個のグループをNoC(Network on Chip)を介して接続する構造になっている。

現在、TOP500 1位の中国の太湖之光スパコンのSW26010チップでは、256コアが軽量のインオーダ実行の計算コアで、4コアがアウトオブオーダ実行の制御用のコアとなっている。より微細な半導体プロセスを使うPost-Kチップが52コアしか集積しないという理由は、PEZY-SCのような数稼ぎの低機能で軽いコアではなく、ヘビーな計算能力を有する高性能コアを使うからである。

そのような高性能コアを使うので、制御用のコアを区別する必要はなく、全部が同じコアを使う。つまり、物理的にはホモジニアスなマルチコアチップで、使い方で計算コアと制御コアというヘテロジニアスな構造で使用することになる。

「高機能重量級」のアウトオブオーダ実行コアを計算コアとして使う京コンピュータは、HPLを実行するTOP500では10位に下がったが、メモリバンド幅が効くHPCGベンチマークや、グラフ処理のGraph500では世界の1位をキープしており、実用アプリの実行性能では高いランキングにある。既に、実アプリの性能との相関が下がっていると言われテ久しいHPLではなく、指標として選択したアプリケーション群の性能を向上させるには、低機能軽量コアよりも高性能コアだけを使う方が良いという判断と思われる。

更に、ファイルシステムにはSSDの階層を追加し、3階層のストレージをサポートするファイルIOミドルウェアを開発する。

FP16について。半精度浮動小数点は 16 ビットの浮動小数点値で、従来の 32 ビットの単精度浮動小数点のサイズの半分。(Binary16 IEEE754-2008 標準規格)、Float16、FP16、または単に Half-Float とも呼ばれる。サイズが半分なので、単精度や倍精度浮動小数点と比べると、半精度浮動小数点の範囲は小さく、精度も低くなル為に、計算には適していないと一般に考えられているが、half-float は 32 ビット float の半分の容量と帯域幅しか必要としないため、精度がそれほど重要ではない場合に浮動小数点値を格納するのに適している。さらに、8 ビットまたは 16 ビットの整数型と異なり、半精度浮動小数点はダイナミック・レンジを持っており、0に近い浮動小数点値の精度は比較的高く、0から遠い整数の精度は低くなりなる。


Figure-5a:富士通設計CPU及びTofu


Figure-5b:FP16

ソフトウェアでは、マルチカーネルのOSを採用する。1つは汎用のLinuxで、もう1つの計算ノード用のMcKernelは、理研AICSで開発して搭載する。フル機能のLinuxはタイマ割り込みやI/Oからの割り込みなど多くの割り込みが発生し、その都度、割り込み処理が走るので、実行時間が一定しないために、全ノードで同期して計算を進めるスパコンでは、一番遅いノードに引っ張られて性能が下がることになり、このため、計算ノードには割り込みなどが殆ど発生しない軽量カーネルを使うのである。SIMD(Single Instruction, Multiple Data)演算幅は、512bits。SIMD演算を使うコンパイラは、富士通が開発するが、このコンパイラは、ARM C Language Extensions(ACLE)をサポートしており、SVE命令をC言語から使用することが可能になっている。


Figure-6a:プログラミング環境


Figure-6b:プログラミング環境


Figure-6c:プログラミングのパフォーマンス評価環境


Figure-7a:SIMDプログラミング


Figure-7b:ACLEとの比較



Bushido (narmuqym, 旅するベテラン, invisible-force, Hetero, MASADA, rainbow, weather_F, anti-globalism, geno_computing, Bushido)
================================
  国際的にビジネスを行ってきたハイテク関係者のグループとして、警鐘を発信する。時事的な問題や長期的観点での警鐘に留まらず、趣味的な事柄まで幅広くメンバーの自由な意思でWebLog掲載することにした。メンバーのプロファイルは以下の通りである。

  narmuqym:HP&SUN研究所を経て、米国にハイテクベンチャー設立。最先端ニューラルMPUの研究開発を推進。現在はイスラエルのハイテクベンチャーのチーフサイエンティストに就任。知能の情報処理の根源を研究している。

  旅するベテラン:東芝中央研究所、半導体事業所にて高密度メモリーのプロセス及びデバイス開発に従事するも、バブル崩壊により全滅の定まった日本の半導体業界を去り、韓国サムソン中央研究所にて、韓国半導体技術を育成指導。現在は台湾の最大手半導体会社にて、高付加価値半導体事業を統括、取締役。

  invisible-force: ウイスコンシン大学、イスラエル工科大学教授。細胞内量子論的化学物理過程の情報処理、核外化学構造体の情報、DNA合成、大腸菌内DNA置換、動物細胞内DNA置換、神経細胞の情報処理、知能と学習などの研究に従事。イスラエルのバイオハイテクベンチャーCEO。

  Hetero:ベル研究所にて化合物半導体物性、超高周波デバイス、マイクロ波集積回路の研究開発に従事し、世界初の衛星放送システムを開発。レイセオンにて巡航ミサイル飛行制御システムの開発、イージズ艦戦闘情報処理&アタック制御システムの開発に従事後、イスラエルにハイテクベンチャーを設立。情報デバイド解消型の新型情報端末の研究開発に取り組む。

  MASADA:日電にて衛星通信システム、超多重無線伝送方式、通信路確立制御方式の研究に従事後、米国のATTに移り携帯電話システムの研究開発、その後次々世代MM携帯電話方式を完成。シリコンバレーにてハイテクベンチャーを興し、通信大手を圧倒している。

  rainbow:ウエスチングハウスにて原子力発電の研究開発に従事、その後GEにて新しいエネルギー変換方式の研究、各種発電方式の研究に従事。その後、シリコンバレーにハイテクベンチャーを興し、超低コスト新型太陽電池の研究開発を推進。その後、太陽電池・風力は永遠に採算の取れない環境破壊の元凶であると喝破し、コンパクトな自律原子力発電方式の研究開発に戻る。

  weather_F:スタンフォード大にて環境気象及び資源の代替化を研究。気象センターにて地球規模大気循環シミュレーション、環境変動の研究に従事した後、ミニマム生活を提唱するNPOを設立し、代表として啓蒙活動に取り組む。

  anti-globalism:ハーバード大準教授後、日・イ間のハイテクベンチャー協業支援、事業戦略支援会社を日本とイスラエルに設立、妻は日本人。現在はハーバード大ビジネススクール教授。

  geno_computing:モスクワ大学・分子生物学教授を経てイスラエルに移住。テクニオン教授を経て遺伝子工学のベンチャー設立。DNAによるコンピューターの研究をメインに新しいセンサーによる次世代シーケンサー及び解析ソフトウェアを開発。

    Bushido:日立中央研究所にてRISCプロセッサー及びDSP、また画像処理システムLSIの研究開発に長年従事し、古い友人の大崎博士には様々に感化を受け、国際的視野に立っての仕事をすべく、日立中研を退社してサムソンに招かれ、現在サムソン電子の終身フェローの立場にあり、イスラエル・ハイファにて、自由な立場で異分野も含めて新しい発想にチャレンジ。MASADAとは剣道仲間。5段。
================================



この記事についてブログを書く
« 「PEZYスパコン詐欺事件... | トップ | 「大崎氏の意見:PEZY-SC2が... »