ALH84001

私的コラム&雑記(&メモ)

今週の興味深かった記事(2019年 第14週)

2019-04-07 | 興味深かった話題

筑波大Cygnusスパコン

筑波大がFPGAを本格使用するCygnusスパコンの運用を開始 - マイナビ

 筑波大がFPGAを搭載するスーパーコンピューターの運用を開始したらしい。Top500で日本国内2位に入るOakforest-PACSも筑波大と東大であるが、Oakforest 8208ノードに対しCygnusは78ノードしかないから性能的な優位性はなさそうだが、CygnusにはIntel/Altera Stratix10 GX2800 FPGAを搭載したAlbireoノード32ノードを含んでいる点が特徴と言える。

 ここ数年、FPGAをデータセンターに持ち込むというアイデアが盛んであるが、個人的には一般化する気がしない。
 例えばスーパーコンピューターというかクラスターにFPGAを組み込んだ例はMicrosoft Project CatapultでFPGAをBingの検索に取り込んだ例が比較的記憶に新しいところであるが、これはGoogleなどの例を見ても検索アルゴリズムは変化するので、ASICでの実装よりもCPU/GPUでソフトウェア実装するかFPGAでハードウェア化する方が柔軟に対応できることは理解できる。また、日本国内でDwango/Niconicoが実際に行っているようにNiconicoやNetflixのような大手ビデオストリーム配信事業者が動画処理をFPGAで行うことも理解できる。
 しかし、FPGAで実装となるとハードとソフトの両方の開発が必要になるケースが多いだろうし、以前はハードウェアが乏しかった機械学習も揃ってきているため、NVIDIA GPU + CUDAとかGoogle CloudTPU + TensorFlowといったメジャーな方式の方が低コストで性能も十分なケースは多そうに思う。実際はというと、Stratix10 GX2800を検索してみるとFPGA単体で$6000・ボードに搭載されたもので$8000~となっているが浮動小数点演算性能は9.2 TFLOPSに過ぎないのに対し、NVIDIA Tesla T4だと最大65 TFLOPSで$2000~といった具合である。この価格差・性能差を許容して強いてFPGAを使うことにメリットを見出せるのがMicrosoftのような大企業しか存在しないと思う。
 もっとも、筑波大はスーパーコンピューター運用者である以前に教育機関・研究機関であるし、さらに、GPUを搭載したDenebノード46ノードを含んでいることからも上述のような「GPUの方が一般的には使いやすい」ということは承知しているということなのだろう。

 ところで、筑波大のGPUが苦手とする局面というスライド「独自の通信機能を持たない」とあるが、これを補うのがNVIDIAによるMellanox買収であろう。個人的にはGPU間でノードを跨いで通信するケースはスーパーコンピューターなどの極めて限られたマーケットでしか想像できないのであるが、NVIDIAは科学演算向けのTeslaとグラフィックス向けのGeForce/Quadroを分化し始めており、例えばVoltaは科学演算用でしか登場しなかった。もしNVIDIAがTeslaの専用設計化を推し進めるようであればMellanoxのノード間通信技術の取り込みなど、さらにFPGAの優位性が覆されていくことになるのではないだろうか。

Arm IPのMachine Learning性能

Armが見据える半導体の未来 - マイナビ

 個人的に興味を持ったのは顔認識(Face Detection)による端末アンロック(Face Unlock)の箇所で、Cortex-A75などのCPU IP群やArm NPUに加えMali-G52などのGPU IP群が示されている点である。これらのIP製品が機械学習に対応していることは以前から示されていたが、性能をグラフ化したものは初めてではないかと思う。

 $1000クラスのスマートフォン、例えばiPhoneやGalaxy Sシリーズに搭載されるA12やSnapdragon 855などのプロセッサーは半導体にコストをかけられるため専用NPUを搭載できるが、$100~200クラスのスマートフォンではコスト増加は許容できないだろう。しかし既に搭載されているGPUを流用できるのであれば話は簡単である。
 Arm GPU製品ではMali-G31/G51/G71以降ではArm NNに対応していて機械学習のフレームワークを利用できることは以前から知られていたが、Mali-G52がCortex-A75より高速というのは興味深い。例えばサブ$200クラスのスマートフォンに搭載されるMediaTek P30の場合Cortex-A53 8コア・Mali-G71 MP2という構成で、既存のMali GPUを使って顔認証を行うことも原理的には可能ということになる(スマートフォンメーカーが実装するかはともかく)。

日本のEUV周辺技術開発企業「EIDEC」が解散

日本のEUV周辺技術開発企業「EIDEC」が解散 - マイナビ

 どの程度の資金(とりわけ税金)が投入されたのか不明だが、個人的には無駄金だったとしか思えない。かつて日本の電機メーカーーーソニー・パナソニック・三菱・日立・東芝・サンヨーなどーーはいずれも自社で先端半導体部門と自社工場を抱えていた。これらが1990年代以降の不況期を通して統廃合された結果、現在でも残っているのは、既に日本企業とは言い難い東芝メモリーとパナソニックのみであり、いずれも28nmより微細な先端プロセスは保有していない。

 この辺りの世界的な流れはこの辺りを見れば一目瞭然で、2000年頃の180nm世代プロセスで世界で28社あったのが2011年頃の32nm/28nm世代プロセスでは僅か8社となっている。これ自体は世界全体で共通の流れなので日本企業の問題というわけではないのだが、180nm世代で28社中10社と1/3を占めた日本企業が32nm/28nm世代ではパナソニック1社になっているという全滅ぶりである。
 もちろん、日本企業が半導体を製造しなくなった現在でも、シリコンウェハーや半導体製造装置などのかたちで先端半導体に携わる日本企業は多数存在するが、例えば露光装置に関して言えば7nm世代で導入の始まったEUV露光は蘭ASML(露光装置メーカー)と独Carl Zeiss(光学レンズなどを提供)の独占状態でニコン・キヤノンは既に蚊帳の外となりつつある。

 そして本件EIDECが設立されたのが2011年1月に対し、32nm/28nmが登場したのが2010年のことである。つまり、EIDECは日本企業がそれを必要としなくなった時点で設立されたことになる。本当に必要だったのだろうか?

Comment