教団「二次元愛」

リアルワールドに見切りをつけ、二次元に生きる男の生き様 (ニコニコでは「てとろでP」)

NVIDIA製GPU - Volta の懸念点

2013-05-29 00:12:23 | 科学


NVIDIA,製品ロードマップを更新。次次世代GPUアーキテクチャ「Volta」と次次世代Tegra「Parker」の概要が明らかに
http://www.4gamer.net/games/120/G012094/20130320001/



2か月前の記事でいまさらだが、気がついたことがある。
NVIDIAの次次世代GPU、Volta についてだ。

Voltaのいちばんのポイントは、上に示すようにStacked DRAMになっている点だ。
もちろんNVIDIA側もいの一番にこれに言及したようである。
(ちなみにアーキテクチャ上の改善点はわたしにはよくわからんw)

しかし!

これ、別に新しい概念ではない。
TSV(Through Silicon Via:シリコン貫通VIA)の応用例としてずいぶん前から言われていたものだ。

これは実現可能なのか?

できるかできないかで言えば、TSVは余裕でできる。
GPUに限らずStacked DRAMのプロセッサも余裕でできる。
そしてCPUよりもさらに帯域を要求するGPUのほうがさらに向いている。

だったら今すぐやればいいんじゃね?

誰だってそう思うところだが・・・。
この技術がほとんど実用化されなかったのには理由があるからだ。



① 熱と電源のトレードオフ

GPUの上に他のchipを積層すると、その分ヒートシンクまで離れてしまうので、熱抵抗が上がる。
すなわち冷えにくくなる。
ということは、今までみたいな3桁ワットなんてchipにこれを使うのは非実現的だということだ。

これ、ほんのちょっとの厚みじゃないかと言うヤツがいるかもしれない。
だが、シリコングリスの塗りかたがヘタクソだと温度上昇が激しくなるというくらい違うんだから、これ直観に反してけっこうシャレにならない度合いなのだ。

NVIDIAはその世代になったら3桁ワットなんてGPUは絶滅していると考えているのかもしれない。
ならそれでいいんだけどさ。

実はそうではないやり方もある。
GPUをいちばん上に重ねる方法だ。

たしかにこれなら熱抵抗は問題ない。
しかし、GPUが消費するとんでもない大電流(今のハイエンドのGPUならピーク性能で軽く100A超えるはず)を供給できるようなTSVその他もろもろを作らなければならなくなり、どっちを選んでも問題を抱えることになる。
(ちなみにNVIDIA発表の絵はそうはなってはいない)



② KGD問題

KGD(Known Good Die:良品だとわかっているダイ)のDRAMを供給できるかどうかという問題がある。

半導体は、パッケージングした後、試験し、不良品をはじいて出荷する。
なぜパッケージングした後に検査するのかというと、半導体がむき出しの状態(ダイのまま)では検査しにくいからだ。
だからダイの状態では、普通は全く試験しないか、パッと見で明らかに不良なものをさっさとはじく目的でのちょっとだけしか試験しない。

だが。
Stacked DRAMをしようとすると、DRAM屋さんからパッケージング前のDRAMをよこしてもらう必要がある。

ということはどういうことかというと・・・。
試験しにくいベアダイの状態でちゃんと試験した、特別な検査工程を通過させた、しかし性能面では特に良くなってもいない、そんな値段だけ高いKGDのDRAMを使うか。
もしくは、一定の確率で不良が混入してもかまわんという前提でDRAMを使い、全体をパッケージングした後で試験し、スタックしているn個のchipのうちどれか1個でも不良だったら全体が不良という判断になってもいたしかたあるまいという判断にするか。
・・・という、どちらを選んでもコストアップになる嫌な選択をせざるを得なくなる。

とはいっても、ひょっとしたら実用上問題ない可能性もある。
TSMCの最先端プロセスでデスクトップ用GPUのような大きなchipを作ると歩留りはすこぶる悪いのかもしれず、DRAMがKGDではないことに起因する歩留り悪化など物の数ではない、なんてこともありうるかもしれない。
また、もともとDRAMは一定確率で内部に不良が出ることを予め想定して設計されており、製造時に内部の不良が一定量以下であれば、その部分を切り離して救済回路につなぎかえて出荷しているのだが、その救済をGPU内のアーキテクチャが受け持つように工夫しているのかもしれない。

DRAMのベアチップならKGDを提供できるのかもしれないが、デスクトップ用のCPUやGPUみたいな電力食う(つまり激しく発熱する)ヤツをベアチップの状態でKGDだと言えるほどちゃんと試験するのは無茶ぶりがすぎる気がする。
その意味でもパッケージングした後で検査して不良だったから捨てるchipがバンバン出るようなことになりやすい。

まあこれは①のように熱か電源かのトレードオフではなく、コストアップさえ許せば実現可能な問題なので、そのコストアップを上回るメリットがあればやるという判断はありえる。



③ TSVが高価

TSVのDRAMなど既に実用可能である。
エルピーダにしろ、今すぐよこせと言われれば喜んでサンプル提供するだろう。

だが。
使われない。

なぜか?

それはTSVのプロセスを通すとコストアップが甚だしいからだ。

なぜコストアップが甚だしいかというと、シリコンに貫通で空けたデカくて細長い穴(とはいっても直径数10um程度)にメッキを充填するのに時間がかかるからだ。
プロセスに時間がかかると、その製造装置で生産できる物量が減るわけで、ようするに製造装置をたくさん揃えなければならなくなり、製造コストに減価償却費がどんどんのっかる。

まあこれも値段だけの問題なので、コストアップを上回るメリットがあればやるという判断はありえる。
1個200円のDRAMでTSVにするだけで40円コストアップになりますと言われれば大概嫌な顔すると思われるが、定価1万円のグラボならそれ10個使っても許されるかもしれない。



まとめ。

NVIDIAがVoltaで採用しようとしているStacked DRAMは新しい技術ではない。
やればできる。
今までほとんど使われなかったのには理由があり、Voltaで実用化できるかどうかはそこをどうするかにかかっている。