ALH84001

私的コラム&雑記(&メモ)

今週の興味深かった記事(2019年 第30週)

2019-07-27 | 興味深かった話題

AppleがIntelのモデム部門を買収

Apple、Intelのモデムチップ部門買収へ - ITmedia
Apple to Buy Intel’s Modem Business for $1 Billion - EETimes

 この取引はAppleにとっては三重の意味でメリットがある

  • Qualcommはモデム採用ベンダーに対しモデムチップの価格に加え特許使用料を徴収しており、Appleの場合は四半期ごとに$150M-$250Mと見られていた。Appleは既に保有する特許にIntel(旧Infineon)の特許を加えると保有特許は17,000件超に達し、特許料の一部を相殺することができる
  • AppleはAシリーズプロセッサーを内製しているが、モデム技術を持たないため外付になり、モデムを持つ競合他社(Qualcomm・Samsung・MediaTek・Huawei)に対しコスト・フットプリント(基板上の設置スペース)・消費電力で不利になっている。これらの問題を改善できる。Intelモデム部門は5Gモデムの開発に成功していないが、4Gモデムを内蔵・5GモデムのみQualcommから調達という選択肢を持てる
  • IoTではすべての機器にWi-Fiやモデムが搭載されることになるから、自社製品にモデムを統合可能になることは有利。IoT機器では通信速度は求められないからIntelが開発済の4Gモデムや派生品を流用できる可能性がある

もっとも、7月の買収発表ではAシリーズプロセッサーに4G LTEモデムが内蔵されるのは早くとも2021年登場のA15以降になるだろう(※通常のスケジュールでは既にA13は量産・A14はそろそろテープアウトするはずである)。

 ところで、Appleが買収に費やした$1Bという金額であるが高いのか安いのか解り難い。IntelはInfineonからモデムを買収する際に$1.4Bを支払って買収・さらに富士通からトランシーバーを買収(買収価格は非公開)しているから、価格としては割安にも見えるが、同部門は4月に5Gモデム開発放棄を発表し、(1) 今後5Gモデムの開発に成功するか不透明 (2) 人材の流出の懸念があるから、簡単には評価が難しい。
 しかし、上記の1~3点目を鑑みれば、特許料の支払い額を減額できるうえ、自社製品のコストダウンも行えるから長期的に見れば十分に元が取れそうに見える。モデムは難しいビジネスで、実装するための関連特許が膨大なこともあるが、仮に実装しても携帯電話会社の接続試験を通過しなければ携帯電話会社の販売する端末には採用してもらえない。

DRAM価格

God DRAM you! Prices to slide more than 40% in 2019 because chip makers can't forecast - The Register

 日本・韓国政府間のいざこざで注目を集め、にわかに価格高騰騒動が巻き起こった(※地域限定)DRAM市場であるが、世界水準で見れば一過性のもので、DRAMスポット価格は下落を続けている。DRAMモジュール価格は一時的に10%強ほど上昇したものの一段落した状況である。

 そんな中、Gartnerが出したのが2019年は供給過多でDRAMの価格が40%下落するというものである。もっとも既に2019年も半ばであるから今から42.1%下落するという意味ではないし、年初より2019年中は下落することが報じられていたから順当な内容である。報道各社は価格高騰を煽る記事を書いているが、フッ化水素等の半導体材料の輸出が問題となるのも影響は限定的(韓国メモリーベンダーの中国工場のみ)なので予想から大きく逸脱することは無い。
 ちなみにDRAM eXchangeのインデックス=DXI(株価における日経平均やDawJonesに相当)を指標とすると、7月9日までの過去半年で25869から17202まで既に34%も下落していた。7月10日から大きく反発したものの4月後半並の水準まで戻したものの、7月19日以降は再び下落を続けている。同様のペースでいけば11月頃には7月序盤の水準に戻り年末頃までに通年で40%前後の下落となるのは不思議な話ではない。もっとも、メモリーのスポット価格とはDRAMチップのトレーでの取引価格なので、一般消費者のDRAM DIMMモジュールの価格に何時反映されるかについては予測はつかない。

 ちなみに、個人的にDDR4 DIMMを購入するか迷っていたのであるが、価格の反発も一段落したので当初の予定通りBlack Friday/Cyber Mondayをターゲットに購入することとしたい。

AIハードウェア

VLSIシンポジウムが「AIハードウェア」シンポジウムになる日 前編 後編 - PC Watch

 記事中で説明されている内容は興味深いとは思うのだが、個人的には「VLSI」と違い「AIハードウェア」が注目を集めるのは一過性のトレンドということで永遠に続くわけではないと認識している。

 昨今、コンピューターのパフォーマンスの伸びが鈍化してきていると認識されている。CPUを例にとると、かつて4年毎に設計が刷新されて18~24ヶ月毎にパフォーマンスが倍に向上していたが、Intelの最新プロセッサーは2016年に登場したコアを1プロセッサーあたりの2倍に増やしただけに過ぎない。コア数を倍に増やすと理論上の最高性能は2倍になるが、そのようなワークロードは稀のため経験的には1.2~1.4倍程度にしか向上しないことが知られている。36ヶ月でパフォーマンスは1.4倍にしかならなかったわけだ。

 このような背景でAI≒ニューラルネットワーク/ディープラーニングが盛り上がっているのは以下の理由だと理解している:

  • CPU性能の成長鈍化に伴い、一部でドメインスペシフィック(特定分野向け)半導体が脚光を浴び始めているものの、特定業種向けの特殊なプロセッサーの製品化に難しさがある。例えばIBMは金融機関で重宝されるメインフレーム/UNIXサーバー用に十進数演算ユニットを実装しているし、富士通はアニーリング用ハードウェアを実装しているが、ユーザーもニーズも限定的で採算がとれると判断できなければこれらのハードウェアは製品化しにくい。多くの分野で使用できる柔軟性と既存のCPU・GPU以外のプロセッサーとは異なる特徴を両立したプロセッサーとしてニューラルネットワーク用プロセッサーが注目を浴びている
  • 仮想通貨のマイニングとは異なり、従来のハードウェアでは処理が難しい。例えばCPUやGPUで実装されているSIMD演算ユニットなどは一次元のベクトルである(例えば座標はx,y,zだし、色はr,g,bである)が、これに対しディープラーニングは大量のデータを二次元のマトリックスで処理する。もちろん、一次元の演算を複数回実行することで二次元の演算は行えるが、一括で処理可能なハードウェアがあればアドバンテージを取れる可能性はあり、新興国や新興企業にもチャンスがある。
  • 上記とも関係するが、データ精度が過去のトレンドと異なるのもポイントであろう。ディープラーニングが普及する前の2010年以前のHPCなどでは科学演算における倍精度浮動小数点演算(64-bit・FP64)性能が重視されたが、これがディープラーニングでは精度よりもデータ量・演算量が重要となることから、データの圧縮のため、にわかに半精度浮動小数点(16-bit・FP16)が使われ始めた。但し、各社共、最適なハードウェアアーキテクチャーやフレームワークを探っている状況でGoogleに至ってはFP32との変換の容易さからBrain FP16(bFP16)を定義したぐらいである。
Comment

今週の興味深かった記事(2019年 第29週)

2019-07-20 | 興味深かった話題

Qualcomm Snapdragon 855 Plus

Qualcomm、GPU性能が15%向上した「Snapdragon 855 Plus」- PC Watch

 想像だが、これはSonyやOnePlusなど年2回のサイクルでフラッグシップ機をリリースするベンダー向けの対応ではないかと思う。現状では連続する2機種は同一のプロセッサーを採用している(例:OnePlus 6とOnePlus 6T、Xperia XZ2とXperia XZ3)。
 もっともこれは、かつてQualcommはSnapdragon 800/801/805・820/821と半期毎にハイエンドプロセッサーを出していた時代があり、Sonyなどの一部スマートフォンベンダーが当時のQualcommの製品サイクルに合わせていたという方が正しい。Qualcommからすれば同じ設計・製造過程で製造した製品を選別するだけで新しいSKUを作ることができ、スマートフォンベンダーからすれば前世代機種との差別化ができるからwin-winだといえる。

メモリーの値段の話題

DDR4メモリ、じわじわ広がる値上がりや購入制限の動き - ITMedia
韓国への輸出規制の背景に見え隠れする中国の国家戦略 - アゴラ
サムスンはなぜ中国からフッ化水素を調達したのか? - アゴラ

 コンピューターの主記憶として一般的なDRAMメモリー・SSDや可搬型メディアに用いられるNANDフラッシュの大部分は韓国企業によって製造されている(DRAMNAND)。いずれも首位はSamsungでSK HynixもDRAMで約30%・NANDで約10%のシェアをもっている。ちなみに、この分野のプレイヤーが重複するのは製造設備が共通化できるからである。逆にCPUやGPUに用いられるロジック用製造プロセスとメモリー用製造プロセスとでは製造設備が異なる。また、Samsungは両方を手掛けている。

 実は今年は米国による対中貿易制裁もあってメモリーの供給過多・値下がり傾向で、数カ月前の時点では2019年中はこの基調が続くものと考えられていたが、日本の対韓国向けフッ化水素の輸出に関する問題で、にわかにこの見通しに暗雲が立ち込めてきている。
 市場は韓国勢がDRAMで72%・NANDで40%もの供給量を占める寡占状態にあるため、仮にSamsung・SK Hynix供給分の減少は市場への影響が非常に大きい。実際には、メモリーベンダーおよびメモリーモジュールベンダーの過剰在庫・米Micron・米Western Digital/日Toshiba連合も生産設備を増強中・かつ日本から韓国への「非ホワイト国」扱いで個別輸出許可での輸出も再開することを考えれば即座に価格が上昇するとは考え難いが、既にCorsair・G.SkillなどゲーミングPCで大手のメモリーモジュールベンダーが受注停止という話もあり様子見といったところではないかと想像する。
 もっとも、メモリーモジュールの供給量で実際に主流であるDell・HP・Lenovoなど大手PCメーカー向けとなるメモリーモジュールはSamsung製・Micron製・SK Hynix製といった純正メモリーかKingston製が大半を占め、Samsung・SK Hynixなどは三ヶ月分程度の在庫を抱えているともいわれるから、これらのベンダーにCorsair・G.Skillのリアクションが当て嵌まるかどうかは分からない。ただし、Samsung・SK Hynixが大口顧客以外への供給量を絞る判断もありえる。とにかく現時点でメモリーのスポット価格は上昇している

 アゴラ7月17日の解説によると、韓国が非ホワイト国扱いになることで、(1) ホワイト国だった時点での横流しは合法 (2) 非ホワイト国でも韓国国内での使用について個別輸出許可での輸出は合法、ということだそうで、影響を受けるのはSamsung・SK Hynixでも中国工場におけるものに留まりそうだ。これはもちろん両社にとって減産を余儀なくされるだろうが、DRAMの7割・NANDの4割に相当する供給が止まるというような事態ではないということである。

 ちなみに横流しということで、今回のフッ化水素の輸出制限の問題で中国・北朝鮮への横流しが話題になることがあるが、どうやら横流しはSamsung・SK Hynixの中国工場への再輸出ということのようで、中国内の他の半導体企業向けの話は出ていないし、北朝鮮に至っては日本製の高純度フッ化水素の使い道がない。
 また、中国の半導体ということでHuawei/HiSiliconのプロセッサーなどへの影響を口にする人もいるが、私の知る限り同社のKirinプロセッサーは台湾TSMCでの製造のため今回の件とは無関係である(というか、それを製造できるような先端工場は中国内には存在しない)。

 ところで、個人的にはRyzen 3000シリーズを想定してDDR4 3200~3600あたりのメモリーをBlack Friday/Cyber Mondayを目途に入手するつもりでいたが、前倒しするかもしれない。5カ月近くも先であるから状況は一段落していそうであるが、Samsung・SK Hynixが減産すると想定すれば、現在より価格が大きく下がっているとも思えないが上がっているリスクはある。
 この問題が私のような自作PCユーザーにとって悩ましいのは、Ryzen 3000のようなCPUについてメーカーが実質的に高価なオーバークロックメモリーを推奨している点にある。例えばAMDはRyzen 3000でDDR4-3600 CL16を推奨しているが、JEDECの規格はDDR4-3200まで・現存するJEDEC準拠のメモリーモジュールはDDR4-2400あたりが主流でDDR4-3200は選別品でラインナップが限定されている。

Libra

「リブラに全財産預けられますか?」Facebook責任者の答えは ~米国上院の公聴会一問一答 - 仮想通貨 Watch

 知れば知るほど、なぜLibraサービスで扱う通貨がLibraであって米ドルや欧ユーロでないのか、なぜ企業Libraは銀行でないのか理解ができない。もしFacebook社員がLibraに全財産預けられるのだとすれば、その信頼性はどこから来るのか?その信頼性を中国・ロシア・イランなどの米国政府と対立する国々の人々が利用できることに問題は無いのか?といった疑問を感じる。

 LibraがBitcoinと違い価値が安定するのは通貨バスケットによるものだが、通貨バスケットは米ドル・欧ユーロ・日本円など基軸通貨に信頼性を依存しており、言い換えれば安定性に関しての「Libraは信頼できる」ということは基軸通貨が信頼できるという意味でしかない。この信頼性に発展途上国の人々が便乗することに問題は無いのかと懸念する。

 Libraの用途については記事中にある通り、銀行口座を持っていない17億人の人々(世界銀行のデータ)に決済手段を提供できることが含まれるが、その銀行口座を持っていない人々は主に通貨が不安定な発展途上国の人々である。その発展途上国のユーザーと基軸通貨に裏打ちされたLibraの信頼性とは相容れないものではないのか。
 例えばベネズエラは2017年1月から18年1月までの1年間でインフレ率2616%を経験し、国家が主導する世界初の仮想通貨「Petro」を発行・2018年8月に10万分の1に切り下げるデノミを実施したが、同様な事態は有名どころではトルコやジンバブエでも起こっている。Libraのような通貨が生まれた場合、このような国の人々の間で利用が拡大することは間違いない(ベネズエラに関して言えば反米だから政府が規制に動くだろうが)。つまり想定ユーザーとLibraの仕組みが合致していないように思える。

 先進国のユーザーにとって、Libraが提供する機能はPayPalやRevolut等の新種の銀行が提供する機能と同等であるように見え、Facebookアプリに統合されているぐらいである。PayPalも新種の銀行も取り扱う通貨は現地通貨であり現地の規制当局から規制をクリアしている「クリーン」な企業である。言い換えれば米ドルでも欧ユーロでも同等のサービスは実現できる。

Comment

今週の興味深かった記事(2019年 第28週)

2019-07-14 | 興味深かった話題

Nintento Switchプロセッサー更新

任天堂、「Nintendo Switch」も新SoCとNAND搭載か - PC Watch
Switch's next Tegra X1 looks set to deliver more performance and longer battery life - Eruogamer

 記事中ではNVIDIA Tegra X1からTegra X2への更新の可能性に言及しているが怪しいところである。もしTegra X2に変更になる場合は機能の一部を無効化したものになるだろう。しかし、Eurogamerの推測が正しいとすればTegra X2ではなく恐らく新開発の他のプロセッサーとなる。

 Tegra X1(TX1)は2015年に登場した組込用プロセッサーで、Nintendo Switchの登場した2017年には後継のTegra X2(TX2)が登場している。
 TX2のTX1に対する最大の違いはNVIDIA Denver2 x2コアであるが、詳細はPC Watchの後藤氏の記事を参照頂くとして癖の強いプロセッサーで最適化が難しい可能性があるが、TX2にはTX1と同じArm Cortex-A57 x4コアも搭載されており、A57を使用することで高い互換性を達成できるだろう。GPUは同じNVIDIA製であるがTX1はMaxwellファミリー・TX2はPascalファミリーと1世代異なるものの共に256コアで共通である。
 そのため、もしSwitchのプロセッサーをTX2に置き換えると仮定するとDenver2は無効化することでTX1と高い互換性を実現できる。PlayStation 4に対するPlayStation 4 ProのようにDenver2を有効化してTX2搭載機種をTX1搭載機種の上位機種とすることは不可能ではないがパフォーマンスの違いが小さ過ぎるだろう。

 ではTX1からTX2に更新する場合のメリットは何か?というと消費電力である。
 TX1はTSMC 20nm SoCプロセス・TX2はTSMC 16nm FinFETプロセスで製造されており、NVIDIAの開発キットでもTX1の消費電力最大10Wに対しTX2はCPU・GPU共に動作周波数を引き上げた状態で7.5Wとなっている。もしDenver2の無効化やPascal GPUの動作周波数引き下げをすればTX2でTX1の半分以下の消費電力を達成することは難しくない。

 しかし、EuroGamerの記事が正しいとすれば新プロセッサーはTX2ではない。新プロセッサーがT214だとすればTX1(T210)の系列でTX2(T186)の系列とは考えにくい。

トランプ大統領が「Facebook仮想通貨リブラは信頼できない」と言及

トランプ大統領「Facebook仮想通貨リブラは信頼できない」。公聴会前に初言及 - 仮想通貨Watch
ビットコインとLibraは何が違うのか? - ITMedia

 私個人はトランプ大統領について経済や金融に強いイメージもないが、それでも氏の仮想通貨に対するコメントには賛成できる。私の理解では仮想通貨は専ら投機目的で所有されており、その価値は米ドルのような現実の通貨に換金されることで初めて担保されている。後者についてはFacebookのLibraの通貨バスケットも同様である。仮想通貨は通貨に必須とされる三大機能すら提供しておらず、このことはその分野のプロも言及している(例:「仮想通貨は通貨にもならないし、価値の保存としても機能しない」UBSのエコノミストが酷評)。

 個人的に不可解なのは、政府から警戒視されてまでFacebookが仮想通貨を新設する理由である。
 Facebookは世界中でやり取りされているから、ネットでPayPal・実世界でWesternUnionが提供するような通貨の相互交換サービスが便利であると想像できる。例えば、豪州に住んでいる人が米国に住んでいる知人にFacebook Messengerで連絡を取り代金を送金して米国製品を送ってもらうようなケースを考えると、現状で豪ドルを米ドルに両替する際に発生する手数料が、共通通貨を使えば不要になる――というのはPayPalの登場した1998年から既にあるアイデアである。
 しかし実際はというと、日本生まれで欧州で生きる私に言わせると、そのような隔たった地域での送金は日常的でないし、逆に英ポンド⇔欧ユーロのような近隣国の通貨ペアの交換は現状でも全く不自由が無い(取引量が多いので銀行手数料も低いことが多い)。

 FacebookのMessengerにLibra電子ワレットが統合されメッセージを送受信する感覚で金銭をやりとりできることを考えれば、古典的な銀行(寡聞にして最近の日本の銀行の動向は知らないが)から大きな飛躍と思われるかもしれないが、PayPalや最近でてきたRevolutやMonzoのような新種の銀行と比較すれば違いはアプリが統合されているかだけである。
 なお、RevolutやMonzoなどは現実の通貨を取り扱う銀行なので現地当局の規制を受けている。世の実業家はこのような「当局の規制」に嫌悪感を示すが、これは法定準備預金など当局が定める経営の安全性基準を満たしているという意味でもある。トランプ大統領は「フェイスブックや他の企業が銀行になりたいのであれば、彼らは銀行設立免許を求めなければならず、他の銀行と同様に全ての銀行業務のルールに従う必要がある」と言っているそうだが(記事中より引用)、まったくその通りで、Libraが銀行でないのであれば仮に破綻したとしても政府は無視するだろう。

# 個人的には、恐らく中国あたりの資産家の預金に使われるのではないかと思う。
# 通貨バスケットのおかげで途上国人でも米ドル・欧ユーロ・日本円の安定性にタダ乗りできる可能性がある。

Comment

今週の興味深かった記事(2019年 第27週)

2019-07-07 | 興味深かった話題

富士通A64FX

富岳スパコンに搭載されるメニーコアCPU「A64FX」 - ISC 2019 - マイナビ

 既に既報の内容が多いので特に驚く部分も疑問も無いが、個人的に駄目だと思うのは同プロセッサーが搭載される「富岳」の稼働開始は2021年ということである。
 記事中にあるベンチマークは賛否両論あろうが個人的には良好だと思う。しかしそれは2019年中旬でのことであり、富岳が稼働する2021年の話ではない。例えばベンチマークではNVIDIA V100より優れた結果が出ているが、V100は2017/18年のGPUで、例えば2020年に稼働予定の米エネルギー省LBNL NERSC-9 Perlmutterで採用される次世代"Volta-Next"に勝てるか怪しいのではないかと思う。ちなみに2021年にはIntel Xe GPUを搭載したAurora・AMD Radeon Instinctを搭載したFrontierという二台のExa Flopsシステムが稼働予定で、それらに勝てるか甚だ疑問である。

 あと蛇足だが、やはりTofu-DがPCI Express接続でなく、PCI Expressレーン数が16しか無いのは不満である。実現可能かどうかはともかくInfiniBandでの接続やCrayと組んでSlingshotで接続ということもできない。言い換えれば理研専用ということである。

Raspberry Pi 4の謎

 海外を中心にレビューや分析記事が出てきたため、1点の説明をしつつ・1点の疑問の提示をしておこうと思う(個人blogを含む複数のレビューを参照しているため特定の記事は挙げない。御容赦いただきたい)。

 とある海外の個人ブログでRPi4に搭載されているUSB3.0コントローラーVIA Labs VL805がPCIe Gen 2 x1で接続されていることについて「二台以上のUSB機器を接続するとフルスピード(5 Gbps)が出ない」としていたので説明しておきたい。

 この疑問は接続機器の数を考慮するかによって変わる。USB3.0 Gen 1の理論上の転送速度の合計5 Gbps・2台なら計10 Gbpsに対しPCIe Gen 2 x1の理論上の転送速度が500 MB/sec(つまり4 Gbps)であることに起因しているが、PHY層の速度とMAC層の速度を混同しないよう注意が必要である。USB3.0 Gen1およびPCIe Gen 2のPHY層でのエンコーディングは8b/10bで10-bitあたり2-bitのstart bit・end bitを除いた8-bitのみがデータとなる。USB3.0の5 GbpsというのはPHY層の転送速度で、アプリケーションから見た理論上の最大転送速度は4 Gbpsとなる。他方、PCIe Gen 2 x1の4 Gbpsというのはアプリケーションから見た最大転送速度である(PHY層の転送速度については5 GT/sと表記される)。従って、USB3.0機器を1台接続する分にはスピードが釣り合う計算になる。

 この計算では、複数の機器を接続すると速度が劣化するだろうが、もっとも、上述の通り理論上はそういう速度(規格)であるが実際にそんな速度がでるわけではないので実用上問題になるかは疑問である。これはUSBが分厚いドライバースタック=ソフトウェアのオーバーヘッドが大きいからである。例えばUSB3.0が登場した頃2011年の記事で恐縮だがDOS/Vの記事を見てみると、いずれも150~180 MB/secという具合で理論上の転送速度からはほど遠い。また、外付HDDの場合3 Gbps接続のeSATAの方が5 Gbps接続のUSB3.0よりも10~20%程度高速だったりする。

 ところで、このUSBインターフェースについては個人的に疑問もある。このVL805であるがUSB3.0 4ポートコントローラーなのである。実はVIA LabsにはVL806という2ポートコントローラーもあるのだが、なぜ4ポートなのか。Raspberry Pi財団の公式blogから引用する

USB is provided via an external VLI controller, connected over a single PCI Express Gen 2 lane, and providing a total of 4Gbps of bandwidth, shared between the four ports.

どうやらRPi4のUSB2.0 x2ポートもVL805から出ているようだ。なぜせっかくUSB3.0 x4ポートコントローラーを搭載しているのにUSB3.0 4ポート構成ではなくUSB3.0 2ポート + USB2.0 2ポート構成なのか謎だが、恐らくは電源供給が問題となるためだろう。USB2.0では1ポートあたり最大5V / 0.5A(つまり2ポートで5W・4ポートで10W)が規格化されていたが、USB3.0では最大5V / 0.9A(つまり2ポートで9W・4ポートで18W)が規格化されている。Raspberry Pi財団はRPi4のパワーサプライに5V / 1.2~3.0A(計6~15W)を要求しており、CPUやメモリー等への給電も合わせるとUSB3.0機器1~2台でも怪しく3~4台は無理だと判断したのだろう。

Comment