最近の話題 2016年10月1日

1.NVIDIAがVolta GPUを搭載するXavierチップを発表

  2016年9月26日に,NVIDIAのJen-Hsun Huang CEOはアムステルダムで開催中のでのGPU Technology Conferenceにおいて,512コアのVolta GPUを搭載するXavier SoCを発表しました。GPUに加えて8個のCPUコアを集積しており,現在のDRIVE PX2を置き換えることができるとのことです。Voltaは現在のPascalの次世代のアーキテクチャです。

 性能は20TOPSと言っています。P40が,SPの演算性能が12TFlopsで,47TOPSと言っていますから,INT8性能は,FP32の4倍と見ているようです。とすると,20TOPSはFP32では5TFlops程度で,これを512コアで実現するには10GHzのクロックが必要と言う計算になってしまいます。

 しかし,CPUコアが8個あるとは言え,7Bトランジスタは,P100の15.3Bトランジスタの半分近いトランジスタ数で,それで512コアは少なすぎます。Voltaアーキテクチャでは,コアのint8性能を8倍とかに引き上げるコアの大型化がなされているのではないかと考えられます。同様にFP16の性能も引き上げられていると思われます。

 製造プロセスは16nm FinFETで,7Bトランジスタを集積し,消費電力は20Wとのことです。

 そして,自動車メーカーやTeir-1パートナへのサンプル提供は2017年4Qと1年あまり先ですから,本当の所,どこまで出来ているのかは不明です。なお,NVIDIAはチップが出来たとは言っていませんし,テープアウトしたとも言っていません。

 しかし,来年4Qには出せるという自信が持てる程度には開発は進んでいるのでしょうね。.

2.Amazon AWSが(ついに)K80 GPUをサポート

  2016年9月30日のHPC WireがAmazonのAWSがついにK80 GPUをサポートしたと報じています。AmazonはこれまでもK520 GPUをサポートしていたのですが,このGPUはGK104チップを2個搭載で,単精度はまあまあですが,倍精度浮動小数点演算の能力が低いという問題がありました。

  それが今回はK80 GPUとなりGK210チップ×2となり,単精度のクロックブースト時の性能は8.74TFlopsにあがり,倍精度は2.91TFlopsになります。Keplerは,2年前にリリースされた,ある意味では古いGPUですが,後継のMaxwell GPUは倍精度の演算性能が低く,HPCユーザには向きません。最新のPascalは性能的には良いのですが,まだ,価格が高く,供給にも不安があることから敬遠となると,K80しか残らないという状況のようです。

  K80を使うAWSのインスタンスは,GK210チップ1個(K80 GPUの半分)が単位で,このGPUが1個と4個のvCPUからなるp2.xlarge,GPU 8個とvCPU32個のp2.8xlarge,GPU 16個(K80 8台)とvCPU64個のp2.16xlargeがあり,時間当たりの使用料は,順に,$0.9/Hr,$7.2/Hr,$14.4/Hrとなっています。固定の支払いがあるReserved Instance契約の場合は,それぞれ,$0.425/Hr,$3.4/Hr,$6.8/Hrとなっています。

3.BaiduがDeepBenchを発表

  2016年9月26日にBaiduはDeepBenchと呼ぶベンチマークを発表しました。DeepBenchはディープラーニングの処理を実行するハードウェアの基本的な性能を測るベンチマークで,CaffeやTensorFlowなどのフレームワークは含んでいません。フレームワークレベルになると,やり方が色々とあり,ハードウェアだけの性能が比較できないので,DeepBenchでは,密行列積,畳み込み,リカーレント層の処理,オールリデュースの性能を測っています。

  NVIDIAのTitanXとIntelのKNLの幾つかの測定値が載っていますが,入力のサイズがまちまちなので,どう比べたら良いのか,よくわかりません。

4.TSMCが10nm,7nmプロセスや新パッケージングについて発表

  2016年9月22日のEE TimesがTSMCの半導体プロセスとパッケージングの発表を報じています。それによると,10nmプロセスは今年末までに量産を開始し,7nmプロセスは来年4月までに受注を開始するとのことです。

  10nmプロセスは16FF+と比較して,50%の面積縮小,20%の速度向上,40%の電力低減とのことです。そして,7nmプロセスは10nmに比べて,1.63倍のゲート密度,15-20%の速度向上,35-40%の消費電力低減とのことです。すでに,7nmプロセスには20社の顧客が付いているとのことです。

  パッケージングはInFOと呼ぶ技術を完成させ,既に量産に適用されています。また,InFOで複数のダイを集積するInFO multidie技術を開発中とのことです。この技術についてはHot Chips28で発表されており,2016年9月28日のマイナビに記事が掲載されています。

5.x86 4ソケットサーバの出荷では華為がトップ

  2016年9月28日のThe Registerが,2016年2Qのx86の4ソケットサーバの出荷でHuaweiが1位になったと報じています。データセンタなどの主力は2ソケットサーバで4ソケットサーバは少ないのですが,サーバ全体で見てもHuaweiのシェアは,5.1%でLenovoに次ぐ4位です

  Huaweiは大型のサーバに力を入れており,8ソケット,16ソケットのサーバに加えて,今年3月には32ソケットのミッションクリティカル向けのサーバを出しています。

  大きな国内市場を抱える中国のサーバメーカーの台頭は著しく,3位のLenovo,4位のHuawei,5位のInspurを合わせると約18%のシェアで,これは1位のDell,2位のHPEのシェアと同じ程度の規模です。

6.QualcommがNXPに買収提案か

  2016年9月29日のEE Timesが,QualcommがNXP Semiconductorsに$30B以上の金額で買収を提案していると報じています。ただし,両社からのコメントはありません。

  QualcommはSnapdragonシリーズのスマホ用SoCを作るスマホ分野ではトップメーカーですが,スマホの伸びも鈍化してきていることから,別の成長分野への進出が重要になってきていると見られます。NXPは元々はオランダの大手電機メーカーのPhilipsの半導体部門で,自動車用の半導体市場では14.2%のシェアを持つトップメーカーです。Qualcommは,NXPをとり込めば,自動車用半導体の分野に進出できるというのが狙いと見られます。

  この買収がまとまれば,QualcommとNXPを合わせた半導体の売り上げは$27Bとなり,TSMCと並んで世界3位の半導体メーカーとなります。

  



inserted by FC2 system