最近の話題 2016年9月17日

1.NVIDIAが推論用のP4とP40 GPUを発表

  2016年9月12日にNVIDIAは,Deep Learningの推論用のP4とP40というGPUを発表しました。

  Deep Learningの推論は,入力に,それぞれの重みを掛けて総和を取る(これにMax PoolingとかLeRUなども必要ですが)という計算をネットワークを辿って計算して行けば,答えがでます。

  トレーニングの場合は,出力の誤差を逆方向に伝搬させて,誤差を小さくするように重みを調整することを,多数の入力を使って繰り返すのですが,推論の方の計算は簡単です。また,推論の場合は,FP32を使う必要は無く,FP16で十分ということで,Pascal P100などでFP16のサポートが進みました。

  今回,TensorRTというパッケージでは,FP16に加えて,INT8での推論もサポートされたとのことです。

  そして,P4 GPUは2560 CUDAコアを搭載し,FP32のピーク性能は5.5TFlops,INT8では22TOPSとなっています。電力は50W/75Wとなっています。そして,P40は3840 CUDAコアを搭載し,FP32では12TFlops,INT8では47TOPSとなっています。消費電力は250Wです。

  P40はINT8を使えばCPUより40倍速い,P4はCPUと比較して40倍 性能/Wが高いと書かれています。

  P100のコア数は3584で,4SMは冗長として使えるのは56SMだったのですが,P40は3840ということは60SM全部を生かしている計算になります。完全良品の歩留まりが上がって,冗長が必要なくなったのでしょうか。


2.ビッグデータ処理を最大4倍速くする新言語Milk

  2016年9月15日のHPCWireがMITの研究者が,ビッグデータの処理を4倍高速に実行できる新言語を発表したと報じています。Milkと呼ばれるこの言語は,OpenMPの拡張のようで,ビッグデータをランダムにアクセスする部分のコードに数行の指示行を追加します。

 そうすると,まず,各プロセサでアクセスするアドレスのリストを作り,ある程度,メモリアクセスが溜まると,全ノードでリストを交換して,各ノードはアドレスが近いメモリアクセスを受け持つように,分担を入れ替えます。そして,メモリをアクセスすればメモリアクセスの効率があがるとのことです。

  近傍のアクセスをまとめることにより,複数のアクセスが一つのキャッシュラインの入ってしまえば,物理的なメモリアクセスの回数を減らすことができます。また,Next Line Prefetchの有効性も増します。さらにはTLBミスも減るので,速くなることは理解できます。

  しかし,データをフェッチしたプロセサから,元々データを必要としたプロセサまでデータを送る必要がありますが,共通メモリの環境なので,こちらはネックにはならないのでしょうか?

3.Aquilaが温水冷却のOCPラックを発表

  2016年9月15日のHPCWireがニューメキシコ州のAquilaという会社のOpen Compute Project規格の温水冷却ラックの発表を報じています。48 OUのラックに,IntelのKennedy Passサーバボードを48枚実装することができます。また,KNLを搭載したAdams Passサーバを72枚収容するラックも開発しているとのことです。

 基本的な冷却テクノロジはClustered Systemsが開発したもので,写真では,サーバボード全体を覆う感じのメタライズした薄いプラスチックバッグが見えます。この中に熱伝導性が高いゲルが入っているような感じです。コールドプレートを押し付けると,これが変形するので,CPUだけでなくDIMMやDC-DCなどにも接触するようで,2W以上の消費電力のコンポーネントを冷やせるとのことです。

 各サーバボードのコールドプレートには水を供給しています。電磁的なパーツは使って入ないとのことで,ポンプなどはなく,水を流しっぱなしにしているのかも知れません。

 掲載された表では,通常の空冷の場合は,TFlops当たりのTCOが$3.2Mであるのに対して,このシステムでは$2.5Mに減少しています。減少の大部分は空気を冷やすための電気代です。サーバのコストを含めたTFlopsあたりのコストは,空冷の$4.0Kに対して,$2.3Kと43%低くなっています。ただ,空冷のサーバのコストはTFlopsあたり$2000位なのですが,温水冷却の方は$1050程度と計算されますが,この差がどこから出ているのかは分かりません。

4.RenesusがIntersilを買収

  2016年9月13日にルネサスエレクトロニクスがIntersilを買収する契約を行ったと発表しました。

  Intelsilの株を$22.50で現金で書いとるという条件で,これは8月19日の終値に対して43.9%のプレミアムを付けています。買収総額は$3.2B(約3200億円)となります。多少,高めという気もしますが,Maximと競ったというところもあり,やむを無いところでしょうか。Intersilの2015年の売り上げは$522Mで,従業員は約1000名とのことです。

  ルネサスは,マイコンやSoCに強みを持っており,日本の自動車メーカーには大きなシェアを持っていますが,米国の自動車メーカーにはあまり食い込めていません。

 インターシルはパワーマネジメントLSIやアナログのデータコンバータなどに強く,ルネサスとは,製品はほとんど重複しません。ということで,良い補完関係にあり,ルネサス製品を米国の自動車メーカーに売り込むチャネルにもなると期待されています。

 ルネサスが3000億円の買収を仕掛けるまで元気になったのは,日本人として嬉しいことで,うまく行って欲しいところです。

inserted by FC2 system