20150822

最近の話題 2015年8月22日

１．IDFでIntelが3D Xpointメモリを使うSSDをデモ

　　IDFの基調講演で，IntelのBrian Kurzanich　CEOが3D Xpointメモリを使うSSDをデモし，2016年にもOptaneという新ブランドでSSDを販売すると発表しました。2015年8月18日のThe Inquirerの記事をベースに紹介します。

　　先週のFlash Memory Summitでも3D Xpointメモリのセッションがあったのですが，当事者のIntelもMicronも登壇せず，業界のエキスパートが推測を述べ合うというもので，本当のところは分かりませんでした。

　　IDFで技術的な話があるのかどうか不明ですが，少なくとも，早ければ来年にも新ブランドのSSDの発売ということは，既に量産の目途はついているのでしょう。

　　なお，Kuruzanich氏は，材料の性質が変化すると述べており，その意味では広義のPhase Changeですが，従来のPCMで使われているカルコゲナイトではなく，新材料であると述べています。

　　デモでの性能ですが，IntelのNANDを使ったハイエンドのP3700 SSと比較して5～7倍のIOPSだそうです。

２．IDFでのSkylakeの発表

　　2015年8月19日のEE Timesが，IDFでのIntelのSkylakeの発表を報じています。アナリストの評価は，いくつか良い点もあるが，全体的には性能向上は少なくパンチ不足といったところのようです。

　　Intelの発表の最初に述べられたのが，TDPで20倍の範囲，フォームファクタで4倍の範囲をカバーするということで，PCだけでなく，タブレットなどもカバーすることが最重要の開発目標だったようです。

　　良いと評価されたのは，Software Guarded eXecution（SGX)やMemory Proctection eXecution（MPX)というメモリを保護するセキュリティー機構の強化，eDRAMのキャッシュをDRAMメモリ側に移してDRAMのメモリキャッシュとして動作させるアーキテクチャあたりでしょうか。

　　コアに関してはフロントエンドやO-o-O実行リソースの強化などが挙げられていますが，性能向上が10%程度では説得力に欠けます。カメラサポートの強化や，ビデオのプレイバックの消費電力半減などタブレット向けの機能は強化されています。

　　消費電力の点では各種高速インタフェースの電力削減，AVX2ユニットのパワーゲートなどが挙げられていますが，DC-DC Converterを内蔵し，コアごとに電源電圧を変えるFIVRが無くなったことには触れられていません。

　　また，DDR4で最大4133MHz転送をサポートしてメモリバンド幅を2倍近く改善しています。

　　今回は，モバイル版のチップの仕様には言及されず，サーバ用チップにも言及されなかったようです。

３．Skylakeの第7世代Intel GPUはSIMTに変更

　　20015年8月20日のPC Watchに，Skylakeの発表に関して後藤さんが書いて居られます。その中でも，GPUの強化の部分を紹介します。

　　従来，IntelのGPUはSIMDだったのですが，Skylake世代から，SIMTに変わったとのことです。NVIDIAが先行し，AMDが追随したSIMTにIntelが加わって，これでSIMTはGPUとして超マルチスレッドを実行する業界標準となったと言えます。

　　となると，Xeon Phiはどうなるのでしょうね。Xeonとの命令の互換という点で，AVX512のようなSIMDを取っているわけですが，業界のトレンドが科学技術計算はSIMTとなってしまったら苦しいところです。それは将来の話ですが，今回のSkylakeのGPUでは，CPUとGPUのメモリの仮想共有メモリ化を行い，キャッシュコヒーレンシをとっているとのことです。これで，AMDのAPUとほぼ同じことができるようになります。

　　そして，32bitの単精度演算器を8個備えるEUを最上位のGT4e GPUは72組備えており，ピーク演算性能は1,152GFLOPSに達します。

　　それから，Preemptionがスレッドの中でもできるようになり，300µs程度の時間で，実行するコンテキストを切り替えることができるとのことです。このくらい速いと，複雑な3D描画の途中で，画面のタッチで割り込んで，物理計算や別の3D描画を行って，元に戻って描画を続けるという処理もできそうです。

　　しかし，そのためには，GPUのかなり大量のコンテキストのセーブ，リストアを行う必要がありますが，まあ，300µｓあればメガバイト級のデータをメモリに移動できますから，大丈夫でしょう。

　　それから，Haswellでも上位のチップはeDRAMのキャッシュを持っていたのですが，そのため，相当大きなタグアレイをCPUチップ上にもつ必要がありました。これに対してSkylakeでは，DDR3/4 DRAMの内容をキャッシュするメモリキャッシュに変更されました。シングルCPUのシステムではあまり違いませんが，2ソケット以上の場合，従来の方式は別ソケットのCPUに接続されたDDRメモリの内容もキャッシュしたのですが，今回のSkylakeの方式では，自分の側のDDRメモリしかキャッシュしません。これはGPUのL2$と同じやり方です。

　　この方式では，同じデータが2つのeDARAMキャッシュに入ることは無いので，キャッシュコヒーレンシプロトコルを使わなくても矛盾は生じません。CPUチップ上に大きなタグRAMを搭載する必要が無くなったので，ハイエンドだけでなく，もっと下のクラスの製品にもeDRAMキャッシュを使うことがし易くなります。

４．Gordon Bell賞のファイナリストの発表

　　2015年8月21日のHPC Wireが，今年のGordon Bell賞の最終選考の候補であるFinalistの発表を報じています。

“Massively Parallel Models of the Human Circulatory System,” with research led by Amanda Randles of Duke University and a team of collaborators from Lawrence Livermore National Laboratory and IBM
“The In-Silico Lab-On-A-Chip: Petascale And High-Throughput Simulations Of Microfluidics At Cell Resolution,” led by Diego Rossinelli of ETH Zurich and an international team of researchers from Brown University, the University of Italian Switzerland, the National Research Council of Italy, NVIDIA Corporation, and Oak Ridge National Laboratory
“Pushing Back the Limit of Ab-initio Quantum Transport Simulations on Hybrid Supercomputers,” led by Mauro Calderara with a team from ETH Zurich
“Implicit Nonlinear Wave Simulation with 1.08T DOF and 0.270T Unstructured Finite Elements to Enhance Comprehensive Earthquake Simulation,” led by a team that includes the University of Tokyo, RIKEN, Niigata University, the University of Tsukuba, and the Research Organization for Information Science and Technology
“An Extreme-Scale Implicit Solver for Complex PDEs: Highly Heterogeneous Flow in Earth’s Mantle,” led by Johann Rudi from University of Texas at Austin and a team that includes IBM, the Courant Institute of Mathematical Sciences, University of Texas at Austin, and the California Institute of Technology

　　Finalistに選ばれたのは5件で，日本からは東大，理研，新潟大，筑波大，RISTの地震シミュレーションの論文が候補に選ばれています。Gordon Bell賞の最終結果は，11月にオースチンで開催されるSC15で発表されます。

　　なお，Top500 1位のハードウェアを擁する中国からの，今年のGordon Bell賞の候補論文はありません。

EZY/ExaScalerが1～3位を