最近の話題 2016年8月27日

1.Hot ChipsでAMDがZenを発表

  2016年8月24日のEE Timesが,Hot Chips 28での,AMDのZenプロセサの発表を報じています。Zenは,Bulldozerに始まるAMDの建設機械シリーズのコアの後継になる新コアで,40% IPCが向上しているとのことです。そして,消費電力は従来のコアと同程度に抑えられているとのことで,これが実現されているとすると,Intelのプロセサと競争力のあるプロセサコアということになります。

  Zenでの改良項目のリストを見ると30程度の項目が並んでいます。IPCの改良効果には大小がありますが,30項目で40%の改善ですから,平均すると1.3%で,大部分は1%程度の細かい改良を積み重ねて,40%の改良を実現しています。

  従来,AMDは1コア1スレッドでしたが,Zenでは1コアで2スレッドのSMTになりました。これはIPCの向上に大きな効果があると思われます。ただし,これはシングルスレッドの実行性能の改善にはつながりません。

  シングルスレッド性能での大きそうな改良は,分岐予測にニューラルネットワークを取り入れた点で,これはOracleのSPARCでも取り入れられており,AMDが初めてではないのですが,パーセプトロン方式の分岐予測は従来の分岐予測より精度が高いと言われています。予測ミスが減れば,そのまま,性能向上に直結しますが,どの程度のハードウェア量と電力バジェットをつぎ込んでいるのかについては触れられませんでした。

2.Hot ChipsでIBMがPower9を発表

  2016年8月24日のEE Timesが,Hot Chips 28でのIBMのPower9プロセサの発表を報じています。使用プロセスは14nmでトランジスタ数は8Bと発表されましたが,チップサイズや消費電力,クロックは発表されていません。プロセスで目を引くのは,17層という多層配線を使っている点です。

  搭載コア数は24コアで,これはPower8と同じです。そして,eDRAMの120MBという巨大L3キャッシュを搭載しています。

  Power9では外部とのリンクを強化しており,NVLink2.0や新CAPIをサポートし,物理リンクもローカルSMP接続に使う16Gbpsのリンクとアクセラレータ接続やリモートのSMP接続に使う25GbpsのIBM BlueLinkという新しいリンクを装備しています。

  面白いのは,24個の各コアを4スレッドのSMTで動かすモードと,2コアを束ねて8スレッドのSMTのコアを12コアとして動かすモードが設けられている点です。前者はLinuxに最適化した構成,後者はPowerVMに最適化した構成とのことです。また,DDRメモリを直接,Power9チップに接続する構成と,メモリバッファ経由で接続する構成があり,前者は2ソケットのサーバに最適化した構成,後者は巨大メモリを必用とする大型サーバに最適化した構成です。

  コアとしては,命令フェッチからコンピュートまでのパイプライン段数を5段短縮しています。分岐の多いコードには効きそうです。

  それから,Power9では128bitのIEEE 754のQuad Precision Floatがサポートされます。汎用のCPUとしては初めてではないかと思います。

  全体としてみると,やはり,Power9はXeonとは格が違う重戦車という感じがします。


3.Hot ChipsでARMがスケーラブルなベクトル拡張を発表

  2016年8月22日のEE Timesが,Hot Chips 28でのARMのべクトル拡張アーキテクチャの発表を報じています。Hot Chipsは,通常,チップが完成しているか,完成していなくても,物理設計はできているという段階でないと発表できないのですが,ARMはIPとしてのコアの設計をライセンスする会社でチップを作らない会社であることから,例外的に,アーキテクチャレベルの発表となっています。しかし,実チップが作られるという裏付けがないとまずいので,富士通の吉田部長が登壇して,Post-K向けに富士通がこのベクトルアーキテクチャのチップを作りますという決意表明を行うという発表になっています。

  ARMのベクトルアーキテクチャの特徴は128bitから2048bitの長さ(ただし,128bitの倍数)ベクトルハードウェアを持たせることができるという点で,ARMは他社にない特徴と述べています。そして,プレディケートを使って,ハードのベクトル長に依存しないプログラミングができるように工夫されています。ただし,今回の発表スライドでは命令アーキテクチャの詳細は分からず,詳細の発表は,年末から来年初めころになるとのことです。

  筆者の個人的意見ですが,多数の演算器を並列に効率よく動かしたいなら,SIMTにした方が良かったのではないかと思います。SVEのような新ベクトルアーキを作らないで,今回のHot Chipsで発表されたBifrost GPUのアーキテクチャをベースにして,足りない機能があれば追加するというアプローチです。

  NEONの数倍程度のものを今更,作ってどうするのという感じがしますし,既にHPCのプログラミングはベクトルアーキではなく,GPUで使われているSIMTアーキの方が主流になって来ているのではないかと思います。

4.Hot ChipsでMicrosoftがHoloLensを発表

  2016年8月23日のEE Timesが,Hot Chips 28でのMicrosoftのHoloLenzの発表を報じています。VRのHMDは,コンピュータが生成した画像を見せるだけですが,ARをサポートするため,HoloLenzのゴーグルは,現実世界の画像が重なって見えるようになっています。

  それだけが原因なのかどうか分かりませんが,発表された部品組み立て図を見ると,かなり大量の部品で作られており,かなり,高そうなゴーグルです。

  そして,MicrosoftはHoloLenz Processing Unitという専用のLSIを開発しています。HPUはTMCの28nmプロセスで作られ,AtomベースのCherry Trailをコントローラとして使い,画像処理用には24個のDSPコアと8MBのキャッシュを集積しています。これで,1TPixel/sの性能を4W以下の電力バジェットで実現しています。

  発表スライドで,現実の部屋の中にコンピュータグラフィックスで作られたオブジェクトが重なって見える絵を多数表示しましたが,非常に印象的で,新しいことができるという感じがしました。

  しかし,VRのゲームもそうですが,VRやARを使ってゲームなどを作るのは,これまでの3Dグラフィックスのゲームと比べると手間がかかり,製作コストが跳ね上がりそうな気がします。ジェットエンジンの整備や手術の手順の検討とかには役に立つと思いますが,適用例として示された洗面台の下のU字型の排水パイプの修理くらいならARはペイしないのではないかと思います。

  VRやARに対する業界の期待は大きいのですが,開発の負担も大きいし,ながら視聴のようなことも出来ないので,ユーザの負担も大きいので,それほど急激に普及するのは難しいと思います。


inserted by FC2 system