最近の話題 2015年6月13日
1.HPがThe MachineのロードマップからMemristorを除外
2015年6月11日のHPC Wireが,HPがThe MachineのロードマップからMemristorを除外したと報じています。
The Machineは,各種の専用プロセサ群と巨大容量,高速の不揮発性メモリを光リンクで結ぶというハードウェアアーキテクチャを持ちます。メインメモリがSSDを兼ねるので,バイト単位でストレージにアクセスできるなど,ファイルシステムが簡単になり,性能が上がるとのことです。また,専用プロセサは汎用プロセサに比べて大幅に高い性能を持つことから,処理性能も大幅に改善されるとのことで,このようなハードウェアに最適化されたOSの開発と相まって,大量データ処理時代の新たなコンピュータアーキテクチャであると言っています。
このアーキテクチャは高速のNVRAMを構成するMemristorの実用化に大きく依存すると思うのですが,New York Timesの記者のインタビューにおいて,HPのEVPでCTOであるMartin Fink氏が,「Memristorに依存しすぎていた。既存のテクノロジで実現する努力を行っている」と述べたとのことです。具体的には,プロトタイプでは大容量の共通メモリとしてはDRAMを使い,将来は相変化メモリなどの不揮発メモリで置き換えるというアプローチです。
ただし,Memristorを完全に諦めたわけではなく,5年後に実用化されていれば使うとのことです。
HP Labは全力を挙げてMemristorの実用化に取り組んできたのですが,経済的に量産するレベルには,まだ,持って行けていないようです。
2.金融関係のベンチマークでPOWER8がXoenを圧倒
2015年6月9日のHPC Wireが,金融シミュレーションのベンチマークであるSTAC-A2で,Power8 2ソケットのサーバが,Xeon 2ソケットのサーバの2.3倍の性能を達成したと報じています。この発表を行ったのは,5月23日の話題で,NVIDIAからIBMに移ったと紹介したSumit Gupta氏です。
デリバティブなどの商品の値動きやリスクを分析する方法としては,ブラックショールズ 方程式が有名ですが,これは古典で,現在はもっと複雑なモデルが使われており,計算量が多くなっているとのことです。そして,この複雑な計算を速く実行で きるシステムが求められます。そして,このようなシミュレーションを実行する場合のコンピュータの性能を測定する目的で開発されたベンチマークが STAC-A2です。
12コア,3.52GHzクロックのPower8を2ソケット搭載するサーバと,18コア,2.3GHzクロックのXeon E5-2699 v3を2ソケットのサーバのSTAC-A2ベンチマークでの比較では,Power8サーバがXeonサーバの2.3倍の性能を達成したとのことです。E5-2699 v3 2ソケットにXeon Phi 7120Aを1台追加したシステムと比較しても1.7倍速いとのことです。
Gupta氏は,Power8がXeonより速いのは,3.52GHzとクロックが速く,ソケットあたり192GB/sという大きなメモリバンド幅を持つこと,コアあたり8MBと大量のL3$を持っていることなどが効いていると述べています。
しかし,Xeon Phiではなく,NVIDIAのK80を付けたシステムと比べると,10%程度負けているそうです。
3.CaviumがMIPSコアを最大48コアを集積するSoCを発表
2015年6月11日のThe RegisterがCaviumの最大48コアを集積するOCTEON III CN7XXX SoCの発表を報じています。Caviumは通信用のコントロールプレーンのプロセに強いメーカーで,OCTEON IIIは4G/LTEなどの100Gbps以上の速度の通信をワンチップで処理できるとのことです。OCTEON IIIは,現在のOCTEON IIに比べると4倍の性能とのことです。
メモリは4チャネルのDDR3/4をサポートし,IOは500Gbpsを超える性能で,40G,10G,GBなどのSERDESを搭載しています。そして,OCTEON Coherent Interconnectと呼ぶ,複数チップをキャッシュコヒーレントに接続するインタフェースを備えています。また,The Registerの記事の図にはありませんが,Caviumの発表には,高速でサーチを行うNeuron Searchというエンジンが描かれています。
CN71XXは最大4コア,CN72XX,73XXは4〜16コア,最上位のCN78XXは24〜48コアと多種の製品を作るとのことです。製造プロセスは28nmで,クロックは最大2.5GHzとかなり高速です。消費電力は8Wまで下げて構成できると書かれていますが,多分4コアチップの場合でしょう。
組込みのコアと言えばARMが人気ですが,その分,ARMの64ビットコアのライセンス料がお高いという難点があります。それに乗じて,Imagination Technologiesは,MIPS64コアをお安くライセンスしてシェアを取ろうといういう作戦です。昨年3連覇を達成したテキサス大,そして総合2位となったテネシー大は,今年の出場校から漏れています。しかし,イリノイ工大,オクラホマ大などは昨年に続いて出場を果たしています。
アジアの予選であるASC15(Asian Student Supercomputer Competition)には152チームが参加し,Tesla K80を使った精華大が優勝しました。今年の中国の代表は,この精華大です。しかし,LINPACKで11.92TFlopsとこれまでの10.1TFlopsの記録を20%近く伸ばしたシンガポールの南洋理工大はSCC15には選ばれていません。そして,台湾の強豪である国立精華大はずっと連続出場です。
残念ながら,今年も日本からの出場はありません。