最近の話題 2013年6月22日

1.Top500は中国のTianhe-2がやはり1位

  2013年6月17日に第41回Top500が発表されました。事前の予想通り,中国のTianhe-2(天河 2号)が1位になりました。Linpack性能は33.8627PFlopsで,2位になったTitanの2倍近いスコアです。消費電力は17.808MWとなっています。

  先週の話題で紹介したように,IntelのXeon E5-2692という12コアで2.2GHzのCPUとXeon Phi 31S1Pというアクセラレータを使っています。また,インタコネクトは独自開発のTH Express-2となっています。

  Top10には,このTianhe-2以外に今回登場の新顔はなく,概ね,前回のTop500から1ランクダウンですが,テキサス大のStampedeがピーク性能を4.7PFlopsから8.52PFlopsに上げ7位から6位,LLNLのVulcanが0.42PFlopsから5.03PFlopsに上げ65位から8位にランクアップしています。

  日本のシステムは,京が4位,六ヶ所村のHeliosが20位,東工大のTSUBAME2.0が21位,東大のOakleaf-FXが26位といったところです。

  また,新顔ではフランスの石油探査大手のTotalのPangeaと呼ぶSGIのAltix XのシステムがLinpackで2.1PFlopsをマークして11位にランクインしています。このシステムは民間企業のシステムとしても最大規模です。

2.IntelがXeon Phi新製品と次世代Nights Landingを発表

  2013年6月17日のThe RegisterがIntelのXeon Phi関係の発表を報じています。これまで,正式の製品は5110Pだけでしたが,これに7120 PとX,5120D,3120 PとAが加わりました。

  7000番台は61コア,5000番台は60コア,3000番台は57コアです。ピーク性能は7000番台が1208GFlops,500番台が1011GFlops,3000番台が1003GFlopsとなっています。

そして,最後の文字が冷却を表し,PはPassiveでヒートシンクだけが付いているタイプ,XとDは何もついておらず,水冷でも何でも勝手に付けてくれというタイプ,AはActiveでファンがついているタイプです。なお,DはPCI eのDense Formfactorのカードとなっています。

  お値段は,7000番が$4129,5120Dが$2759,3000番台が$1695で,旧製品は5110Pは$2649となっています。

  また,2013年6月17日のThe Registerの別の記事で,Knights Landing(KNL)の発表を報じています。KNLは14nmプロセスにシュリンクされ,スタンドアロンのCPUとして使用することができるようになり,オンパッケージでメモリを搭載してバンド幅を改善するというスライドが掲載されています。要するに,発表されたのはこれだけです。

  14nmにシュリンクするのは当然で,これにより,コア数は倍増すると考えられます。

  そして,現在のXeon PhiはXeon CPUのコプロセサとして使うのですが,KNLではこのXeonを省略して,Xeon Phiのコアで代用できるようになると見られます。KNLのコアでOSやMPI通信などを走らせた場合の性能がどうなるのか分かりませんが,よりコンパクトでFlopsあたりの単価や消費電力が少ないシステムが作れることになります。また,CPUとXeon Phiの間でPCI eを経由してデータをやり取りする必要がなくなり,性能が向上するケースも出てくると思われます。

  そして,メモリバンド幅のボトルネックを改善するのがオンパッケージのメモリ搭載です。Haswellで128MBのeDRAMキャッシュチップが搭載されることが発表されましたが,KNLにもこのようなキャッシュチップが搭載されると予想されます。Haswellの場合は128MBでCPUチップとの間のバンド幅は100GB/sですが,14nmプロセスを使えば容量アップの可能性があります 。また,Haswellの次世代のBroadwellのeDRAMキャッシュと同じチップを使うとしても,KNLは,1個ではなく複数個搭載されるという可能性も考えられます。

  いずれにしても14nmプロセスを使うので,時期的には2014年末から2015年前半くらいと予想されます。

3.オーストラリア国立大の雷神スパコン

  2013年6月21日のThe Registerが,オーストラリア国立大に設置された富士通製の雷神スパコンについて報じています。Sandy Bridge 57472コアを使用し,ピーク演算性能は1.2PFlopsとのことです。雷神システムは,計算ノード間の接続はMellanox製のFDRのInfiniBandで,160TBのメインメモリ,10PBのファイルシステムを備えています。

  前世代のスパコンと比較すると6倍の演算性能となり,オーストラリアでは最大規模のスパコンとなります。

  The Registerに雷神システムの写真が載っているのですが,注目は,筐体の横面のパネルです。Crayのシステムはカストマの希望の絵を描くのが特徴ですが,雷神もその向こうを張って絵が描かれています。国内で売るPrimergyスパコンも絵を描くのでしょうか?それとも,これは富士通オーストラリアの仕様なんでしょうか?

4.AMDがサーバプロセサのロードマップを発表

  2013年6月18日のThe RegisterがAMDのサーバロードマップの発表を報じています。

  現在のAMDのサーバチップは4ソケット用のOpteron 6300シリーズと2ソケットのOptron 4300シリーズ,そして1ソケット専用のOpteron 3300シリーズとKyotoのコードネームで開発されてきたXシリーズAPUとなっていますが,2014年には4ソケット,2ソケットはWarsaw CPU,1ソケットのAPUとしてBerlin CPUを出すという予定になっています。

  WarsawはOpteron 6400と呼ばれるとみられ,Piledriver 16コアと12コア版が出るとのことです。現在の6300に比べて性能/電力は20%向上とのことです。製造プロセスはGlobal Foundriesの32nm SOIプロセスで,基本的には現在の6300と同じです。

  一方,BerlinはTMCの28nmプロセスで製造され,Piledriverの次の世代のSteamrollerコアを4コア搭載します。また,GPUもGCNとなりAMDが推進するHeterogeneous System Architectureに準拠した製品になります。Steamrollerは2コアペアのモジュールで,モジュールには2MBのL2$が付いています。メモリは2チャネルで,DDR3 1866をサポートします。

  またIOは,Berlin本体は,PCI e2とビデオ程度で,その他はSystem Controller Hub(チップ)を経由してPCI e2/3,SATA,USBなどをサポートしています。

  今回の目玉はSeattleと呼ぶARMベースのサーバチップを2014年に出すと発表したことです。Seattleは,ARMの64bitアーキテクチャのA57を8コア搭載し,クロックは2GHz以上で,10Gbイーサネットポート,AMDのFreedom Interconnectのポート,ビッグデータに対応するための多数のSATAポートなどを搭載すると見られています。

  また,当初の製品は8コアですが,16コア版も予定されているとのことです。

  AMDのサーバビジネス担当のFeldman GMは,ARMのメリットはコストが安いことで,これまでのCPUの開発には3年半掛かり,費用も$350〜400M掛かっていたが,ARMを使えば,開発期間は1年半,費用は$30Mで済むと述べています。これは他社も同じですが,AMDはメモリやIOなどのIPを持っている点が有利。また,Broadcomなどは携帯では強いがサーバのノウハウは持っていない。AMDはサーバのノウハウは豊富でこの分野では勝算があるとのことです。

5.IntelのeDRAMキャッシュ

  2013年6月12日のTechOn!が,VLSIシンポジウムにおけるIntelのeDRAMの発表を報じています。

  セル面積は0.029um2で,同じ22nmプロセスのSRAMの0.092um2と比較すると3倍強の密度になっています。キャパシタはビット線の上に,2〜4層のメタル間の絶縁層に10倍程度のアスペクト比の穴を掘り,その壁面にキャパシタを形成しているとのことです。穴の断面はほぼ正方形で,1ビットの複数個の穴を使っています。セルの記憶容量は14.2fFとのことで,通常のDRAMと変わらない程度の容量です。ただし,2012年のISSCCで発表されたHynixの4GbitDRAMのセル面積と比較すると9倍程度となっており,DRAMチップの密度には遠く及びません。

  低リークのFinFETをパストランジスタに使い,データの保持時間は95℃で100us以上となっています。これも64msに1回のリフレッシュというDRAMチップと比べると,かなり短い時間です。

 

inserted by FC2 system