最近の話題 2011年9月24日

1.IntelはExaScaleに向けてNear VtとHMCを推進

  DARPAのExaScaleプロジェクトの一つのチームはnVIDIAチームですが,もう一つのチームがIntelチームです。Intelのアプローチはこれまで もBorkar氏などが講演してきていますが,IDFの最終日である9月15日のJustin Rattner氏の基調講演の中で,少しだけですが,ExaScale Computingに触れました。

  そして,ExaFlopswo20MWで実現するためには,今後10年間でエネルギー効率を300倍改善し,システムレベルで20pJ/Flopを実現する必要があると述べました。そして,IntelのExaScaleプロジェクトのPrincipal InvestigatorであるShekhar Borkar氏が登場し,ExaScaleに向かって開発しているテクノロジの例としてNear Threshold Voltage動作とHybrid Memory Cubeを紹介しました。

  CMOS回路のスイッチに要するエネルギーは電源電圧Vの2乗の比例するので,電源電圧を下げた方が消費エネルギーが少なくなります。このため,オン電流が流れ始めるスレッショルド電圧(Vt)より若干高め程度の電源電圧で動作させると一番エネルギー効率が高く,通常の電源電圧に比べてエネルギー消費は1/5という図が示されました。ただし,ドレイン電流が大幅に減るので,クロックは1/10程度で低下します。

  従来は話だけだったのですが,今回,Intelは,Near Vtで動作するClaremontと呼ぶPentiumプロセサを 実際に作り,それを切手大の太陽電池で動作させて見せました。これはかなりのエフォートで,Intelの本気さを感じさせます。また,この古いPentiumを動作させるためeBayで古いマザーボードを探して買ったのだそうです。

  Near Vtはエネルギーの点では良いのですが,クロックが1/10になると10倍チップが必要になります。その分,スパコンのコストが高くなります。また,物量が10倍あると故障率も10倍になります。加えて,電源電圧を下げると中性子ヒットによるエラーの発生率が高くなります。ただし,FinFETは,その構造からみてバルクトランジスタより中性子ヒットに強いと思われますが,FinFET+Near Vtの組み合わせでのデータは見たことが無いので,どの程度であるかは分かりません。

  そして,メモリに関してはMicronと共同開発しているHybrid Memory Cubeのデモを行いました。HMCについては2011年9月13日のマイコミジャーナルに私の記事がありますが,4枚とか8枚とかのDRAMチップをTSVでロジックチップに接続したメモリモジュールで,現在のDDR3-1333を使う4GB DIMMではアクセスに54pJ/bitを必要とするのに対して,第1世代のHMCでも,7.78pJ/bitと1/7のエネルギーになっていると述べました。また,メモリバンド幅に関してもDDR3-1333は10.7GB/sであるのに対して,HMCは128GB/sのバンド幅を持っています。ということで, デモでは120GB/sの読み込みを行う様子を見せました。

  なお,このHybrid Memory CubeはnVIDIAのEchelonでも採用予定で,MicronはnVIDIAのチームにも入っています。

2.テキサス大がKnights Cornerを使う10PFlopsスパコンの導入を発表

  2011年9月22日にテキサス大のTexas Advanced Computing Centerは,IntelのKnights Cornerを使うスパコンを導入すると発表しました。Stampedeと呼ばれるこのシステムは,Intelの8コア Xeon E5シリーズプロセサのデュアルソケットのDELLサーバを数1000台使用し,それをMellanoxのInfiniBand FDR(56Gbps)で接続します。そして,計算ノードはIntelのメニーコア(MIC)のKnights Cornerチップを装備し,全体ではXeon部分が2PFlops,Knights Corner部分が8PFlopsとのことです。そして,メインメモリの合計は272TB,ディスクは14PBとなっています。

  予算は$27.5Mとなっており,日本円では20億円強で,同じ10PFlopsの「京」の1/50です。「京」は開発費や建物なども入っているし,時期が1年以上違うので同列には論じられませんが,Stampedeが非常に安いことは確かです。稼働開始時期は2013年の1月の予定です。そして,その後の4年間には次の世代のMICプロセサの追加などで15PFlopsまでの増強が考えています。運用費用とこの増強などを含めて全体の予算規模は$50Mを上回るとのことです。

  また,Stempedeのうちの128ノードにはnVIDIAのKepler GPUが接続され,リモート可視化に使われるそうです。

  Xeon E5のクロックは不明ですが,先週の話題で紹介した筑波大のシステムと同じとすると166.4GFlopsで,2PFlopsには約12000個必要で,2ソケットサーバなら6000台となりますが,2011年9月22日のHPC Wireによると6400台となっているので,もう少しクロックが低いのかも知れません。

  計算ノード数が6400とすると1ノードにつきKnights Cornerは1.25TFlopsという計算になります。それぞれのXeon E5のPCIe 3.0にKnights Cornerが1個づつ接続されているというのが考えやすい構成ですが,そうすると,Knights Corner 1チップのFlops先週の話題で見積もった値のほぼ半分です。2ソケットサーバの片側のXeonだけにKnights Cornerが付くのでしょうか?それとも,先週の見積もりよりKnights Cornerのコア数やクロックが低く,Xeonと1対1なのでしょうか?

  また,予算の内の$25はサーバとストレージで,Knights Corner部は$2.5Mだそうです。これで6400個とすると,1個当たり$3900ですから,まあ,nVIDIAのM2090などと比べておかしくない値段です。一方,Xeonと同数の12800個とすると$1950で,ちょっと安い感じもしますが,あり得ない値段でもありません。スミマセン。読者の方から計算のけたが間違っているというご指摘を戴きました。正しくは$390で,個数が2倍なら$200弱となり,めちゃ安です。本当にこの値段だとすると,Intelは相当赤字でもユーザを取りたいということでしょうね。

  先週の話題でKnightsの綴りが間違ってました。謹んで訂正いたしました。

@912369

 

 

inserted by FC2 system