最近の話題 2013年5月18日

1.富士通が名古屋大学からFX10を含むハイブリッドスパコンの受注を発表

  2013年5月15日に富士通は,名古屋大学からFX10を含むハイブリッドスパコンを受注したと発表しました。

  このシステムは,京コンピュータの商用版であるSPARC64 \fxプロセサを使うPRIMEHPC FX10が384ノード,Xeon E5 2ソケットのPRIMERGY CX400 552ノードで構成され,CX400のノードの内の184ノードにはXeon Phiアクセラレータが付けられています。

  システム全体のピークFlopsは561.4TFlopsとなっています。このシステムは将来,3662.5TFlopsまで拡張するとのことですが,何時ごろ,どのような形で拡張されるかについては触れられていません。

  384ノードのFX10は90.8TFlopsで,このシステム全体のFlopsの16%程度です。また,384ノードは4筐体で,4筐体クラスタ 1台というシステムと考えられます。

  PRIMERGY CX400は1ラックに最大84ードを搭載できますが,GPUカードを付けたノードの場合は42台までとなっています。すべて42ノード搭載とすると,13筐体あまり必要になりますが,GPU無しのノードは84ノードを1筐体に入れれば,GPUつきノードが4.4筐体,GPU無しノードが4.4筐体で,9〜10筐体となります。ただし,これはノード間のネットワークのスイッチやストレージなどが含まれていませんので,システム全体の筐体数はもっと多くなります。

  このPRIMERGYのシステムは物理的にはノード単位の分散メモリですが,ScaleMP社のvSMP Foundationハイパバイザソフトを導入して,複数ノードを束ねて仮想的なSMPとして利用できるようになるとのことです。

  なお,富士通CX400のハードウェア構成表にはNVIDIAのFermi GPUを使うアクセラレータがオプションボードとして載っていますが,Xeon Phiボードは載っておらず,新オプションです。仮に,このボードが60コアのXeon Phi 5110Pを使っているとすると,16Flop×60コア×1.053GHz=1010.88GFlopsで,これが184枚ですから,全体で186TFlopsとなります。もし,スパコン向けの61コア,1.1GHzのSE10Pを使っていれば,もう少しFlopsは高くなります。

  561.4-90.8−186=284.6TFlopsで,552ノードですから,ノードあたり515.58GFlopsとなります。8コアのXeonE5が2チップですから,コアあたり32.2GFlopsで,クロックは約2GHzとなります。より高速のCPUも用意されていますが,消費電力が小さいチップを選んだと思われます。

  FX10の受注発表は,昨年6月の台湾中央気象局,8月の東大物性研からの384ノードの受注に続くもので,8システム目となり,目標まで残り42システムです。合計の受注ノード数は11340ノード(ただし,台湾中央気象局のノード数を東大のOakleaf-FXと同じと想定)となります。

2.HPが巨大インメモリデータベース用のKraken Projectの存在を公表

  2013年5月16日のThe Registerが,HPがSAPの技術者と共同で,巨大メモリを持ち,SAPのHANAデータベースを搭載するシステムを開発していることを明らかにしたと報じています。

  全部のデータをメインメモリに格納すると,HDDを使うのに比べて,高速のデータベース処理が可能になります。SAPのHANAは,このようなインメモリデータベースで,これを走らせるには大容量のメインメモリが必要になります。

  HPのConverged SystemsのVPのMiller氏は,このマシンは最大16ソケットで,将来のXeon E7プロセサを使い,最大12TBのメモリを搭載すると述べたと報じています。

  HPはItaniumベースのSuperdomeサーバの技術をXeonに転用するProject Odysseyを進めており,ハードウェア的にはこのマシンがKraken Projectに使われると見られています。現在のXeon E7はWestmereベースですが,今年の終わりまでにはIvy-BridgeベースのXeon E7が登場すると見られ,この時期にOdysseyやKrakenも発売されるのではないかとThe Registerは推測しています。

3.仮想の共通メモリマシンを作るScaleMPのvSMP

  2013年5月12日のThe Registerが,ScaleMP社のvSMPの記事を載せています。

  一般的な仮想化は,1つのコンピュータを仮想的に複数のコンピュータに分割するのですが,vSMPのハイパバイザは,複数のコンピュータをひとつにまとめるハイパバイザです。vSMP 5.1では,ノード間の接続に56Gbit/sのFDR InfiniBandサポートしています。FDRは約6.8GB/sのバンド幅があり,6.7GB/sというSGIのNUMALink 6と同レベルのバンド幅のインタコネクトでノード間を結ぶことができます。

  vSMP Foundation Advanced Platformという製品は,最大128ノードをInfiniBandスイッチを経由して接続することができ,ノード間のInfiniBandのリンク本数を最大4本まで増やしてバンド幅を上げることもできるようになっています。

  巨大メモリを必要とする場合,8ソケットとかそれ以上のサーバを購入しようとすると,基本価格が高く,例えば8ソケットで4TBのメモリのシステムは$33万となりますが,4ソケットのvSMPで4TBのメモリを搭載したシステムなら$20万弱と大幅に安くできるとのことです。

  従来のvSMPは複数台のサーバをひとつのSMPに見せるものだったのですが,ScaleMPは,vSMP Memory Expansionという新製品を出しました。このシステムは,例えば4ソケットの高速CPUを搭載したCPUノード1台と2ソケットでDIMMを24枚搭載できる多数の安いサーバをInfiniBandで接続し,安いマシンのCPUはメモリノードとして,メモリコントローラ,IBコントローラとvSMPを走らせるだけに使い,安いマシンのメモリを共通空間のメモリとして使うという形のシステムとなります。

  OracleなどのデータベースはCPUやコア単位でライセンス料が決まっており,CPUやコアが増えるとそれに比例してライセンス料が高くなります。しかし,このvSMP Memory ExpansionならCPUカウントはCPUノードのサーバ分だけで,多数の安いサーバのCPUはアプリは走らないので,カウントに入らず,ライセンス料も安く上がります。

  ということで,vSMPは,SGIのNUMALinkで巨大SMPを作るUV1000,UV2000マシンの対抗となり,ScaleMPは,SGIのマシンより20%性能が高く,20%多くのメモリを20%安いコストで提供できるといっています。また,巨大メモリを搭載するHPのOdysseyのようなサーバの対抗ともなりそうです。

  そして,ScaleMPはMemory Expansion Freeという無料でダウンロードして使える版を来月ころから提供する予定とのことです。このFree版は最大4ソケットのCPUノード1台とメモリノードが最大8台までで,メモリの総量は1TBという制限がありますが,この範囲内でも結構使えるケースはありそうです。また,有料のMemory Expansionをライセンスする前に,試験的にFree版を使って使い勝手を確かめるという用途にも使えます。

4.NASAとGoogleのチームがD-Waveの量子コンピュータを購入

  2013年5月16日のThe Registerが,NASAとGoogleのチームがマシンラーニングの研究のために,D-Wave社の量子コンピュータを購入し,Ames Researchの中のQuantum Artificial Intelligence Labに設置すると報じています。

  このマシンは512qubitのチップを使うD-Wave 2システムで,$15Mと書かれています。D-Waveの量子コンピュータは量子のもつれを使うタイプではなく,量子的な緩和効果を使うもので,これは量子コンピュータではないという見方がありますが,同等のことができるという学者もいて,本当のところは良く分かりません。いずれにしても512qubitというのは,他の方法で作られた量子コンピュータに比べると圧倒的に大規模です。また,開発中の2048qubitのチップができたら,これにアップグレードされるとのことです。

  ただし,緩和効果を使うので,外部からエネルギーが入ってくると正しい答えが得られなくなってしまうので,絶対温度の20ミリ度という低温に冷やす必要があり,また,外部磁界も厳重に遮断する必要があります。

  そして,プログラムやデータを書き込む時にエネルギーを消費してチップの温度が上がるので,これが冷えるまで待つ時間が,計算時間のうちのかなりの比率を占めています。また,読み出した答えは確率的にしか得られないので,同じ計算を100回やらせて確率を求めるというように,多数回の計算が必要となります。

  NASAとGoogleは,このマシンをマシンラーニングの研究に使用するとのことですが,20%のマシンタイムはUniversities Space Research Associationに割り当てられるとのことです。

  D-Waveとしてはロッキードマーチンに売ったのに続く2台目の商用出荷と思われます。なお,ロッキードマーチンのマシンは128qubitのD-Wave 1です。

  

  

 

inserted by FC2 system