最近の話題 2013年2月2日

1.DELLがDELLを買収か

  2013年2月1日のReuterが,世界第3位のパソコンメーカーであるDELLを創業者のMichael Dell氏等が近くLeveraged Buyoutを発表すると報じています。他の報道では,発表は2月4日にも行われるというものもあります。

  買収額は$13〜$14/株で,総額では最大$24B程度となります。これをDell氏とSiver Lake Partners,更にMicrosoftがお金を出して買収し,Dell氏が株式の過半を保持し,Silver Lake PartnersとMicrosoftが少数株主となるとのことです。

  ウオール街の評価に影響されずに会社を運営し,低マージンのPC主体の業態を,サーバなどより広範囲のソリューションを提供する会社に変貌させたいと考えているというのが,買収の理由と見られています。

2.PNNLの3.4PFlopsスパコンはわずか$17M

  2013年1月30日のThe RegisterHPC WireがPacific Northwest National Laboratoryの3.4PFlopsの新スパコンは,僅か$17Mと報じています。HPCS-4Aと呼ばれるこのシステムは,Atipa社が受注し,Xeon E5 2670 2ソケットにXeon Phi 5110Pをつけた計算ノードで,Xeon Phiに5GBのGDDR5メモリ,CPU側に128GBにメモリを搭載します。

  そして,1440ノードをMellanoxのFDR InfiniBandで接続し,42筐体に収容されます。ということで,フルシステムでは6400ノードとなるTACCのStampedeの1/4程度の規模のシステムです。ただし,Stampedeのノードのメモリは32GBであるのに対して,HPCS-4Aは128GBと総メモリ容量では,Stampedeに匹敵します。

  驚くのは,この計算ノード群に2.7PBのDDNのストレージが付いて,DoEのOffice of Scienceが払うのは,たったの$17Mという安さです。なお,TACCのStampedeもOffice of Scienceの予算で調達されたマシンで,Office of ScienceはXeon Phiが好きなようです。

  このシステムは7月から納入が始まり,10月までに稼働の予定ですので,今年11月のTop500には顔を出すと予想されます。

3.イタリアのCinecaのスパコンがエネルギー効率レコードを更新

  2013年1月31日のThe Registerが,イタリアのスパコンメーカーのEurotech社のAurora TigonマシンにNVIDIAのK20Xアクセラレータを搭載するスパコンが3150MFlops/Wのエネルギー効率を達成したと報じています。この スパコンは,イタリア最大のスパコンセンターであるCinecaに設置されています。

  このスパコンの計算ノードは,Intelの8コアXeon E5-2600シリーズCPU 2ソケットと2台のNVIDIA K20Xからなり,64ノードを1/2筐体に収容しています。これでLINPACK 110TFlopsを34.7kWの消費電力で達成しています。昨年11月のGreen500の1位は,Xeon E5-2670とXeon Phi 5110Pを組み合わせたTennessee大のBeaconマシン(LINPACK 110.5TFlops,Top500の253位で消費電力が44.89kW)が2499.44MFlops/Wで1位であったのですが,今回の記録は,これを26%上回る効率です。

  高エネルギー効率の理由ですが,Cinecaは1個のCPUで2台のGPUをドライブし,もう1個のCPUは他の計算に使うという方法を編み出したとNVIDIAのSumit Gupta氏が説明したとThe Registerは報じています。

  EurotechのAuroraマシンは温水による水冷を使っています。故障率の点では,「京」のように12〜13℃の低温の水でチップ温度を低くした方が良いのですが,16℃程度に暖まった水を チラーで元の温度に冷却して循環させる必要があります。一方,40℃程度の温水で冷却すると,温度の上がった水を冷却するのに冷凍機は不要で,ラジエータで空中に放熱すれば済み,冷凍機を動かすエネルギーを節約でき るので,エネルギー効率の改善に貢献していると思われます。

  なお,Aurora Tigonの仕様では水温は18℃〜52℃とフレキシブルであると書かれており,Cinecaのマシンの水温は気温よりある程度高いレベルであることは必須ですが,温度は明示されていません。

4.Geforceの倍精度浮動小数点演算性能がTeslaより低くてもデバグに有効

  2013年1月30日のThe Inquirerが,倍精度FP性能が低いGeforceはコードのデバグやチューニングに有効とNVIDIAのGeoff Ballew氏が述べたと報じています。

  NVIDIAのGPUコンピューティング用のTeslaと同じチップを使っていても,グラフィックス用のGeforceでは倍精度FP演算器を殺して意図的に性能を低くして販売しており,これに関する質問に対して,GeforceでCUDA用のプログラムのデバグやチューニングを行い,完成したプログラムをTeslaを搭載するスパコンなどに持って行って本格的な計算に使うという使い方ができる。

  GeforceはTeslaに比べると値段は1/5かそれ以下で,安いプラットフォームでプログラム開発ができることはメリットである。その意味ではノートPCなどでもCUDA対応のGPUの入ったモデルなら,CUDAプログラムのデバグやチューニングができ,空港の待合室で飛行機の空力計算のプログラムを開発できると述べています。

  なぜ,Geforceでは意図的に倍精度FP演算性能を下げているのかという質問の答えにはなっていないのですが,Geforceの主要な用途である3Dグラフィックスでは倍精度演算は使われないので,不要な演算器は殺しておいて,消費電力を下げ,また,この部分に故障があるチップも良品として使うことでGeforceの売値を下げるという効果もあります。

  しかし,安いGeforceでTeslaに近い倍精度FP性能が使えるとうれしいという人はある程度存在し,その人達にとっては,活かして欲しいというのは理解できます。一方,Geforceでも同程度の性能が出てしまうと,単価の高いTeslaが売れなくなるというNVIDIAの懸念も理解できます。

  まあ,IBMのメインフレームなどは,ハード的に何コア載っているかではなく,何個のコアをエネーブルするかで値段が決まり,ハード量の従量制ではなく,利用できる処理能力の従量制ですから,その点では安いGeforceの倍精度FP演算能力が低いのは当然とも言えます。

 

  

inserted by FC2 system