最近の話題 2011年6月25日

1.「京」コンピュータがTop500 1位を獲得

  ドイツのハンブルグで開催されたISCに合わせて,恒例のTop500リストが更新されました。ここで,日本の「京」コンピュータが8.16PFlopsを出し,1位に輝きました。

  京コンピュータを日本が開発していることは周知の事実でしたが,発表された工程から見て,全システムの納入完了が2012年の初め頃で,Top500に登録されるのは2012年6月と見られていました。少し,工程を前倒しして2011年11月の可能性は?と理研の人に聞いたところ,可能ならやりたいという回答で,早くても11月と思っていたところに6月の登録ということで,私も驚きましたが,世界的に関係者 (特に中国の天河1Aの関係者)は驚いたと思います。

  京コンピュータの目標はLINPACKで10PFlopsなので,製造の前倒しと,納入が間に合った80%程度の規模のシステムで測定することによって,大方の見方より1年前に登録することによって1位を獲得したということができます。まあ,Dongarra先生の言によると,同じ10PFlops目標のBlue Watersが遅れているとのことで,今年の11月でも間に合ったのかも知れませんが,6月にLINPACK値を登録して2位の天河1Aの3倍以上の性能という輝かしいデビューとなりました。2GHzクロックのSPARC 64[fxプロセサを使い,全部で548352コアを使用して,ピーク性能は8.77PFlopsで,LINPACKで8.162PFlopsをたたき出しています。ピーク比は93.03%で,天河1Aが54.58%,Jaguarが75.46%であるのと比較すると,これは非常に高い値です。

  SPARC  64[fxは8コアで,548,352コアは68,544チップです。そして,1筐体の計算ノードは96なので,これで計算すると714筐体となると書いたのですが,本当は672筐体というコメントがありました。672筐体とすると,筐体あたりのチップ数は102となります。実は,筐体には96計算ノード以外にもI/Oノードが6個あり,ここにもSPARC  64[fxが使われています。LINPACKの処理時にはI/Oは不要なので,このI/O用の6チップを計算に回したと考えると辻褄があいます。

2.Top500 1位の意味とコストは

  マイコミ の記事に,大方の予想を裏切って,米国のBlue Waters,Sequioa,TitanなどのライバルがLINPACK性能を登録する前の今年6月に8割規模のシステムでLINPACKを測定して登録したのは作戦勝ちと書いたのですが,読者のコメントで,「1位じゃなきゃダメだから」実績を作ったというのがありました。私もそう思いますが,多額の税金を使っている以上,納税者に分かりやすい説明というのも必要です。もちろん,地球温暖化やその他の巨大計算を行って他のシステムではできない成果を上げるのは重要ですが,それで自分の税金が有効に使われた理解できる人は多くないと思います。八つ当たり気味とは思いますが,1位になったり,良い成績を上げることが重要でないなら,オリンピックの選手の養成に税金をつぎ込む必要はありません。ギリシャ時代は42.195Kmを走って「わが軍勝てり」と伝えることは重要であったと思いますが,今なら 速く走らなくても携帯で言えば済みます。

  また,今年の6月に待ち合わせるために,計算ノードの納入を半年近く前倒ししていると思いますが,これは必ずしも簡単ではありません。

  決算書類によると,富士通のシステムプロダクトの売り上げは3000億円強です。これにはIAサーバ,メインフレーム,ストレージなどが入っているので,SPARCサーバの売り上げは1000億から1500億円と思われます。そして,1CPUあたりの売り上げが100万円と考えると,年間10万〜15万個のSPARC CPUを製造販売しているという計算になります。これは非常に粗い計算なので相当の誤差があると思いますが,桁が違うということはないと思います。つまり,今回の京コンピュータに使われた 約7万チップは富士通の通常のSPARCサーバの売り上げの半年分程度の規模で,通常の商用サーバの生産に加えて,それを半年程度で作ったということは生産ペース を2倍に引き上げたことになります。

  この京コンピュータの売上が今後も続くなら半導体の製造やサーバの組立,検査工場などに設備投資してもペイしますが,来年はこれほどの売り上げにはならないのは確実なので,それほどお金は掛けられず,いろいろなやりくりでこれだけ早期に生産した富士通の製造部門の人達の努力は称賛に価します。

  今回,8PFlopsを達成したので,11月のTop500で,当初目標の10Fflopsの実現は確実と言って良いでしょう。Dongarra先生はBlue Watersは遅れていると言っているので,次回も京の1位は守れる可能性が高いと思われます。

3.京コンピュータはエネルギー効率も高い

  京コンピュータは約10MW(9898.56kW)の消費電力で歴史上最大の消費電力のシステムですが,性能も高いので825MFlops/wとTop500にリストされたシステムの中で3位となっています。世の中ではGPUを使ったシステムが性能/電力性能が高いというのが常識ですが,京コンピュータはGPUを使う天河1Aが635MFlops/Wであるのに比べて高い性能/電力を実現しています。

  確かにGPUはCPUより演算効率は高いのですが,CPUとのデータ転送が必要などの理由で,天河1AやTSUBAME2.0のようなGPUを使うシステムではピーク演算性能の半分程度のLINPACK性能しか実現できていません。これに対して京コンピュータのSPARC64 [fxプロセサではピークの93%という高い効率を実現しています。

  この高いピーク比率には色々と理由があると思いますが,その一つとして,浮動小数点レジスタ数の32個から256個への拡張が効いていると思います。レジスタ数が多いと,レジスタだけで出来る計算が増え,メモリ(キャッシュ)へのアクセスの回数を減らせます。このため,ピーク比率は上がるし,消費電力も節減できます。

  10MWという消費電力は大きいのですが,SPARC64 [fxは30℃,Typeで58Wという低い消費電力を誇っています。もちろん,徹底したクロックゲートなどの省電力設計となっていると思われますが,この30℃とTypeも効いています。チップ温度が下がるとトランジスタのドレイン電流が増え,性能が上がります。逆に言えば,小さ目のトランジスタで同じクロックが実現できます。また,リーク電流も大きく減ります。うろ覚えですが,80℃と比べると10W位は違うというような話だったと思います。

  また,IntelなどのTDPは製品としてのばらつきの最大値をいう訳ですが,この富士通の58Wは平均値です。この部分でも平均値と最大値(ただし,Intelは試験で選別しているので,それぞれの型番ではばらつきは小さくなっている)の違いでも10W位の違いが出てくる可能性があります。つまり,SPARC 64[fxは通常の使用状態の仕様では,もっと,大きな消費電力になります。しかし,京コンピュータでは水冷で30℃で使い,大量のチップを使うので,消費電力も平均値になるので,58Wと見込めば良いわけです。

4.京コンピュータは信頼性も高い

  今回のLINPACKの規模は10,725,129元の連立1次方程式を解いており,従来,Jaguarの547万元の2倍近い規模です。Dongarra先生によると,8.16PFlopsの性能でこの計算をするには28時間かかるとのことです。つまり,このシステムは28時間くらいは故障なく,連続で走るという信頼性があることを示しています。

  当然と思うかもしれませんが,7万チップのシステムが28時間故障しないということは1チップのシステムに換算すると,219年故障しないということになります。これは通常のPCやサーバに比べると,非常に低い故障率です。

@878479

 

 

inserted by FC2 system