最近の話題 2013年6月29日

1.Top500のランキングルールが変わる?

  2013年6月21日のThe Registerが,何がLINPACKを置き換えるべきかと題する記事を載せています。また,2013年6月25日のマイナビに,私の解説記事が載っています。

  多くの科学技術計算で連立1次方程式を解くことが必要になりますが,元数が小さい場合は,係数行列が比較的密であったのに対して,数100万元,数1000万元ともなると必然的に疎行列となります。

  LINPACKは密行列の連立1次方程式を解くもので,それで1000万元というのは現実と合うないというのが,Top500の主催者でHPL(High Performance LINPACK)の開発者でもあるJack Dongarra先生の新ベンチマークの提案の趣旨です。

  新ベンチマークとしてはHPCGというGonjugate Gradient法で,疎な係数行列の巨大連立1次方程式を反復法で解く(繰り返しで正しい解に収束させる)というベンチマークを提案しています。

  HPLの主要な計算は行列同士の積で,メモリのR/Wの回数は元数の2乗で増えるのに対して,演算は3乗で増え,演算量に対してメモリアクセスが少なく,主に演算器の性能だけが効く問題になっています。また,HPLは,スパコンの多数の計算ノード間の通信も計算のバックグラウンドに隠れるという巧妙なプログラムになっています。

  これに対して,HPCGの場合は,各計算ノードが疎行列の何行かのブロックを分担するというノード分割で,この部分行列と密ベクトルの積を計算するというのが主要な計算になります。なお,各行は要素の列位置と値が書かれているSparse Row形式で格納されているので,密ベクトルの要素のアクセスは間接参照の形になります。

  アクセスする密ベクトルの要素が自ノードにあるとは限らず,他のノードからMPIで送ってもらう必要が出る場合もあります。実際の問題では非ゼロ要素は対角線の近くにあるものが大部分なので,比較的近傍のノードにある場合が多いのですが,それでもMPI通信のレーテンシが問題になりそうです。また,行列積に比べて,演算あたりのメモリアクセス回数が多く,ピーク演算性能 に近い性能を出すのが難しくなります。

  そして,全ノードで計算を終わり,解の密ベクトルを更新するためには,全ノードの処理結果を集める必要があり,All-Reduceが必要になります。このMPI処理に掛かる時間も大きなポイントになります。

  ということで密行列のHPLと比べてHPCGは,かなり,性格の違う性能バランスが要求されることになると思われます。

  しかし,巨大連立1次方程式を解くという問題は,疎行列になってしまっているので,HPLからHPCGにベンチマークが変わるというのは現実の用途に即していると思われます。ただし,現在は単なる提案という位置づけで,具体的にいつ変わるというような話にはなっていないようです。

2.Graph500 Tianhe-2は6位

  ビッグデータのグラフ処理の性能を競う2013年6月のGraph500がISCで発表されました。

  1位はローレンスリバモアのSequoiaで104万8576コアを使い,1563GTEPSを達成しています。2位は同じBG/SのMiraで14328GTEPSですが,78万6432コアですから,効率的にはこちらの方が高くなっています。そして,3位もBG/QのJUQUEENです。4位に京コンピュータが入り,52万4288コアを使い5524.12GTEPSを達成しています。そして,5位がFermiで,Top5中の4システムがBG/Qです。ここまでは,昨年11月の リストから変わっていません。

 そして,中国のTianhe-2が19万6608コアを使って2061.48GTEPSで6位に入っています。比較的,短い時間でこれだけの性能を出したのは頑張っていると思います。なお,Xeon E5コアは38400コアしかないので,コア数からみてXeon Phiのコアも使っていることになります。その場合,総コア数は312万なので,今回の結果は全体の6〜7%のハードウェアしか使っていないことになります。

  日本勢では東大のOakleaf-FXが13位,高エネ研のSAKURAが14位,東工大のTSUBAME2.0が22位といったところです。

3.ECMWFが次期システムとしてCRAYのXC30を選択

  2013年6月26日のHPC WireがECMWF(European Centre for Medium-Range Weather Forecasts)が次期システムとしてCRAYのXC30を選択したと報じています。

  1990年代の日本のベクトルスパコンが強かったころはECMWFは富士通のスパコンのユーザだったのですが,その後,IBMに奪われ,POWERスパコンの時代が続いていました。

  それが今回,XC30になるとのことです。規模は数PFlopsと書かれているだけで,詳細は明らかにされていません。

  日本の気象庁も日立のPOWERスパコンで,世界的にみても気象関係はPOWERの牙城という感じですが,このECMWFを突破口に気象関係にXC30が浸透していくのでしょうか。

4.Imagination TechnologiesがMIPSプロセサのロードマップを発表

  昨年12月22日の話題で紹介したようにCPUのIPメーカーであるMIPSをPowerVR GPUコアのIPメーカーであるImagination Technologiesが買収したのですが,そのImagination Technologies社が2013年6月26日にMIPS CPUのロードマップを発表しました。

  現有の製品であるAptivシリーズは,最上位のProAPtivを最大6コアまで拡張したり,最下位のmicroAptiveには付かなかったFPUを付けられるようにしたりなどの構成の範囲を拡張しててこ入れを行っています。

  そして,今年末までにMIPSシリーズ5と呼ぶ新CPUコアを出すとのことです。このコアはWarriorというコードネームで開発されたもので,32bitコアと64bitコアがあります。

  Warriorコアはハードウェア仮想化,マルチスレッド,スケーラブルなセキュリティー機構,MIPS SIMDをサポートし,Best in classの性能と効率を提供すると書かれていますが,これらの機能は,他のプロセサでも既に実現されており,この説明からはどの程度の優位性があるのか全く分かりません。

  Cortex CPUコアとMali GPUで攻勢を強めるARMに対抗して,買収から半年という短い期間で,ImaginationがPowerVRと組み合わせるMIPSコアのロードマップを発表したことは評価できますが,これからのお手並み拝見というところです。

@1141902

  

inserted by FC2 system