最近の話題 2012年7月7日

1.Green500は20位までBG/Qが独占

  Top500にランクされたスパコンのLINPACK値/消費電力を比較するGreen500が発表されましたが,1位から20位までずらりとBG/Qのシステムが並ぶという結果になりました。BG/Qの中でも小規模なシステムが上位にランクされ,今回Top500で1位となったSequoiaは20位です。しかし,MFlops/Wでは1位が2100.8に対して,20位のSequoiaは2069.4と殆ど違いはありません。

  21位はIntelのMICを使うDiscoveryスパコンで,1380.67MFlops/WでBG/Qの2/3程度のエネルギー効率です。そして,22位に1379.79MFlops/Wで長崎大のDEJIMAクラスタが入っています。東工大のTSUBAME2.0は28位,東大のFX10のOakleaf-FXは43位となっています。

  Green500のエネルギー効率でランクするというアイデアは良いのですが,同一のマシンだと,ほぼ同じ値になってしまい,今回の結果のように,上位を1つのシステムが独占してしまうと,競争としては面白みがありません。計算ラックの電力だけでなく,空調の電力等を含めると同じマシンでも センターの作りで差が出てくると思いますが,このような測定は非常に困難で,複数のマシンが設置されていると,空調電力をどう配分するか,「京」センターのように都市ガスを使うコジェネで一部の電力や冷水を作っている場合は,どう計算するべきかなど,多くの困難があります。

2.Graph500も1,2位はBG/Q,東大のOakleaf-FXが4位と健闘

  巨大なデータの集積から,着目するパターンを見出すというグラフ問題の性能を競うのがGraph500です。2つの頂点とその間を結ぶ線(Edge)を示すデータの集まりを処理してグラフを作り,そのグラフをサーチするというベンチマークで,Giga Traversed Edge Per Second(GTEPS)というのが性能の単位です。

  グラフに含まれる頂点の数は,システム規模に応じて指定できるようになっており,今回1位になった32ラックのBG/Qのシステムでは2**38となっていますが,小規模な測定では2**24という小さなものもあります。ただし,頂点の番号は48ビットで,ランダムに出てくるので,これをどのように格納するかが問題で,後のサーチがやりやすく,かつ,システムのメモリ構造と通信性能を考慮して性能が出るデータ構造にする必要があります。

  そして,作ったグラフをBreadth Firstという方法でサーチして行きます。この時,毎秒,何エッジを処理できるかというのが性能の評価となります。2**38頂点の場合は,その格納に100TB近いメモリが必要ですが,通常,Graph500の測定では,毎回,ディスクにアクセスしては性能が出ないので,これを分散して各計算ノードのメインメモリに置きます。

  今回のGraph500の1位はSequoia,2位はTop500 3位のMiraで,測定はフルシステムではなく,どちらも32ラックのシステムで行っており,2**38頂点で3541.00GTEPSをマークしています。3位はIBMのPOWER775サーバの1024ノードのシステムで2**35頂点で508.5GTEPSですから,BG/Qはぶっちぎりの強さです。 この強さは単に,ノード数が多いというだけではなく,データ構造や処理アルゴリズムの点でも工夫されているものと思われます。

  そして,4位は東大のOakleaf-FXで4800ノード(20ラック)で2**38頂点で,358.1GTEPSです。東工大のTSUBAM2.0がこれに続く5位で,1366ノード(ただし,各ノードにNVIDIAのM2050を3台接続)が2**35頂点で317.09です。GPUを使うヘテロなスパコンとしては東工大のTSUBAME2.0が最高位です。

  なお,「京」スパコンはGraph500にはエントリしていません。

3.「京」スパコンが完成し,9月末から共用を開始

  2012年7月2日に,理研と富士通は,京コンピュータは6月29日に最終的な動作確認試験を終えて完成し,9月末から供用を開始する予定と発表しました。

  ハードウェアは昨年夏頃に全て揃っていたのですが,何しろ8万ノード余りという超並列システムですから,昨年の秋から,大規模システム環境下におけるオペレーティングシステム(OS),ジョブマネージャ,並列化ライブラリなどシステムソフトウェアの整備・調整を行ってきたとのことです。

  そして,6月29日に確認試験をパスしたということでしょう。これで検収ということで,お金が支払われるので,富士通にとってはめでたしめでたしです。

  システムソフトウェアの整備・調整と並行してグランドチャレンジアプリケーションや一部の戦略プログラムの参加者のプログラムを走らせ,アプリのチューニングも行ってきていますが,9月末からは,公募などの形で,一般の研究者や企業からの申し込みも受け入れるようになるということだと思われます。以前は11月初めからと言っていたので,約1か月,共用開始が早まっています。

  先日のTop500ではSequoiaに抜かれて2位となりましたが,これからどのようなアプリを開発,運用して成果を出していくかが勝負です。ただし,BG/Qの方は,前世代のBG/Pのアプリがほぼそのままで動くという強みがあり, 実アプリでの運用の立ち上がりは早そうです。

  しかし,Sequoiaは科学目的に使えるのはShake Down期間の6か月だけで,その後は核のカーテンの向こう側に入ってしまうので,まだ,暫くは,科学目的で使えるマシンとしては「京」が最強です。

4.NECが新型ACOSメインフレームにNOAH-6プロセサを復活

  2012年6月28日のIT Proが,NECが新型ACOSメインフレーム用にNOAH6プロセサを開発と報じています。中型のACOSは2004年にItaniumプロセサに移行し,ItaniumでACOSの命令をエミュレートすることにしたのですが,IntelのItanium開発のペースが鈍り,十分な性能向上が得られないので,NOAH6の開発に追い込まれたと思われます。ItaniumではACOS命令をエミュレートするのに対して,NOAH6ではネイティブ実行ですから,Itaniumと比較して3.5倍の性能とのことです。

  メインフレームのユーザは膨大なアプリ資産を持ち,別アーキ,別OSのハードに移行する費用が膨大なので,移りたくても移れない状況で,業務量の増大に伴ってハードの性能アップを要求して来ます。メーカーとしてはそれに応えないわけには行きません。また,利益率は高いので,開発費を考えても,なんとか商売になります。

  NOAHの新プロセサが登場するのは11年ぶりとのことです。この設計者の方々は11年間,どんなお仕事をしていらっしゃったのでしょうね。

  NOAH6を使うi-PX9800/A100は,最大プロセッサコア数が32個(チップは4コアなので最大8チップ)で,最大メモリー容量は32Gバイト。入出力処理性能は従来機の4倍に高めているとのことです。NOAH6プロセサの開発費はNOAH5の半分で,ACOSユーザ20社が導入を検討しているとのことです。しかし,8チップシステム100台でも生涯800チップですから,開発費が20億円 としても1チップあたり250万円の開発費負担となり,チップの製造費よりずっと高くなります。

inserted by FC2 system