最近の話題 2017年11月18日

1.第50回Top500とGreen500のランキング

  2017年11月13日にTop500とGreen500のランキングが発表されました。Top500は今年25周年で第50回のリスト発表となります。進歩の速いスパコンの世界で25年も同じベンチマークが使われていることは,驚きといえます。

  今回の1位~3位は,太湖の光,天河2号,Piz Daintで変更はありませんが,4位にPEZYグループのExaScaler社の開発したGyoukou(暁光)がランキングされています。Piz Daintは19.59PFlops,暁光は19135.8PFlopsです。海洋開発研究機構の暁光は26液浸槽が設置されているのですが,今回の結果は19.5液浸槽分の測定となっており,もう少し多くのノードを動かせればPiz Daint超えの3位も可能という惜しい結果でした。

  Top10の中で,Trinityが増設で性能を上げて7位となり,結果として,東大-筑波大のOakforest-PACSが9位,理研の京コンピュータが10位となりました。

  Green500では,PEZYグループのShoubu(菖蒲)System B,Suiren2(睡蓮2),Sakura(桜)が1位~3位を独占しました。菖蒲System Bは理研和光の設置,Suiren2は高エネルギー加速器研究機構の設置,SakuraはPEZYの社内設置のスパコンです。GFlops/w性能はShoubu System Bが17.009GFlops/wと初めて17GFlops/wを超えました。そして,Suiren2が16.759,Sakuraが16.657となっています。

  4位は,NVIDIAのDGX-1 Saturn Voltaで,性能は15.133GFlops/wです。ただし,このスパコンはVolta36と書かれており,PascalベースのDGX-1 Saturnの一部のノードだけをVoltaにアップグレードしたもののようです。もし,NVIDIAが全ノードをVolta化していれば,菖蒲System B超えもあったと思われます。これは私の理解が間違っていて,Green500 4位のシステムはVolta版のDGX-1だけで小規模なクラスタを新規に作ったものでした。従って,HPLの実行では,PEZY-SC2の方がVolta V100よりエネルギー効率が高いということになります。ただし,VoltaはTensor CoreというHPLには使えない大量の演算器を抱え込んでいるので,これがエネルギー効率を低下させている可能性はあります。

  なお,DGX-1 Saturn Voltaは,構成のところには36台のクラスタと書かれていますが,コア数を数えたところXeon 66個,V100 33個であることが分かりました。1Podという単位でDGX-1 36台なので36台ある可能性が高いと思いますが,なんらかの理由で3台は動かしていない状態での測定と考えられます。

  そして,Top500で4位となった暁光が14.173GFlops/wで5位となっています。一つのブリックのなかにいろいろな特性のチップが混ざっていると,最も遅い特性のチップに合わせて電源電圧を上げる必要があり,電力効率が悪くなってしまいます。そのため,特性をそろえるのですが,暁光は規模が大きいので,菖蒲System Bのような調整ができず,そのために電力効率が下がっているとのことです。

  そして,6位は東工大のTSUBAME3.0 ,7位は産総研のAIクラウド,8位は理研のAIプロジェクトのRAIDEN GPU Subsystemと続いており,Top10の内の7システムが日本となっています。

2.Top500の功罪

  Top500は元数の大きな連立1次方程式を解くHPLというプログラムの実行性能でランキングを行っています。1990年代には,HPLの性能と,実際の問題を解く性能の間には高い相関関係があり,HPLは,実問題を解く性能を表す良い指標となっていました。

  HPLは係数が全て非ゼロの連立1次方程式を解いていますが,有限要素法などでは,直接影響を及ぼす隣接ノードはごく一部で,それ以外のノードからの影響を表す項の係数はゼロになります。つまり,大規模な問題の連立1次方程式の場合,全部の係数が非ゼロというのは現実的でなく,大部分の係数はゼロで,ごく一部の係数だけが非ゼロというのが一般的です。

  このため,HPL性能と実問題の計算性能は乖離してきており,疎な係数行列をもつ超巨大連立1次方程式を解く方が,現実の問題に近いということになります。このような巨大疎行列の計算性能を測定するために作られたのがHPCGというベンチマークプログラムです。HPCGの重要性が高まっていることから,今回から,HPCG性能の欄がTop500のエクセルのフルリストに追加されました。

  HPCGの性能では,602.7TFlopsで京コンピュータが1位です。2位は太湖の光で580.1TFlops,3位はTrinityの540.1TFlopsとなっています。なお,暁光のHPCGの測定結果は空欄になっています

  ベンチマークのよるランキングでは,グラフ処理のGraph500,IOの性能を競うIO500などが作られており,ディープラーニングやビッグデータ処理のベンチマークも必要という声が上がっています。しかし,25年にわたるHPL性能によるTop500は,コンピュータ性能の歴史的な向上を見るのには良い指標であり,今後も,使われ続けると見られます。

  多面的に性能を測定するのは良いのですが,測定には手間も計算機時間も必要になります。そのため,NCSAのBlueWatersではHPLの性能測定を行わず,Top500のランキングに参加しないという選択をするところも出ています。

3.IntelがKnights Hillの開発をキャンセル

  2017年11月15日のTop500 Newsが,IntelがKnights Hillの開発を止めると報じています。IntelのデータセンターグループのGMのTrish Damkroger氏が述べたとのことです。

  Knights Landingの次世代のKnights Hillは2018年にアルゴンヌ国立研究所に設置されるAuroraスパコンに使われる予定でしたが,最近の見直しで,Auroraは2021年にExaFlopsとターゲットが変更されてしまいました。延期の原因はIntelのチップ開発の遅れという噂もあります。いずれにしても,Knights Hillの開発を止めて,2021年の新しいAurora用のチップを開発するというのは理解できます。

  2017年11月16日のThe Registerは,SC17で聞いた噂として,Knights Landingの次はKnights Coveという名前になり,Ice LakeというScalable Xeonベースの38か44コアのチップになり,32GBのHBM2メモリを搭載すると書いています。Knights Coveが出てくるのは2019年から2020年とのことです。

  そして,その次はIce AgeとKnights Runというチップで,これがAurora用とのことです。

  IntelのKnights LandingのチーフアーキテクトのAvinash Sodani氏は,昨年9月にCaviumに移っており,そのころにXeon Phiチームはかなり削減されたという噂もあり,Knights CoveやKnights Runが計画通りに進むかどうか懸念する見方もあるようです。

4.IBMが50qubitの量子コンピュータを発表

  IBMは,2017年11月15日に20Qubitシステムのオンライン提供と50Qubitの量子コンピュータのプロトタイプの作成に成功したと発表しました。

  先日のIntelの17Qubit素子の共同研究先への提供に続いて,今回50Qubitというのは,急速な進歩です。量子アニール方式ですが,D-wave社は2011年の128Qubitから,2017年には2048Qubitに集積度を向上させており,これは2年で2.5倍の集積度向上です。この調子でIBMの量子チップのQubit数が増えるとすると,比較的近い将来に実用に使える量子チップができるようになると期待されます。

inserted by FC2 system