最近の話題 2018年11月24日
1.SC18で中国がエクサスパコンのプロトタイプについて発表
2018年11月19日のTop500 Newsが,SC18におけるDepei Qian教授の中国のエクサスパコンのプロトタイプに関する発表について報じています。
それによると,中国のエクサプロジェクトはピーク1ExaFlopsをターゲットにしており,HPLで1EFlopsがターゲットではないとのことです。そして,メモリは10PB以上の容量で,インタコネクトはノード間の通信バンド幅が500Gbit/sだそうです。システムのエネルギー効率は30GFlops/Wだそうです。これで単純計算すると消費電力は33MWとなります。
中国では,Sugon(曙光)とTianhe(天河)とSunway(神威)の3グループがエクサのプロトタイプを開発しており,いずれもこの10か月の間に設置が完了したとのことです。Sugonのプロトタイプは512ノードの規模で,x86互換のHygon CPUを1024個,Hygon DCUアクセラレータを512個使います。ノード間のネットワークは200Gbps/Nodeの6Dトーラスです。ピーク演算性能は3.18PFlopsで,HPL性能は2.274PFlopsでピークの71.5%とのことです。
Hygon DCUは本来1024個搭載ですが,プロトタイプでは半分の512個だけを使用するようです。これから計算するとHygon DCUの演算性能は6TFlops程度と見られます。元々の計画は15TFlopsでしたから,Hygon DCUの性能は2.5倍に向上させる必要があります。
Hygon CPUは1TFlops程度の性能を予定しており,こちらも性能を引き上げる必要があります。現在のプロトタイプは初代のZen CPUが使われていると見られますが,Zen2,あるいはZen3のライセンスを考えていると見られます。
200Gbpsの6Dトーラスの技術はどこの技術かは不明です。
そしてSugonのマシンは,沸騰液浸を使うとのことです。冷媒の沸騰温度は50℃です。次の項のNebulaはこのための開発と思われます。
Tianheのプロトタイプは,各種のアプリに対応できるフレキシブルなアーキテクチャで,計算とメモリアクセスのバランスが取れた新しいアーキテクチャのメニ―コアプロセサを使うとのことです。
プロトタイプのシステム規模は,こちらも512ノードで3.14TFlops,HPLの性能はピークの78.5%とのことです。
ネットワークは3D Butterflyで,消費電力200W以下のHi-Radixのルーターを使い,どのノードにも最大4ホップで到達できるとのことです。最終的なエクサシステムではノード当たり400GB/sのバンド幅を持つことになります。
Sunwayのプロトタイプは,SW26010メニ―コアチップを使い512ノードでピーク3.13TFlopsの性能を持ちます。SW26010を2個搭載するノードが256個でスーパーノードを構成します。ノード内の256ノードは256×256のフルコネクションを持ち,ネットワークバンド幅は200Gbps(2×25Gbps×4)とのことです。
現在のプロトタイプの性能/電力は11GFlops/Wで,エクサシステムの目標に到達するには約3倍に性能/電力を改善する必要があります。
Sunwayのシステムも液冷ですが,通常のコールドヘッドを使う水冷だそうです。
これら3つのシステムは,どれも512ノードと小規模で,エクサシステムのプロトタイプというよりもテクノロジのテストベッドというべきものです。これらのプロトタイプは完成していますが,改良を必要とする点も多く,2020年にエクサシステムを完成させるのは,難しそうです。
2.カートリッジで沸騰冷却するSugon Nebula
2018年11月15日のServerTheHomeが,Sugon(曙光)の2相型の液冷のNebulaというマシンについて報じています。浸漬液冷で沸騰冷却というのはAllied Control社などが以前から出していますが,11月のSC18で,Sugonがカートリッジ型のプリント板モジュール単位で,沸騰冷却の浸漬液冷を実現したNebulaというシステムを展示しており,それをServerTheHome(STH)が報じています。写真もありますので,是非,STHのホームを見てください。
計算モジュールは4個のHygon Dhyana CPUと4個のNVIDIAのV100 SXM2と,各Hygon CPUに8枚のDIMMが搭載されています。Hygon Dhyana CPUはAMDのライセンスを受けたもので,Epycと互換のものと思われます。このボードがアルミ枠とアクリル板で密閉されたケースに入っており,これが絶縁性の液体で満たされています。すごいのは,バックパネル側に電気信号のコネクタだけでなく,冷媒の液体のコネクタが付いており,ワンタッチで着脱ができるという点です。
ただし,実用上,Allied ControlやExaScalerのマシンのように,電源を切ってある程度の単位で引き上げる方式に比べてどの程度便利かは良くわかりません。
フロリナートのノンスピルコネクタがあるのかどうか知りませんが,多少漏れても,液が減るのと温暖化には少し問題があるとしても,すぐに蒸発してしまうので,動作には問題ないと思います。
私は,Sugonのブースは詳しくは見ておらず,Nebulaを詳しく見た人に聞くと,動作中に引き抜くと泡の発生が止まり,また差し込むと泡が出始めたとのことです。
3.SC18でのStudent Cluster Competitionの優勝は清華大学
SC18で開催されたStudent Cluster Competitionには以下の15校が出場し,LINPACKの最高性能賞は,56.51TFlopsでNanyang Technological Universityが獲得しました。総合優勝は,中国の清華大学でした。
なお,Telkom Universityはインドネシア,Monash Universityはオーストラリア,National Tsing Huaは台湾,Univ. of Warsawはポーランド,FAUはドイツ,そして,Nayangはシンガポール,Tsinghuaは中国です。
16大学が参加しました。LINPACKの最高性能賞はシンガポールのNanyang Technological University,総合優勝は中国の清華大学が獲得しました。