最近の話題 2018年6月30日

1.米国がTop500の首位を奪還

  2018年6月25日のEE Timesが,米国のSummitスパコンがTop500の首位を奪還したと報じています。2013年11月のリストから,中国の天河2号がトップになり,その後,太湖の光がトップになり,これまでトップは中国が占めるという状態になっていました。

  今回の第51回のリストでは,太湖の光は93PFlopsに対して,Oak Ridge国立研究所のSummitが122.3PFlopsを達成してトップを米国に奪還しました。

  2位は,太湖の光で,そして,Summitの兄弟マシンのLawrence Livermore国立研究所のSierraが71.6TFlopsで3位にランクインしました。4位は,中国の天河-2Aでアクセラレータを中国製のMatrix-2000に交換して61.4PFlopsに性能を上げています。産総研のAI Bridging Cloud Infrastructureが19.9PFlopsを達成して5位を獲得しました。

    SummitはIBMのPOWER9 CPU2個に6個のNVIDIA V100を接続した計算ノードを使い,4356ノードでこの性能を実現しています。インタコネクトはEDRのIBです。これに対してSierraはPOWER9 2個に4台のV100という計算ノードを4320ノード使っています。LLNLの用途では,ORNLよりもCPUの比率を多く必要とするとのことです。

  ABCIは日本のAI研究の基盤となるスパコンで,富士通のPrimergy X2570 M4 1088台からなるクラスタで,各ノードは,Xeon Gold 6148 CPUが2個にNVIDIAのV100 GPUを4台接続したノードとなっています。インタコネクトはEDRのInfinibandです。

2.暁光はどこに行った。

  海洋開発研究機構に設置されたPEZY/Exascalerの暁光スパコンは,前回のリストでは19.1PFlopsで4位にランクされていました。しかし,今回のリストでは暁光は見当たりません。

  理研の菖蒲,高エネルギー加速器研究機構の睡蓮2,PEZYの社内設置の桜は,TOP500にランクインしており,今回のGreen500で1位~3位を独占しています。しかし,暁光のプロジェクトはキャンセルされ,現在,海洋開発研究機構から撤去されて,倉庫に眠っているのだそうです。Top500は稼働中のシステムでないとリストに入らないので,暁光は消えてしまったという訳です。PEZYは暁光で20PFlosを達成したと発表しているので,もし,現在の稼働していれば,ABCIより僅かに高いスコアで5位になったのですが,幻になってしまいました。

  これだけのシステムをお蔵入りにしておくのはもったいない話で,PEZYとしては設置して使用してくれるところを探しているとのことです。移転先としては国内に限らず,国外でも良いとのことです。

3.Post-KはHPLでは1EFlopsには届かない

  ISC 2018でVendor Showdownという催しが行われました。これまでも各Vendorが自社の製品や技術を説明するセッションはあったのですが,今回のShowdownではVendorの発表時間が短くなり,モデレータのNASAのRupak Biswas氏とIntersect 360のAddison Snell氏が合計4問の厳しい質問を投げかけるという時間が設けられました。

  富士通の発表者は,Post-Kスパコン開発の責任者を務める次世代テクニカルコンピューティング開発本部第一システム統括部長の清水俊幸氏である。その清水氏が,Post-KのExaFlopsというのは10PFlopsと称している京コンピュータの100倍のアプリケーション性能を目指すという目標であり,HPLでは1EFlopsを達成することは難しいと述べました。

  Post-KはARM v8 SVEアーキテクチャのプロセサを開発して使用すします。SVEも多数の演算器を動かす機構ですが,NVIDIAのGPUほど多数の演算器は搭載していません。従って,HPLで1EFlopsの達成は難しいけれど,Post-Kがターゲットとするアプリケーションの実行性能では,京コンピュータの100倍の性能を実現するという訳です。

  HPLは現在の主流のアプリの振る舞いと一致せず,HPLの高いマシンを目指す設計は,アプリの実行性能を上げることと一致しないという指摘は一般的であり,HPLを上げることを主要な目的としないのは正しいことと思います。しかし,10PFlopsの京コンピュータの100倍のアプリ性能だから1EFlopsということにすると,現在の半導体のプロセスルールのように,10nmとか7nmとか言ってもゲートのハーフピッチとはかけ離れた表現になってしまうのが心配です。




inserted by FC2 system