最近の話題 2017年10月28日


1.PEZYグループが,Top500で国内1位,Green500で世界1位のスパコンを発表

  2017年10月26日にExaScaler社とPEZY Computing社が共同で,海洋開発研究機構に設置した暁光スパコン(GYOUKOU)がLINPACKで14.13PFlops,14.69GFlops/Wのエネルギー効率を達成したと発表しました。

  PEZY-SCは1024コアでしたが,今回は,16nmプロセスを使う新開発の2048コアのPEZY-SC2を使っています。ただし,チップ上には2048コアが集積されていますが,歩留まり向上のため,使用するのは1984コアとなっています。

  そして,海洋研に設置された暁光の写真では26液浸槽が見えますが,今回の測定は7056チップの構成で,これは13.8液浸槽分と,フル構成の約半分の規模での測定です。

  14.13PFlopsは,今年6月のTop500リストではCoriを抜いて6位,国内ではOakforest-PACSを抜いて1位の性能です。また,14.69GFlops/Wは,今年6月のGreen500での東工大のTSUBAME3.0 の14.14GFlops/Wを抜いて世界1位となる性能です。ただし,11月12日には次回のTop500,Green500が発表されますので,このランキングは,暁光を超える新システムが出てこないという想定でのものです。

  このGreen500性能の達成は,16nmプロセスの採用によるエネルギー効率の改善が大きいのですが,液浸冷却でチップ温度を下げてリーク電流を減少させている点,今回から,マザーボード内を48V DC給電としてI2R電力を減らした点も効いています。

  今回のTop500の性能提出期限は,太平洋時間の11月1日の23:59となっており,時差を考えると,日本では11月2日の午後まで,まだ,数日残っており,さらに性能向上のためのチューニングを継続するとのことです。

  また,PEZYグループは,引き続き暁光スパコンの開発を続け,100筐体程度の規模まで拡張する。メモリには磁界結合を使うTCI(Through Chip Interface)を実用化して,HBM2より高いメモリバンド幅を実現する予定とのことです。

  この開発ですが,PEZY-SC2チップの開発にはNEDO,ZettaScaler-2.xスパコンの開発にはJSTの支援を受けているとのことです。

2.NECが新世代スパコンSX-Aurora TSUBASAを発売

  2017年10月25日にNECは,新スパコンSX-Aurora TSUBASAを発売しました。x86 CPUにPCI Expressで接続するベクトルエンジンで,外観はハイエンドのGPUそっくりです。

  しかし,中身はGPUではなく,NEC開発のベクトルプロセサです。Type 10Bのベクトルエンジンでは,コアのクロックが1.4GHzでピーク演算性能が268.8GFlops,平均メモリ帯域が150GB/sとなっています。この演算性能はこれまでのSX-ACEの5倍の性能となっています。そして,ベクトルエンジンチップには8個のベクトルエンジンが載っており,ピーク演算性能は2.15TFlops,メモリ帯域は1.2TB/s,キャッシュ容量は16MB,メモリ容量は48GBとなっています。

  なお,Type 10Aという1.6GHzクロックのチップもあります。Type 10Aは,演算性能がクロック比例で増えていますが,A500-64という最大64VEのデータセンタ用のモデルだけの提供で,チェリーピックしたもののようです。

  1.2TB/sのメモリ帯域は6個のHBM2の搭載で実現しています。HBM2 1個当たりでは200GB/sです。

   開発者荒木氏のインタビューでは,GPUは演算器を詰められるだけ詰め込んでピーク演算性能を上げており,ディープラーニングには向いているが,Auroraはメモリからのデータ供給を重視しており,ディープラーニング以外の機械学習に強いと述べられています。

  確かに1.2TB/sのメモリバンド幅は大きいのですが,NVIDIAのVoltaも0.9TB/sですからかなり近い値です。8個のベクトルエンジンで2.45TFlos(Type 10A)というのは,80SMで7.5TFlopsのV100より低い並列度でプログラムが作れるのは確かですが,大規模計算では,どうせ,何100,何1000ものチップで分散並列処理をしなければならないので,50歩100歩のような気もします。

  エッジ用の1~8VEのモデルは170万円~,データセンタ用のモデルは64VE搭載で1億2000万円からとなっており,VE 1台当たり200万円程度のお値段のようです。

3.ARMがAIの開発グループを新設

  2017年10月26日のEE Timesが,ARMのAIグループの設立を報じています。ARMフェローのJem Davies氏がAIグループを率いるとのことです。同氏はメディアプロセサなどCPU,GPU以外の専用プロセサを担当してきた人だそうです。

  グループを設立し,ハード,ソフトのエンジニアを多数集めるとのことですが,人数や予算規模などは明らかにされていません。また,何をやるのかのも発表されていません。LinleyグループのGwennap氏によると,ARMのAI開発はCedence,Ceva,Synopsysなどと比べると3年遅れているとのことで,やるべきことは多そうです。

4.BitcoinチップのメーカーがAIチップのサンプリングを開始

  2017年10月25日のEE Timesが,Bitcoinのマイニングチップを作るBitmain Technologies社がBM1680というMachine Learningアクセラレータを開発し,サンプリングを開始したと報じています。

  Alexnet,Googlenet,VGG,およびResnetでの学習に使用したとのことですが,チップの詳細についてはまだ発表されておらず,11月8日に北京で同社のCEOのMicree Zhan氏が発表するとのことです。

5.NVIDIAがAIクラウドコンテイナーNGCを発表

  2017年10月26日のHPC Wireが,NVIDIAのNGC(NVIDIA GPU Cloud)の発表を報じています。NGCのコンテイナーはAmazon EC2 P3インスタンスに最適化されたディープラーニング環境が入っており,ユーザがソフトウェア環境を作り上げるための努力を最小にしてくれます。

  コンテイナーとして,NVCaffe,Caffe2,CNTK,DIGITS,MXNet,PyTorch,TensorFlow,Theano,Torchといったプラットフォームと一般的な開発のためにCUDAが用意されています。これらは,単に使えるというだけでなく,GPU用に最適化も行われています。

  そして,なにより,NGCの使用は無料です。ただし,Amazon EC2の使用は有料です。

6.AMDがRyzen CPUとVega GPUを組み合わせたAPUを発売

  2017年10月26日のThe Inquirerが,AMDのRyzen+VegaのAPUの発売を報じています。

  Ryzen 7 2700UとRyzen 5 2500Uの2品種で,どちらもCPUは4コア,8スレッドです。Ryzen 7 2700Uはクロックが2.2GHzで3.8GHzまでブーストできます。Ryzen 5 2500Uの方は,2GHzとブースト時3.6GHzとなっています。L1$は64K I$,32KD$,512K D$/Coreは同じです。

  Vega GPUの方は,Ryzen 7は10CU,最大1300MHzクロックに対して,Ryzen 5は8CUで最大1100MHzクロックとなっています。

  消費電力は,どちらも9-25Wで,15W Nominalとなっています。

  AMDの得意のCinebenchではRyzen 7 2700Uは707,IntelのCore i5 7600Kは662と小差ですが,Ryzen 7は15WTDPであるのに対して,Core i5の方は91W TDPと大差です。

  このチップの価格は発表されていませんが,多分,Core i5 7600Kより安いのでしょうね。とすると,ハイエンドノートブック用としてはRyzen 7,Ryzen 5は魅力的です。

  

inserted by FC2 system