最近の話題 2016年12月3日

1.Oakforest-PACSが京コンピュータを抜いて国内トップに

  2016年12月1日に東大と筑波大が共同運営するOakforest-PACSスパコンが正式稼働を開始し,Top500のランキングで京コンピュータを抜いて,国内では1位になりました。京コンピュータがTop500の1位になったのは2011年で,稼働寿命が一般には5年程度のスパコンですから,もう退役の時期で,まだ,国内2位というほうが驚きかも知れません。

  Oakforest-PACSは,東大の柏キャンパスに設置されており,東大の本郷キャンパスと筑波大のほぼ中間地点にあります。

  Oakforest-PACSは,IntelのXeon Phi (Xeon 7250)を8208個使用し,ピーク演算性能は,24.9PFlopsとなっています。この性能は,京コンピュータの2.2倍です。しかし,LINPACK性能は13.55PFlopsで,京コンピュータの10.51PFlopsを30%程度上回っているだけです。

  その理由ですが,マルチコアCPUの場合は,一般にピークの90%以上のLINPACK性能が得られるのですが,多数の演算器を積んで一つの命令で多数の演算を実行させるGPUやXeon Phiでは,ピークの50%~70%程度のLINPACK性能に留まるのが一般的です。

  それにしても,54.4%は低いのではないかと,SC16の展示ブースで聞いてみたら,KNLで512bit SIMDのAVX2命令を使うと消費電力がオーバしてしまうので,SIMD演算器のクロックを抑えるので,実際問題として24.9PFlopsのピーク性能にはならないとのことでした。なにか,Intelの看板に偽りありという感じです。

  また,温度でクロックを変える時代ですから,一定のピーク演算性能という考え自体が間違いという気もします。

  この8209個のXeon PhiノードをOmini-Pathを使うFat-Treeで接続し,940TBのバーストバッファと,26PBの並列ファイルシステムを接続しています。バーストバッファと並列ファイルシステムはDDN製です。

  Xeon Phiの冷却はASETEK社の水冷システムを使っていますが,DRAMやOmni-Path NICは空冷で,リアドアのクーラーで熱を吸収しています。また,DDNのストレージやOmni-Pathのディレクタスイッチは空冷のようで,排気側はかなり熱くなっています。これらは壁際に設置されたCRACで冷やしており,あまり,効率は良くなさそうです。このコンピュータルームの冷却は,この建屋が作られた時から決まっているということで,最新のテクノロジを使うという訳には行かなかったようです。

2.産総研が130PFlopsのAIスパコンを導入

  2016年11月29日のTop500ニュースが,産総研(AIST)が2017年の遅い時期に,AI Flopsで130PFlopsの性能を持つAI向けのスパコンを調達すると報じています。現在は資料招請が出たところで,どのようなシステムとなるのか不明ですが,仮に,倍精度ではAI Flopsの半分の65PFlopsに相当すると考えると,Oakforest-PACSの3倍近い規模のスパコンということになります。米国の新システムを別としますと,太湖之光には及びませんが,天河2号を超える性能になる可能性があります。

  一方,AI Flopsが0.25DP Flopsの場合は,30P DPFlops程度で,Oakforest-PACSを抜いて国内トップにはなりますが,天河2号などには追い付けません。

  このスパコンは,AI Bridging Cloud Infrastructure(ABCI)と呼ばれます。Cloudという単語が入っているので,広い範囲のユーザが使えるようにして,AI研究や産業応用を促進しようという狙いと思われます。

  消費電力目標は3MWで,倍精度性能が65PFlopsとすると,22GFlops/W程度ということになります。
Green500 1位DGX-1スパコンが10GFlops/Wに達していない現状で,どのような提案が出てくるのか興味深いところです。

  なお,予算額は195億円です。

3.富士通がDeep Learning Unitを発表

  2016年11月29日のPC Watchが,富士通のDeep Learning Unit(DLU)の発表を報じています。他社と比較して10倍の性能/電力を目標,スパコンのネットワークのノウハウを活用し,大規模並列が実現できるとのことですが,それ以外は,なにも分からない発表です。来年のHot Chipsあたりでの発表を期待したいところです。

  当初は社内で使い,その後,外販も検討していくとのことです。

  なお,11月29日の発表の中心は,迅雷 AIプラットフォームでの各種のAIサービスの提供で,こちらはNVIDIAのP100を使っています。

4.RISC-VのWorkshopに330人余りの参加者

  2016年12月1日のEE Timesが, Mountain Viewで開かれた第5回のRISC-Vのワークショップに330人あまりが詰めかけ,初期のlinuxの集まりのような熱気であったと報じています。

  RISC-VはU.C.BerkeleyのDavid Patterson教授等が,当初は教育プロジェクトとして作ったのですが,本当に使えるものに強化されてきています。このため,産業界からも,期待を集め,ビジネス化を狙う人も集まって来ています。

  Transmetaを作ったDave Ditzel氏は,Esperanto TechnologiesというマルチスレッドRISC-Vを開発するスタートアップを起こし,このワークショップにも参加していたとのことです。

  RISC-Vの魅力は,ライセンスがタダというのが第1で,IoTなどの低価格の装置のコントローラの場合は,ARMコアのライセンス料はかなりの出費です。もう一つの魅力は,命令アーキテクチャなどを自由に改変できることで,新しい命令を追加して,その効果を調べるということが簡単にできる点です。

  無料のコアが普及すると,ARM等にとっては脅威で,このワークショップにはARMのエンジニアも偵察に来ています。

5.SiFiveがRISC-V搭載のArduinoボードを発売

  2016年11月29日のEE Timesが,SiFive社がRISC-VベースのSoCを搭載したArduinoボードを$59で発売したと報じています。

  このチップはTSMCの180nmプロセスで作られ,FE310チップは320MHzクロックで動作するとのことです。これはIntelのCurieと比べると10倍速く,9倍電力効率が高いとのことです。また,このSiFiveのプロセサは,1.61DMIPs/MHzと2.73 Coremark/MHzの性能を持ち,これはARM M0と比べておおよそ2倍の電力効率だそうです。

  また,Arduino Zeroに使われたAtmelのMCUと比べると11倍のDMIPSだそうです。

  そして,SiFiveはTSMCの28nmプロセスを使い,キャッシュコヒーレンシをサポートする64bitコアを開発中とのことです。

6.AWSが100PBのデータを運ぶSnowmobleサービスを開始

  2016年12月1日のHPC Wireが,Amazonが100PBのデータをトレーラトラックで運んでAWSに入れるSnowmobileと呼ぶサービスを開始すると報じています。Snowmobileは専用の45フィートのトレーラで,100PBのストレージとネットワークスイッチなどを積んでいます。

  Exa Byteのデータを10Gbpsのリンク経由で送ると26年かかってしまいますが,10台のSnowmobileを使えば,6か月で送れると書かれています。また,別の個所では,Snowmobileは複数の40Gbpsのリンクを持ち1Tbit/sでデータをやり取りでき,約10日でデータをいっぱいにできると書かれています。

  Snowmobileの使用料金は,$0.005/GB/月となっていますが,これは100PBでは毎月50万ドル,年間,600万ドルです。しかし,これでもネットワークで送るより安上がりということです。

  Snowmobileは350kWの電力が必要で,要求があれば,現地に発電機を貸し出すそうです。また,データを守るため,専任のガードマンやガードする車を随行させるなどのサービスも提供できるとのことです。

  なお,AWSは50TBをスーツケースに入れて運ぶSnowballというサービスを提供しているのですが,これでは間に合わないビッグデータを送りたいというユーザが増えているそうです。


inserted by FC2 system