最近の話題 2017年2月18日

1. 東工大がTSUBAME3.0を記者発表

 2017年2月17日に,東工大はTSUBAME3.0に関する記者会見を開きました。前日に競争入札の開札があり,SGI(HPEに買収されて,現在はHPEの1部門)のICE XAシステムに決まったことを受けての発表です。

  システムは,東工大が仕様を出し,共同で開発したもので,HPEのSGI部門のCTOのGoh氏は,このマシンは松岡Bladeを使っていると言ったように,東工大の仕様で作られた新マシンとなっています。

  松岡Bladeは,2個のXeon E5-2680 CPUと4個のSMX2 P100 GPUを搭載しています。このBladeを全体では540枚使用しています。従って,Xeonが1080個,P100が2160個で,倍精度のピーク演算性能は12.15PFlopsとなります。

  この性能は,Oakforest Pacsの半分程度ですが,京コンピュータの11.3PFlopsを若干上回っています。また,P100はFP16をサポートしており,マシンラーニングで使われるFP16では47.2PFlopsとなります。また,現有のTSUBAME2.5とTSUBAME KFCも運用を継続するので,これらを合わせるとFP16では68.5PFlopsということになります。

  ストレージはDDNのES14K 3台で,使用可能な容量が15.9PBのLustreファイルシステムが接続されています。バンド幅は150GB/sです。ネットワークは100Gbps×4のOmniPathで,3台のディレクタスイッチを使ってフルバイセクションのFat Treeを構成しています。

  XeonとP100はコールドヘッドを使う直接水冷で,DIMMなどのその他の部品は空気で熱を運び,2ラックの間に設けられた水冷コイルで冷やすという方式になっています。冷却水は入り口は32℃,排出は40℃程度で,これをクーリングタワーで冷やします。コンプレッサなどを使う冷却器を使っていないので冷却電力は小さく,PUEは1.033と見積もられるとのことです。特に東京にあるデータセンタとしては,これは驚異的な冷却効率です。

  また,各ノードは2TBのIntelのNVMeドライブを搭載しており,ローカルなストレージとして使ったり,BGFSでバーストバッファに使ったりするとのことです。何で,DDNのバーストバッファを使わなかったのかと質問したら,予算の関係だそうです。

  現在はコンピュータルームの工事中で,工事が3月末に終わり,そこからSGIのシステムなどの納入,設置が始まり,契約上は,7月末までに納入ということになっています。6月のTop500,Green500はどうなるかと松岡先生に質問したところ,できるだけ頑張るが,どうなるかは分からないとのことでした。

2.コンパイラを使うGamalonのマシンラーニング

   2017年2月14日のEE Timesが,Gamalon社が,マシンラーニングをBayesian Program Synthsisという複雑な数学とアルゴリズムで行い,ディープラーニングに比べて大幅に効率が良いやり方を開発したと報じています。

  創立者のBen Vigoda氏は,Lyric Semiconductorという会社を起こし,2011年にAnalog Devicesに売ったという経歴の持ち主です。

  同社のWebにデモがありますが,ディープラーニングに比べて,非常に少ない数のサンプルを学習するだけで認識ができるとのことです。ただし,4つの直線で長方形ができるという感じの構造のあるデータは上手く処理できるのですが,単なるピクセルの集まりである画像認識などでは,ディープラーニングは最適な方法であると述べています。

  デモで見せているアームチェアとフロアスタンドのランプの簡単な絵の認識は,直線を認識し,その集まりから長方形を認識し,長方形の配置や繋がりから,アームチェアやフロアスタンドを認識している感じですが,BPSで作られたプログラムは,認識に必要となる演算量が少なく,通常のCPUで実行して認識を行わせることができるというのは理解できます。

  単純に畳み込みを計算するよりは,コンパイラでより良いプログラムを生成でき,それを効率よく実行すれば効率が上がります。また,計算量の減るので,必要となるCPUの能力が小さくて済むようになります。このはWave Computingと同じような考え方です。

  Gamalonのアルゴリズムは非公開で,同社のサーバで最適化したPythhonプログラムを生成して,それを販売するというビジネスモデルです

3. OracleがSPARCとSolarisのロードマップを発表

    2017年2月14日のThe Registerが,OracleのSPARCとSolarisのロードマップを報じています。それによると,Solaris 11.nextは,2018年に登場の可能性が高く,特徴としてはCloud Deploymentと書かれています。一方,プロセサは,Solaris 11.nextとほぼ同じタイムフレームでSPARC nextが登場し,3年後の2021年にSPARC next+が登場する計画になっています。

  SPARC nextは2015年のSPARC M7の1.4倍のスループットでスレッドストレングス(シングルスレッド性能のことか)が1.5倍となっています。また,M7から導入されたデータベース機能などを強化するSoftware in SiliconがV2になりますが,具体的にどのような改善が行われるのかは不明です。そして,SPARC next+はキャッシュの増加,バンド幅の向上,Software in Silicon V3と一般的な話しか明らかになっていません。

  そして,SPARC IaaSの矢印が一番上に書かれており,クラウドベースのインフラの提供を推進する方向のようです。

4.Oracleはテープアーカイブを続けるのか

  2017年2月17日のThe Registerが,Oracleにテープアーカイブを続けるのかと問い合わせたところ,ノーコメントという回答であったと報じています。積極的にやる,あるいは現状で継続という回答で無かったことから,The RegisterはStreamLine T10000製品の将来には不安があると考えています。

  ただし,テープアーカイブを止めるとは言っておらず,独自のテープフォーマットを止めて,Linear Tape Open規格のカートリッジに変えるという可能性もあるとしています。

  もし,Oracleがテープアーカイブを止めるとすると,残るのはIBMとSpectra Logicの2社になります。

 


inserted by FC2 system