最近の話題 2014年12月6日

1.続Student Cluster。総合2位はUniv. of Tenessee Knoxville

  SC14でのStudent Cluster Competitionにおいて,総合2位はUniv. of Tennessee Knoxvilleが獲得しました。

  2014年12月5日のHPCwireがUT Knoxvilleの2位を報じ,その中でコーチの談話を紹介していますが,UT KnoxvilleはHPLでも9.808TFlopsで2位,アプリの走行では,優勝したUTAustinの76.49ポイントに次ぐ74.76ポイントで,HPLとアプリ走行の両方のスコアの合計なら,優勝できたかもしれないと述べています。総合優勝は,両方のスコアの合計と書かれていたと思うのですが,私の理解の間違いでしょうか。

2.NECの次世代スパコンAurora

  私の記事ですが,2014年11月25日のマイナビニュースがNECの次世代スパコンAuroraについて報じています。

  現在のSX-ACEと比較してラックあたりの性能は10倍で,設置面積は30分の1とのことです。しかし,提供時期は2017年となっており,3年後の製品について,今,発表するの?という声が聞こえてきます。

  NECはSC14のベンダーフォーラムで,Auroraについても,ある程度,説明を行いました。それによると,Auroraの売りは,従来のベクトルスパコンの強味である強力な大型プロセサコアと大きなメモリバンド幅から生まれる高い連続実行能力,値段,および,電力あたり最大のメモリバンド幅の提供と標準の環境と最適化されたソフトによる使用の容易さであるとのことです。

  また,適用範囲を広げるため,x86環境が動くようにするとのことです。Linux OSを使うのですが,ツールやIOなどはリコンパイルで動かすとのことで,自社のものやオープンソースはリコンパイルは可能ですが,3rdパーティーは大変です。また,IOのドライバの移植も大変そうです。

  日経の報道では85TFlopsという値が載っており,SX-ACEの最小構成は16.4TFlopsなので,約5倍の性能です。そして,現行機は5000万円ですが,Auroraは1/10の500万円と書かれています。つまり3年でコストパフォーマンスを50倍改善(マイナビの記事では25倍と間違っていました。ごめんなさい)するという訳です。

3.富士通のFX100スパコン

  SC14において富士通はPRIMEHPC FX100スパコンを発表しました。これまでPost FX10という仮称で呼んでいたものに正式に名前を付けただけですが,SC14のベンダーフォーラムで,より詳しい情報を発表しました。これに関して,2014年12月5日のマイナビニュースが報じています。

  FX100のエンジンであるSPARC64 XIfxプロセサは,演算コアが32コアで,それにアシスタントコアを2個集積しています。演算コアはSIMD幅を256bitに倍増し,32bit単精度演算は8演算並列に実行できるようになり,倍精度は従来の2倍の512演算/サイクル,単精度は4倍の1024演算/サイクルの演算ができるようになりました。8月のHotChipsではクロックは2.2GHzとのことであったので,倍精度は1.1246TFlopsという計算になります。

  アシスタントコアは通信などを処理し,計算コアへの割り込みなど,計算に邪魔が入らないように,雑用を引き受けるコアです。

  また,メモリにMicronのHMCを採用したのも大きな特徴で,これによりピーク480GB/sのメモリバンド幅を持ち,Stream Triadベンチマークで320GB/sを実測しているとのことです。

  チップサイズは発表されていませんが,展示されたウェファのチップ搭載個数から見ると,680mm2程度ではないかと思われます。これは482mm2であったSPARC64 IXfx(9fx)プロセサよりかなり大きく,以前,私が20nmプロセスの採用で小さくなっているのではないかと書いたのは,全く,誤りでした。

  SIMD幅倍増に伴い,一定アドレス間隔でメモリをアクセスしてSIMDレジスタに順に詰め込むストライドアクセスやレジスタに格納したアドレスに従ってメモリをアクセスする間接アクセスがサポートされ,間接アクセスを使うと,疎ベクトルのアクセスが,CRS形式では2.7倍,ELL形式では3.4倍に性能が向上するという例が示されました。

  そして,ノード間を接続するTofuはTofu2となり,バンド幅が2.5倍になりました。しかし,演算性能が4倍以上となったのには追い付いていません。また,これまでは別のICCというチップが必要だったのですが,Tofu2の機能はCPUチップに内蔵されました。

  FX100はJAERIへの,今年末の納入が間に合わないとのことで,契約がキャンセルになり,3億円の違約金を払うということになったのですが,SC14で,新庄本部長に質問したところ,来年5月1日から運用開始予定のJAXAには間に合うと言ってました。

  それにしても,FX1,FX10,FX100という命名は,次はFX1000,FX10000でしょうかねぇ〜。しかし,さすがに10万は数字が多すぎると思うのですが,どうするのでしょうか?まあ,100Kとか1Mとかという手も無くはありませんが。

4.IARPAが超電導コンピュータの開発計画を開始

  高リスクですが,成功すれば利益も大きい諜報関係の研究開発に投資する米国政府のIARPA(Intelligence Advanced Research Projects Activity)が超電導コンピュータの開発プロジェクトを開始すると2014年12月3日のHPCwireが報じています。

  このコンピュータは超電導状態で動作させますが,量子コンピュータでは なく,超電導のロジック素子やメモリ素子を使い,基本的にはCMOSのコンピュータと同じように計算を行います。一時,超電導コンピュータが注目を集めた 時期がありましたが,その時は多くの技術的困難があり,実用化には至りませんでした。しかし,現在では定常的に電力を消費しないタイプの超電導論理回路や エネルギー効率の高い超電導メモリを開発しており,以前とは状況が違うとのことです。

  開発に成功すれば,現在のCMOSコンピュータより大幅に省電力で,高性能のコンピュータが作れるとのことです。

  この開発は,IBMとRaytheon-BBNとNorthrop Grummanが担当するとのことです。

5.2014年3Qのサーバ市場は前年同期比4.8%の伸び

  2014年12月4日のHPCwireが,IDCのレポートを引いて,サーバ市場の調査結果を報じています。それによると,2014年の3Qの全世界のサーバ売上は$12.7Bで,前年同期と比較して4.8%の伸びとなっています。しかし,セグメントごとに見ると,ボリュームシステムは8.8%の増加,ミッドレンジは18.4%の増加であるのに対して,ハイエンドエンタプライズシステムは23.2%の減少です。ハイエンドシステムの減少は,製品交代の端境期であることが影響しているとのことです。

  また,IDCは中国圏,超巨大データセンタ,ODMと中国のOEMメーカーの影響が増大していると分析しています。

  メーカー別では1位はHPで,売り上げは$3,371Mで,前年同期比で-0.5%です。2位はIBMで,$2,320M,-17.8%,3位はDellで,$2,266M,+9.5%,4位はCISCOで$786M,+31.2%,5位はOracleで$520M,3.4%となっています。IBMの急減は,x86サーバ部門のLenovoへの売却の予定となっていることからの買い控えの影響です。

  そして中国などのODMの合計は$1,130で前年同期比は44.2%という大きな伸びとなっています。

  また,x86ベースのサーバは11.6%増加して$10.7Bとなったのに対して,非x86サーバは20.9%減少して$2.0Bとなっています。巨大データセンター向けの実装密度最適化サーバは,昨年3Qに大きな購入があった影響で,売り上げでは4.4%減の$836Mで,台数的には253,443と5.6%減となっています。なお,これから計算すると,平均的な単価は約$3300となります。


inserted by FC2 system