最近の話題 2014年8月30日

1.将来のデータセンタはASICで動作

  2014年8月28日のEE Timesが,Hot InterconnectでのPtterson教授のFireboxの発表を報じています。ムーアの法則のスローダウンでトランジスタが倍増する周期は,過去の18か月から3年に延びており,将来は5年になる。そうなると,市販プロセサではなく,ASIがより簡単でコストも安い解になるという主張です。

  巨大データセンタはソフトウェアスタックを自社で開発しており,2020年ころには,自分でサーバやスイッチのASICを開発して使う方が良いと考えるようになると見ています。示されたスライドではベクタエンジンを搭載したプロセサに広帯域のDRAMを付けたモジュールと大容量のDRAMモジュール,Flashモジュールをスイッチチップで結合するという絵で,ASICといってもカストマイズされたプロセサという感じです。

  プロセサモジュールにはシークレットソースと書かれたブロックがあり,Oracle M7のガーベッジコレクションや,ソフトのバグの扱いなど,この辺が専用機能のASICという感じです。

  そして,これらのチップやモジュール間の接続は光リンクで,UCBは既に8年間研究を行ってきたそうです。

  Fireboxクラスタは,プロセサヘビーなボックス,DRAMヘビーなボックス,Flashヘビーなボックス,ネットワークヘビーなボックス,ディスクヘビーなボックスをワークロードに従って個数を決め,光ネットワークでつなぐという絵が示されています。

2.Oracleが32コアのSPARC M7を発表

  2014年8月18日のThe RegisterがHot Chips 26でのOracleの32コアM7プロセサの発表を報じています。4コアのクラスタがチップの上と下に4個ずつ配置され,その間に64MBのL3$とオンチップネットワークOCNが配置されています。

  64MBのL3$は各4コアクラスタに8MBずつ付けられており,分離したキャッシュとしても,64MBひとまとめのキャッシュとしても使えるようになっており,分割した方がアクセスレーテンシは短くなります。L2D$は256KBで2コアで共有,L2I$も256KBですが,こちらは4コアで共有します。

  M7からは7本のコヒーレンスリンクが出ており,8チップまではグルーレスで直結できます。また,12個のスイッチチップを使うと32チップまでのSMPが作れ,1024コア8192スレッドで64TBのメモリを持つSMPが出来ます。

  また,圧縮されたデータベースのエントリを元に戻して,クエリを行うアクセラレータを8台搭載し,1台が4本のパイプラインを持っているので,32のクエリを並列に実行できます。

  クロックは発表されませんでしたが,同じパイプ段数でクロックを上げたというスライドがあり,M6の3.6GHzより高いクロックを目指しているようです。

3.エクサスパコンの開発費として,47億円を来年度の概算要求に計上

  2014年8月27日の神戸新聞が,文科省は2015年度の予算の概算要求に,京の後継のエクサ級スパコンの詳細設計費として47億円を盛り込む方針を固めたと報じています。

  開発は京を運営している理研が主体となり,京と同一建屋で進めるとのことです。14年度予算に12億円の基本設計費を計上しており,秋以降に基本設計の入札を行う予定とのことです。そして,多分,1年くらいで基本設計を終わり,概算要求の詳細設計に入ると考えられます。詳細設計は17年度まで続け,京の約100倍の性能を持つ世界最速のシステムを開発し,20年度の運用開始を目指すとのことです。

  総事業費は,約1300億円の見込みです。

4.中国のBitcoinマイニングファーム

  先週の話題で,Bitcoinのマイニング用のASICのGoldsrike 1を紹介しましたが,2014年8月12日のThe Registerが中国のBitcoinファームの記事を載せているので紹介します。中国の北東部にある,このファームは2500台のマシンを使っており,1か月の電気代がUSドルで$70,000だそうです。直径1m位はありそうな巨大なファンで冷却しており,すごい騒音です。

  また,3MのNOVECにジャブ付けする液浸冷却の香港のファームも紹介されています。NOVECは材料は高いのですが,(規模は不明ですが)1か月の電気代を$64,000節約できるとビデオでは言っています。

   3月12日のCoinDeskには1ペタHash/sという米国最大のファームが紹介されています。このファームはBitcoinが最高値の時のドル換算で,月に$8M稼げる能力があるとのことです。

  しかし,Bitcoinの採掘量は10分に1回の採掘になるように,計算量が調節されているので,ファームの能力を上げると,他のファームに勝つことは出来ますが,全体の採掘量は増えません。つまり,軍拡と同じで,相手に負けないように軍備を増強することは必須ですが,相手も増強するので,お金が掛かるばかりで,相手が降りなければ相対的な優位は改善しないチキンゲームです。

  また,急速に軍拡が進むと,すぐに設備が陳腐化してしまい,新兵器を買い入れる必要があり,難しいビジネスです。

  更に,現在は1採掘につき,報酬は25ビットコインですが,総採掘量が増えると,報酬は半減して行き,総量が21Mコインになると採掘報酬はゼロになり,採掘による収入はなくなります。採掘以外にも取引手数料があるので,収入が無くなるわけではないのですが,ビジネスとして採掘をやる場合には採掘の利益の減少と,ASICの進歩による採掘単価の低減のバランスを考えて置く必要があります。

  NOVEC浸漬はハイテクですが,他の2つのファームの写真を見ると,データセンタの冷却なんて概念は聞いたことが無いという感じの酷い設計で,冷却効率は相当悪そうです。

5.CrayのCS300スパコンにK40 GPUをつけたCS-Stormを発表

  2014年8月26日のHPCWireが,CRAYのクラスタスパコンであるCS300にNVIDIAのK40 GPUを搭載したCS-Stormについて報じています。2Uのサーバに8台のNVIDIA K40を接続し,IvyBridgeベースの2Uノードのピーク性能を11TFlopsに引き上げます。これだけGPUを搭載して空冷ですから,かなり,頑張っています。

  XeonからのPCIe×16 2本を×8 4本に分割し4台のK40を接続しています。これが2ソケット分で,全体として8GPUとなります。これが2Uで,48Uの標準ラックに22台搭載可能で,ピーク性能は役250TFlopsとなります。つまり,4ラックで1PFlopsです。



inserted by FC2 system