最近の話題 2013年6月1日

1.次回のTop500では中国のTianhe-2が1位に

   松岡先生のTweetで,中国出張中の筑波大の朴先生からの情報で,中国の広州スパコンセンターに設置のTianhe-2がLinpackで25.8PFlopsを達成し,6月に発表されるTop500では,1位を中国に奪還するのは確実とのことです。 この中国のTianhe-2については2013年5月29日のHPCWireも報じています。

  このシステムは,Xeon 2ソケットにXeon Phiを3個接続したノードをシステム全体では16000ノード持ち,ピーク性能は54.9PFlopsと京スパコンの約5倍で,13056ノードを使ったLinpack計算で28.5PFlopsを達成しているとのことです。

  メモリは1PBと京スパコンより小さく,ストレージも12.4PBと小さいのですが,筐体は162本と京スパコンの1/5です。消費電力は17.8MWとのことです。ネットワークはTianhe-1Aの発展形で,QDR IBで高Radixの光Fat Treeでコアスイッチ群は576×13とのことで,Bi-Sectionバンド幅はあまり大きくないとのことです。

  単純計算すると,筐体あたり100kW強。松岡先生の情報では80kVAだそうで,冷却は相当大変そうです。

  部品を定価で買えば300〜400億円に付くが,IntelがXeon Phiをただ同然で売ったので,中国のコストは100億円くらいと松岡先生は書いています。

  しかし,COCOMとかCTP値とか,様変わりですね。

  今回は50PFlops強ですが,Tianhe-2は100PFlopsが目標で,近くアップグレードされると見られています。米国の100PFlops計画は2015〜2016年で,欧州,日本にも100PFlops計画はないので,Tianhe-2の世界一は相当長く続きそうです。

  しかし,このマシンのMTBFはどの程度でしょうかね。ノードあたりCPU 2個,MIC 3個の5チップで,それが16000ノードですから,8万チップとなり,京スパコンと同程度の物量です。しかし,チップ温度が京スパコンより高いとすれば,信頼度は下がります。また,Xeonには命令リトライによるエラー回復の機能は無いので,宇宙線中性子によるエラーの頻度も京スパコンよりも高いと思われます。

  TitanもLinpackはGPUメモリだけで実行できる規模で,1時間くらいで終わっていました。この理由の一つが,故障発生頻度が高く,マシンが長時間,連続して動かないことであったといわれています。Tianhe-1AもMTBFが数時間とか言われていました。ハード規模に逆比例して,Tianhe-2でMTBFが更に短くなると,なかなかフルシステムでは長時間の計算はできなくなってしまいますし,チェックポイント,リスタートをするとしてもオーバヘッドが大きくなってしまいます。

2.AMDが低電力サーバ用のKyotoプロセサを発表

  2013年5月29日のThe Registerが,AMDのKyotoプロセサの発表を報じています。発表された製品はX2150とX1150の2品種です。

  X2150は1.1-1.9GHzクロックのJaguarコアを4コアと2MBのL2$を搭載し,更にRadeon 8000 128コアのGPUを集積したAPUとなっています。GPUのクロックは266MHz−600MHzで,X2150の消費電力は11W-22Wとなっています。GPUは600MHzクロックの場合,単精度では153.6GFlopsの性能を持っています 。倍精度では9.3GFlopsと書かれていますが,単精度の1/16の9.6GFlopsではないかと思われます。いずれにしても倍精度はCPUで演算した方が速く,GPUの倍精度は,OpenCL互換のために一応付いているという感じです。

  X1150はGPUを搭載しないモデルで,4コア+2MBでクロックは1.0-2.0GHzと範囲が若干広がり,消費電力は9.0W-17Wとなっています。

  メモリはECC付きのDDR3 1600MHzをサポートし,I/Oは,PCIe2.0,SATA,USBコントローラを内蔵しています。S1260はUSBやSATAは内蔵していないので,この点はAMDが有利です。

  2GHzクロックのX1150の性能はSPECint_rate_base2006での測定で28.9で,対抗製品であるIntelのAtom S1260が2GHzクロックで13.0であるのと比べて2倍以上の性能となっています。また,シングルスレッド性能の推定値でも10.0対5.2で1.9倍となっています。IntelのSilvermontが出てくると話は変わってきますが,現状では,Atomより2倍以上高性能で,電力効率も高いという謳い文句は,正しいと思います。

  しかし,シングルスレッド性能が1.9倍で,コア数2倍のKyotoと2スレッドのマルチスレッドのS1260との比較ならSPECint_rateなら3倍くらいにはなっても良い感じがしますが,2.2倍くらいにしかなっていないのはどこかにボトルネックがあるような気がします。

  お値段は,1000個以上のロットでの単価はX2150が$99,X1150が$64となっています。

3.国立天文台が500TFlopsのXC30の稼動を開始

  2013年5月29日に国立天文台は,岩手県奥州市の水沢VLBI観測所に設置した,ピーク性能502TFlopsのCRAY XC30システムが稼動を開始したと発表しました。愛称は,蝦夷の英雄で,坂上田村麻呂に敗れたアテルイだそうです。このアテルイは,天文学専用のスパコンとしては世界最高性能とのことです。

  また,このシステムは2014年9月までにアップグレードし,1PFlopsを超える予定とのことです。

  このシステムはCRAY XC30 8筐体のシステムで,発表につけられた写真では,ラーメン丼のふちについているような模様が筐体に書かれていますが,これがアテルイという字でしょうかね。

4.SC13でのStudent Cluster Competitionに出場する8チームが決定

  2013年5月30日のHPCWireが,11月にデンバーで開催されるSC13でのStudent Cluster CompetitionのStandard Trackに出場する8チームが決定したと報じています。それによると,出場は以下の8チームです。

 昨年優勝のTexas大は入っていますが,一昨年その前と2年連続で優勝した台湾の国立清華大は入っていません。一方,オーストラリアやドイツからの出場は初めてです。

  13校からの応募があり,内容を審査した結果,この8チームが選ばれたとのことです。相変わらず,日本からの参加はありません。

 

 

inserted by FC2 system