最近の話題 2010年12月4日

0.私の本の広告

  拙著の「コンピュータ設計の基礎」ですが,11月22日ころから発売されたのですが,

  http://www.php.co.jp/fun/ranking/books.php?genre=pc

 でコンピュータ書籍のランキング(11月30日アップデート)でトップを獲得しました。神保町の書泉グランデ調べだそうです。このページの読者の方が買って下さったお蔭です。改めて,感謝申し上げます。

  また,「プロセッサを支える技術  --果てしなくスピードを追求する世界 (WEB+DB PRESS plus)」がAmazonで予約受付中です。多分,発売は来年早々です。「コンピュータ設計の基礎」はプロセサなどを設計する人や設計を学ぶ人向けですが,こちらはプログラムを書く人向けに,プロセサだけでなく,仮想化や,GPUやI/Oなどを含めてハードウェアの構造の概要と,うまく動かすようなプログラムの書き方などを解説しています。こちらもよろしくお願い申し上げます。

1.来年のISSCCでのプロセサ関係の発表

  2011年2月20日からサンフランシスコで開催されるISSCC 2011のアドバンスプログラムが発表されました。それによると,プロセサ関係の発表はセッション4とセッション15があり,セッション4ではIBMの5.2GHzのzEnterpriseのメインフレームプロセサが最初の目玉で,Intelの10コアWestmere-EX,中国のGodson-3Bプロセサ,AMDのBulldozerコア,そしてトリがIntelのPaulson Itaniumの発表です。

  Bulldozerは2整数コア+1FPUというブロックの発表で,CPUチップレベルの発表ではありませんが,パイプラインステージあたりのゲート段数を減らしてクロックが3.5GHz+というのが注目されます。面積は30.9mm2となっています。

  Itaniumは32nmプロセスに移行し,マルチスレッドの8コアでキャッシュは全体で50MB,総トランジスタ数は3.1Bでチップサイズは18.2×29.9mmとなっています。現在のTukwilaが2.05Bトランジスタで21.5×32.5mmと比べると,コアを倍増して面積は約78%です。

  また,セッション15では最大4コアとGPUをワンチップに集積したSandy Bridge,8個のCPUコアとx4 PCI Express 4本を集積した80Gbpsの通信SoCを筑波大とRenesasが発表します。そして,AMDがx86 CPUコアとRadeon GPUを集積したZacateについて発表します。

  ただし,ISSCCの発表ですから製品の性能などの発表は行われず,省電力手法やワンチップへのインテグレーションのやり方などが中心の発表になると思われます。

2.OracleがSPARC SuperClusterを発表

  2010年12月3日のThe Registerが,OracleのSPARC SuperClusterの発表を報じています。SPARC SuperClusterには,2ソケットのUltraSPARC T3プロセサを搭載するT3-2サーバを使う製品と,4ソケットのT3-4サーバを使う製品と,富士通製のM5000サーバを使う製品があります。これらのサーバは1.7TBの書き込みに最適化されたSSDと4TBの読み出しに最適化されたSSDを搭載します。

  また,富士通はクロックの若干の向上とL2$を倍増したSPARC64 Z+プロセサを発表しました。最大クロックは3GHz,キャッシュは12MBですが,ミッドレンジのM5000の場合は,Zの2.53GHz,5.5MBから,Z+では2.66GHz,11MBへの向上となっています。

  今回,OracleはT3-4サーバを27台使うSuperClusterで,30,249,688tpmCを叩き出しました。これまでのトップはIBMのPower 780サーバの10,366,254 であったので,約3倍という大幅な性能アップです。また,108チップ,1728コア,13824スレッドの並列処理でOracleのRACがスケールするというのは驚きです。ハード的にはEthernetよりレーテンシの短いInfiniBandとSSDの採用というポイントはあるとは言え,この驚異のスケーラビリティーはOracleのソフトウェア技術陣の蓄積された実力とSuperCluster向けのチューニングの賜物なんでしょうね。

  しかし,30MtpmC,$30Mなんてシステム,誰が買うんでしょうかね。VisaとかMastercardなら要るんでしょうか。Suicaもトランザクションは多いけど,プリペイドだからセンターはリアルタイム処理じゃないし。

  また,Webアプリを動かすExaLogicのSPARC版を来年1Qに出すとアナウンスしました。こちらはUltraSPARC T3ベースのブレードのT3-1Bサーバを使います。

  2010年12月2日のEE Timesによると,ハード部門の責任者のFowler氏は,シングルスレッド性能を大幅に引き上げる次世代のTシリーズチップは,すでに何回かの(テープアウトの)繰り返しを行い,非常に順調に進んでいると述べています。UltraSPARC T4となるこのチップは,9月25日の話題で紹介したロードマップの2011年後半に登場するシングルスレッド性能を3倍に引き上げるチップに相当するものと思われます。

3.Top500首位の天河一号Aは湖南省の長沙に移設か

  2010年11月28日の新華網が,中国が湖南省の省都である長沙に天河一号Aを設置するための新データセンターの建設を開始したと報じています。

  スケッチが載っていますが,円形の建物で,中央から光のタワーが立ち上るというデザインで,実用的とは思えませんが,恰好が良いのは確かです。

  しかし,センターの完成予定は2011年末とのことで,現在,天津のスパコンセンターで稼働している天河一号Aを,なぜ,移設する必要があるのか理解できません。湖南省もスパコンセンターを持ちたいという政治的な動きであれば,理解できますが。

  完成すると,天津,深センに次ぐ3番目のNational Supercomputer Centerになります。

4.T-PlatformsがLomonosovを1.3PFlopsに増強

  2010年12月1日のHPCWireが, ロシアのT-Platforms社が,モスクワ州立大学のLomonosovを1.3PFlopsの増強する契約を結んだと報じています。

  Lomosovは,ピーク414TFlopsのシステムで,今年11月のTop500では18位にランクされています。第1ステージとして,このシステムを今年の終わりまでに510TFlopsに増強し,第2ステージでは更に800TFlopsを追加するとのことです。

  この第2ステージの増強は,最新のTB2-TLというNVIDIAのM2050を使うハイブリッドブレードを使い,1筐体に100TFlopsを詰め込むので,わずか8筐体で済むと書かれています。また,この増強の予算は$25Mで,TFlops単価は$31,000となります。

  TB2-TLブレードですが,T-Platforms社の資料によると,CPUはXeon L5630が2ソケットですが,これにNVIDIAのX2070 GPUを2台接続しています。X2070はM2070と違いヒートシンクが付いていないので薄型です。T-Platformsは,Eurotechと同じようなボード全体に張り付く形のヒートシンクでGPUの放熱をおこなっています。このため,7Uのブレードシャシーに16枚のブレードが入り,筐体あたりのピークFlopsは105TFlopsとなります。これは,高密度を誇る東工大のTSUBAME2.0の約2倍の演算密度です。

inserted by FC2 system