最近の話題 2010年10月23日

1.中国の天河システムがLinpack 2PFlopsを達成か

  東工大松岡先生の2010年10月18日のTweetで中国国防科技大学校(NUDT)の天河一号がエンハンスされて,Linpackで2PFlopsを達成したとの発表があったと書かれてい ます。CPU部が1PFlops,GPU部が4PFlopsで合計5PFlopsのシステムでLinpack 2PFlopsはちょっと低めですが,従来もピークの50%弱だったので,まあ,妥当な範囲の数字です。

  中国のソースでは,2010年10月17日付の新華社の記事からリンクされている9月8日の記事で,今年のTop500で首位の獲得は有望と報じています。天河一号は2009年11の5位にランクされたのですが,今年6月のランキングでは7位となっています。この時はCPUはNehalem-EPだったのですが,その後,CPUを国産の「飛騰」プロセサに交換して性能を上げたと書かれています。

  エンハンスしてLinpack 2PFlopsの報道は見つかりませんが,10月19日に東工大で開催されたGPUシンポジウムでNVIDIAの人が「まだ話せない」と言っていたので,どうもGPUはAMDからNVIDIAに切り替わったようで す。青木先生が「星雲」を見学しようとしたら,今は,半分無くなっていると言われたそうで,星雲から天河に回したという可能性もあるかも知れません。

  ということで,来る11月のTop500では,Jaguarを抜いてこのエンハンス天河がトップになることはほぼ確実という感じです。

  この調子では「京」スパコンが出来ても,Top500の1位は愚か,2位にもなれないのではないでしょうか。GPUベースのシステムが多く出現すると,下手をするとTop5にも入れないという事態も考えられないことでは ありません。

  GPUは万能ではありませんが,Kogge先生がまとめたExaFlopsスタディーをみても,消費電力の点から,演算器を増やして,制御系を簡単にしてFlops/Wを上げるしか ありません。そして,そのようなシステムで性能を出すアルゴリズムを考えるしか無いと思うので,大きな方向としては東工大や中国の行き方は正しいと思います。汎用CPUを並べた「京」スパコンやBlue Watersの方が使いやすくユーザ受けする安全パイの設計 なのですが,アルゴリズムの大変更という重要な課題を先延ばしにしてしまい,将来に向けては良くなかったのではないかという気がします。

2.AMDがHD 6800シリーズを発表

  2010年10月21日にAMDは次世代となるHD 6800シリーズのGPUを発表しました。10月22日のPCWatchに後藤さんが詳しい記事を書いています。

  これまではGPUは,TSMCのフルノードの間にハーフノードを挟むというプロセスロードマップを使って1年ごとに密度で1.4倍程度の製品を出してきたのですが,今回は,TSMCが40nmから,32nmノードを飛ばして28nmに行くということになったので,AMDとしてはHD 5800と同じ40nmプロセスを使わざるを得ないということになりました。

  そのため,HD 5870が334mm2に対して,HD 6870は255mm2と76%のチップ面積ですが,積和演算器の個数は1600から1120と70%に減少しています。面積比例より演算器が減っているのは,メモリ系は5870と同じ構造で,相対的に面積比率が上がっていることが効いていると思われます。また,今回の目玉の,DirectX11向けのテセレーション機能の強化,ビデオアクセラレーションをUVD3にアップグレードなども影響していると思われます。

  HD 5870のシェーダーのクロックは850MHzであったのに対して,HD 6870では900MHzにクロックアップしています。そのため,単精度浮動小数点演算のピーク性能は2TFlopsとなっています。

  また,960積和演算器でクロックも775MHzに落としたデグレード版のHD 6850という製品も同時に発表され,こちらは$135〜というお値段で,ゲーマー向けのお手頃値段感を前面に出した発表文となっています。

  なお,後藤さんの記事では,このシリーズはBartsというコードネームで開発されていたもので,更に上位のCayman,Antillesが11月に出てくる予定だそうです。

3.AMDがLlanoのウェファを公開

  2010年10月21日のPCWatchで後藤さんが,AMDが台北で開催した技術フォーラムでのLlanoウエファの公開について書いています。

  それによると,Llanoのチップは220mm2程度で,従来予想されていたものよりかなり大きめで,その原因は100mm2程度をGPUが占めているからであると書かれています。後藤さんの記事で同じくGPUを集積したIntelのSandy Bridgeのダイとの比較をしていますが,大ざっぱに言うと,CPUコアはSandy Bridgeの半分程度で,GPUは2倍ということで,AMDとIntelでCPUとGPUのバランスが大きく違います。

  IntelのGPUは従来の組み込みGPUよりは改善されたものの,ディスクリートGPUと比べるとローエンド程度の性能ですが,Llanoは32nmプロセスで100mm2ということは40nmプロセスでは150mm2に相当し,前掲のHD 6870の2/3程度の面積で,かなり強力なGPUと思われます。

  なお,LlanoはBulldozer,Bobcatという新コアではなく,従来のK10コアの改良版ですが,後藤さんの記事に見られるように,消費電力の削減の点では,かなり改良されているようです。

inserted by FC2 system