最近の話題 2011年7月2日

1.フルシステムの「京」コンピュータの規模と性能

  2011年7月2日の日経新聞のこどもニュースで「京」を解説しているのですが,その中に,フルシステムの規模は864筐体という記述があります。また,今回Top500で1位になったシステムは,672筐体であることが理研の人の発表で明らかになりました。

  864筐体のフルシステムになっても同じピーク比率を維持できると想定すると,フルシステムでのLINPACK性能は8.162×864/672 =10.494PFlopsという計算になります。

2.AMD,NVIDIA,VIAがBAPCoを脱退

  BAPCoはSysMarkというPC用のベンチマークを開発している業界団体で,HPやDELLなどのPCメーカー,Intel,AMDなどのチップメーカーなどが会員になっている。我が国でも東芝やソニーが会員になっている。その団体から,AMD,NVIDIA,VIAという有力メンバーが相次いて脱退を表明しました。

  この事情については,2011年6月24日のPCWatchの記事が分かりやすいのですが,要するにBAPCoが開発しているSysMark2012が,従来のCPUベースの性能評価に偏っており,内蔵GPUを使用するベンチマークは殆どなく,AMDなどのAPUの性能貢献を正しく評価していないという点にあるようです。

  一般的に言って,公平なベンチマークを作るのは難しく,CPU性能を重視すればAMDなどが文句を言い,GPU性能を大きく評価すれば,GPUの能力で劣るIntelが文句をいうということになります。ただし,昔はBAPCoはIntel社内の施設に同居していた経緯などから,Intelよりという見方があるのも事実です。

  汎用CPUのベンチマークであるSPECもGPUや組み込みのビデオ処理回路や暗号化などの専用回路の性能を評価するベンチマークにはなっていません。プロセサの有用性は色々な要素に影響され,その重みづけは個人の使用パターンに依存します。従って,万人 に共通の評価基準というものが,そもそも存在しないのではないかと思います。

  しかし,チップメーカーにとっては自社のアプローチが不利に評価され,ライバル(Intelを指す)のプロセサが有利になるベンチマークは認める訳にいかないというのも理解できます。

  プロセサチップが汎用的な命令処理機能だけではない機能を集積し始めたとき,その性能をどう評価すべきかは難しく,興味深い問題です。

3.AMDがデスクトップ向けAシリーズAPUを発表

  2011年6月30日のマイコミなどがAMDのデスクトップ向けのAPUの発表を報じています。6月14日に発表(6月18日の話題で紹介)したAシリーズ製品は消費電力が45W以下のものですが,今回の発表は65Wから100Wという消費電力レンジになっています。

  最高性能の製品はA8-3850で,CPUは4コア,L2$ 4MBで,クロックは2.9GHz。GPUは400SPで600MHzクロックという仕様で,消費電力は100Wとなっています。また,A6-3650はクロックが2.6GHzで4コア,4MB L2$,GPUは320SPでクロックも443MHzですが,電力は同じ100Wとなっています。この2品種は冷却に余裕が無いからか,クロックのターボは非対応です。

  今回の発表はA8-3850からA4-3300まで7品種ですが,国内で7月3日から販売されるのは,上記の100Wの2品種だけとなっています。残る5種は消費電力は65Wで,4コア,4MB L2$でクロックが2.4GHzで2.7GHzまでブーストできるA8-3800から2コアでターボ無のA4-3300までバリエーションがあります。

  A8-3850でも予想される店頭価格は13,980円とのことでIntelのハイエンドCPUに比べるとお買い得です。

  しかし,発表されたダイ写真を見ると,GPUが4コア+L2$と同じくらいの面積を占めており,SysMark2012がこの部分の貢献を評価していないとむくれるのは理解できます。

4.SeaMicroがAtomサーバでHadoop実行に好成績と発表

  2011年6月30日のThe RegisterがSeaMicro社が,匿名のカストマの実ジョブのベンチマークで,同社のAtomサーバと4コアXeon×2ソケットのサーバの性能比較を発表したと報じています。

  ジョブの詳細は分かりませんが,大量の比較的小さい塊の仕事をHadoopで多数のサーバに投げて並列処理せさるというアプリケーションで,規定された量の仕事を10分50秒以内に終了させるというもので,SeaMicroは,1.66GHzクロックのデュアルコアAtom N570を256個搭載する 同社のSM10000-64サーバ2台のシステムで10分40秒と規定の時間内に収まったとのことです。

  これとの比較に,2.13GHzクロックのXeon L5630のデュアルソケットの1Uサーバを使うクラスタで,時間が規定内に収まるまで台数を増やしていったところ76台の構成で10分50秒になったとのことです。

  この両者のシステムを比較すると,SM10000-64は10Uなので合計20Uに対して,1Uサーバ76台は76Uと3.8倍のスペースを必要とし,処理を終了するまでの消費電力もSM10000-64が0.88kWhであったのに対してXeonシステムは3.387kWhと電力も約3.8倍となったと述べられています。

  この2つのシステムを比較すると,SeaMicroのシステムは合計1024コア,Xeonのシステムは608コアで,クロック比やCPUのマイクロアーキなどを考えると若干,Xeonの方が性能が上という感じもしますが,それほど大差はないと思います。従って,この程度の物量で同じ程度の性能になったというのは理解できます。

  しかし,ユーザ側からいえば,おなじ仕事をするサーバの設置スペースと電力が1/3.8というのは大きな魅力です。このやり方が全ての用途でうまく行くというわけではなく,Xeonが必要というケースもあると思いますが,これで十分という用途も少なくないと思われるので,この手の低電力マイクロサーバをクラスタにしたサーバは増えていく のでしょうね。

inserted by FC2 system