最近の話題 2010年7月17日

1.NVIDIAのメインストリームGPU GF104

  2010年7月16日のPC Watchに後藤さんのGF104についての詳細な分析が載っています。

  トップエンドのGF100(Fermi)は16SM ×32=512CUDAコア搭載で,各CUDAコアが2サイクルに1回の倍精度浮動小数点積和演算ができるという構成になっており,また,メモリからレジスタファイルまでECCが付いているというようにHPCに配慮した構成になっていました。しかし,グラフィックス用のGTX 280などでは,倍精度演算もECCもディスエーブルされており,無駄なチップスペースになっていました。

  これに対して,GF104では8個のSMに48CUDAコアを搭載して,32CUDAコアは単精度の積和演算だけ,16CUDAコアは,Radeonと同じ4個のコアで1つの積和演算を行うという構成になっているとのことです。SMあたりのCUDAコア数は1.5倍になったのですが,レジスタ数やL1$の容量は同じなので,SMの面積としてはGF100と同程度ではないかと思われます。どうせグラフィックスでは倍精度は使わないし,ビットエラーも気にしないので,同じ面積で使う機能の性能が1.5倍になれば効果的です。

  グラフィックスだけなら倍精度はとってしまっても良いのですが,安いグラフィックスボードをFermi用のCUDAコードの開発システムとして使うという用途があるので,倍精度演算も実行できるというプログラム互換性を持たせるために,このような構成になっているとのことです。論理でバグレベルはともかく,性能チューニングとなったら本物を使わざるを得ないので,多少,疑問です。しかし,ユーザから言えば,倍精度演算は,無いよりもあった方が良いです。

  値段的にも$200台でAMDと対抗する価格で,勝負がヒートアップすると予想されます。

2.PSP2はTegraを使用か

  2010年7月14日のSemiAccurateが,PSP2はNVIDIAのTegraを使用と書いています。TegraはMicrosoftのZuneやKinに採用されたのですが,原因がMicrosoftなのかNVIDIAなのかはともかく,Kinは悲劇的な結果で,Semiaccurateの記事では,消費電力が目標を20%以上オーバーしたのが致命傷という論調です。確かに,携帯では待機電力が設計目標をオーバーすると電池寿命に直結するので致命傷ですが,PSP2の場合は待機電力に対する許容度は大きいので,これは大きな問題ではないと思います。しかし,SemiAccurateのDemerjian氏の記事では,バグでリスピンを繰り返しているとのことで,この辺は懸念材料です。

  技術や仕様を見ると,Tegraは意欲的で素晴らしいチップですが,往々にしてあまりに意欲的なチップは目標を達成できないでポシャることが多いので心配です。

3.AmazonがHPC向けクラウドを発表

  2010年7月13日のThe RegisterがAmazonのEC2のHPC向けのサービス拡張の発表を報じています。

  EC2は,Amazonのデータセンターの仮想化されたCPUの時間を買って使用できるというサービスです。仮想CPUは,1〜1.2GHzクロックの2007年のOpteron,あるいはXeonの1コアの処理能力相当で,これをEC2 Compute Unit(略してECU)と呼びます。サービスとしては1 ECUを使うSmall,4ECUのLarge,8ECUのExtra Largeがあり,サイズに応じて時間単価が決まっています。また,メモリを多く必要とする場合は割増など,使用量の応じた値段付けとなっています。しかし,1ECUの仮想コアと言っても,実CPUは色々なものが使われており,仮想化によりスループットとしては大体一定というものですし,それらのCPUは場合によってはGbit Ethernetで接続されて離れた場所にあることもあるという環境です。

  HPCで並列計算を行う場合はCPU間のデータ転送が重要で,また,並列化した処理全部が終わるのを待ち合わせるというケースも多く,CPU間の通信時間が短く,仮想CPUの処理能力が揃っていることが重要です。このような用途に応えるためCluster Compute Instanceというサービスを開始したというのが今回の発表です。

  Cluster Compute Instanceでは,2ソケットのXeon X5570サーバを10GbEで接続したという環境で,使用CPUが揃っており,また,通信も10GbEと高速化されています。この2ソケットサーバ1台で,33.5EC2 Compute UnitのCPUと23GBの仮想メモリとなるのだそうです。ということで,従来のExtra Largeの4倍程度の規模となります。また,このCluster Compute Instanceを最大8個まで使うことができるので,要するにXeon 5570の2ソケットサーバを8台という環境を時間借りできるということになります。

  それでも16CPUチップのサーバですから,それほど大きな計算クラスタではないのですが,設置しておくほどの必要性はなく,時々必要というユーザには便利です。お値段は,通常のQuad Extra Largeが$0.84/時間に対して,Cluster Compute InstanceのQuad Extra Largeは$0.56/時間とお安くなっています。

  現状,このサービスが提供できるのはNorth Virginiaのセンターだけで,その地域だけの利用に限定されています。

4.ASMLがEUV露光機の製造状況を発表

  2010年7月16日のTehc On!が,NGLワークショップ2010でのASML社の発表を報じています。通常,プレ量産機と呼ばれるNXE:3100ですが,今年中の出荷を目指していて,現在,6台の製造を進めているとのことです。このマシンは,NA=0.25で光源100W,レジスト感度10mJ/cm2の場合,60ウエファ/時の処理能力となっています。1台目は,光源や光学系の据え付けが終わり,7月からスキャンしない状態で露光ができるようになったそうです。

  そして,2012年にはNA=0.32,125枚/時(15mJ/cm2,250W)のNXE:3300B,2013年にはNA=0.32,150枚/時(15mJ/cm2,350W)のNXE:330Cを出す予定だそうです。NEX:3300は光学設計が完了し,ドイツのCarl Zeiss社が製造を開始しているとのことです。

  EUVに関しては,Nikonはかなり差を付けられた感じです。

  

  

 

 

inserted by FC2 system