最近の話題 2010年4月17日

1.Cool Chips 13から POWER7とSPARC64 [fx

  2010年4月14日から16日に掛けて横浜でCool Chips 13が開催されました。その中で,IBMのPOWER7と富士通のSPARC64 [fxに関する基調講演がありました。どちらのプロセッサも昨年のHot Chipsなどで発表されているのですが,多少は新しい情報がありました。

  POWER7は故障が検出された場合,命令を再実行してソフトエラーを訂正し,固定故障で直らない場合はプロセサの状態を別のプロセサに移して実行を再開するCP Sparingという機能を持っているのですが,POWER6のコアの状態をPOWER7に移して実行を継続できるそうです。逆の方向ではPOWER7で新設されたSIMDなどはPOWER6側に相当する機能が無いので,完全には移せませんが,POWER6の機能範囲しか使っていなければ,これも可能とのことです。

  もうひとつは,eDRAMのDeep Trenchキャパシタの容量ですが,18fFと発表されました。そして,このキャパシタを電源のデカップリング用にも使っていることはHot Chipsの時にRon Kalla氏から聞いていたのですが,今回Jim Kahle氏に聞くと,これを12本か24本纏めたクラスタをロジック部のホワイトスペースに配置しているとのことでした。また,Deep Trenchの工程は1週間くらい掛かるとのことで設計変更の際,この位置を動かさなくて済むよう工夫したと言っていました。それから,Trenchキャパシタは直列抵抗も大きいようで,高速バイパス用に通常のゲート絶縁膜を使うキャパシタも配置しているとのことでした。全体の容量値についても質問したのですが,覚えてないとのことで不明です。

  富士通のSPARC64 [fxに関しては,富士通の山崎氏からHPC向けの命令拡張であるHPC ACEと低電力化を中心とした講演が行われました。HPC ACEの機能に関してはHot Chipsの発表と変わらず目新しい情報はありませんでしたが,チップレベルでSPARC64 Zとの性能比較結果が発表されました。それによると分子動力学のプログラムでは2.4倍,流体力学のプログラムでは2.6倍となっています。コア数が4コアから8コアで2倍ですが,クロックは2.5GHzから2GHzと下がっているので,単純計算では1.6倍ですから,それに対しては1.5倍以上の性能が出ていることになります。

  実行状況の内訳の棒グラフでは演算結果待ちになっている時間が大幅に減少しており,浮動小数点レジスタを256個に拡張したため,ソフトウェアパイプライニングが理想的に動くようになったのではないかと思われます。

  また,低電力化ではクロックゲートを徹底し,SRAMも使用しない時にはクロックなどを止めて無駄な電力を抑える設計を徹底しています。そしてリーク電流の削減に関しては,3種のトランジスタを用意し,リークの大きい高速トランジスタは0.1%しか使用しておらず,リークを抑えたノーマルトランジスタが大部分で,速度が遅くて良い部分(8.4%)には,より低リークのトランジスタを使っています。パワーゲートは行っていないのですが,チップを水冷で30℃に冷却してリーク電力を小さく抑えているのでクロックを止めた場合の消費電力は5Wまで下がるとのことです。

2.北京IDFでのSandy Bridgeの発表

  2010年4月15日のPCWatchに後藤さんがSandy-Bridgeの発表の記事が掲載されています。そこでのウエファ上のチップ個数から,チップサイズは約220mm2とのことです。売りはSSEの128ビットから256ビット幅に拡張したAVXですが,後藤さんの分析ではコアサイズは10%程度の増加に留まっているようです。また,各コアあたりのL3$の容量は1.5MBなのですが,サイズ的にはWestmereの2MBと同じ面積を占めており,何故1.5MBしかないかは謎だそうです。

 Sanday-Bridgeは4個のコアと第6世代のIntel GPUを同一チップに集積しているのですが,今回の発表でGPUとCPUは3次キャッシュを共有することが明らかになりました。これでディスプレイリストなどをCPUからGPUに渡す場合のオーバヘッドがかなり削減できると思われます。また,このGPUがどの程度汎用の計算に使えるのか分かりませんが,GPGPU的に使うとするとこのキャッシュ共有の接続は威力を発揮しそうです。しかし,画面への描画がこのキャッシュを通るとは思えないので,当然,フレームバッファへのアクセスはバイパスするパスがあるのでしょうね。

  それから,Sandy Bridgeの出荷は今年4Qと発表されました。

  実はCool Chipsの会場で後藤さんにお会いして少し立ち話をしたのですが,多少の新しい情報はあったものの,今回の北京IDFは目新しい発表は殆どなく,期待外れだったそうです。

3.北京IDFでのTunnel Creekの発表

  2010年4月15日のPCWatchが北京IDFでのTunnel Creekと呼ぶAtomコアのSoCの発表を詳しく報じています。Tunnel Creekは600MHz,1.1GHz,1.3GHzのAtomコアにメモリコントローラ,そしてHD対応のビデオエンコーダ,デコーダを内蔵するグラフィック機能,オーディオ機能,そしてPCIexpressインタフェースを組み込んだSoCとなっていて,これだけでも携帯機器の殆どの機能を持ち,更にPCIexpressが出ているので,ここに各種のI/Oを付けることができるというのが売りになっています。

 しかし,世の中のSoCはもっと色々な機能を詰め込んで最適化しているので,x86が必要という以外の人にどの位アピールするんでしょうかね。

4.NVIDIAのTegraはあまり売れて無い?

  2010年4月14日のSemiaccurateにCharlie Demerjian氏がSamsungがTegraを使うスマートフォンの契約をキャンセルしたと書いています。また,先日のAnalyst Dayでの発表でもTegra系列の製品の売り上げ予測を大幅に下方修正したと書いています。

  PC用のハイエンドのグラフィックス製品では,多少,性能が下がったり,消費電力が多めに出ても受け入れて貰えるが,携帯機器の場合は提案仕様に対してmWオーダで消費電力が問題にされ,性能の低下も許されない。しかし,NVIDIAはPC感覚でやっているので,仕様を満足する製品を納期に間に合わせられないので,試作段階では候補の一つとして採用されても,最終製品化の段階で落とされてしまうのが原因と書かれています。

  いつも辛口でNVIDIAを攻撃しているCharlieの記事なので,額面通りに受け取って良いかどうかという面はありますが,いかにもありそうな話です。

  2010年4月12日にMicrosoftはスマートフォンのKin1とKin2を発表しました。ZuneHDと同様,KinもTegraを使うことになっていますが,大丈夫でしょうかね。

5.Memristorはシナプスのように学習できる

  2010年4月16日のThe Registerがミシガン大学のWei Lu氏のMemoristorを使った研究結果を報じています。Memristorについては2008年5月3日の話題で紹介していますが,電流の積分値で抵抗が変わるという素子で,2008年7月12日の話題で書いたように神経のシナプスのように学習する用途というのは想定されていたのですが,それを実証したものと言えます。

  Lu氏の回路ではmemristorに与えるパルスの間隔を40msから20msにすると,抵抗値がほぼ半分になりシナプスと同様な動作をさせることができたと書かれています。そして,次のステップとして数万個の素子を使ったシステムを作り,顔の認識などができるかどうかを研究したいと述べています。

  

 

 

inserted by FC2 system