最近の話題 2010年9月11日

1.ARMが新プロセサコアCortex-A15(Eagle)を発表

  2010年9月8日にARMは,現在の携帯用CPUの性能5倍という新コアのA15(開発コード名 Eagle)を発表したと9月9日のEETimesなど各種メディアが報じています。また,マイコミジャーナルの大原氏の記事には日本での発表スライドが掲載されています。 この性能ですが,大原氏の記事のスライドでは,現在のCortex-A8シングルコアと比較して,デュアルコアのCortex-A15が5倍と読むことができ,2010年後半のデュアルCortex-A9と比較すると3倍程度の性能になっています。

  Cortex-A15は,先のHot Chips 22で発表された仮想化サポートと40ビットアドレス空間をサポートするARMv7−A命令アーキテクチャをサポートする初めての製品です。ARMv7−Aこのアドレス拡張はOS自体と各OSの提供する仮想空間は32ビットですが,VMMの空間と物理メモリ空間が40ビットに拡張されています。Hot Chipsでの発表は命令アーキに関してだけだったのですが,今回の発表で物理的な実装であるCortex-A15が明らかになりました。

  半導体プロセスとしては32nmと28nmをターゲットにして,2.5GHzまでの動作を予定しているとのことです。また,マイクロアーキも,これまでの2命令から3命令発行のスーパスカラと強化されています。現在のCortex-A9ベースの製品のクロックは半分程度ですから,性能3倍とすると,IPCが1.5倍という計算になります。

  そして,ARMが見せたスライドでは,4コアが4MBのL2$をシェアするマルチコアになっており,それを更にAMB4バスでキャッシュコヒーレントに接続することができ,最大16コアまでのSMPが構成できるという報道もあります。

  また,ソフトフォールトを検出,修正と書かれています。ARMは永らく,ミシガン大と一緒にRazor,RazorUを開発してきており,これが組み込まれているのではないかと思われます。

  仮想化はマルチOSなど携帯でも使い道はあると思いますが,アドレス拡張や16コアSMPサポートとなると,やはりサーバを視野に入れていることは間違いないと思われます。

  と,素晴らしい仕様ですが,製品に搭載されて市場に出回るのは2012年の終わりから2013年とのことで,当面はCortex-A9ベースの製品を使わざるを得ません。

  興味深いのは,半導体パートナとして発表されたのは,IBM,GF,Samsungの3社で,これまでの多くのARMプロセサを作ってきたTSMCが入ってない点です。IBM Fabクラブのプロセスにしか対応しないということでしょうか。

  小型,省電力という点でARMベースのサーバという動きはあるのですが,年間40億コアというARMの総量から比べると,サーバは微々たるものではないでしょうか? ボリュームチップと共用できないと,サーバ専用のARMチップを作るのでは儲からない気がします。そして,2010年の第2四半期のARMの売り上げは$150Mで,研究開発費は公表されていませんが,売上の15%としても年間$100M弱です。これで,グラフィックスのMaliなども含めてCortex-A15のような複雑なサーバプロセサを開発していくのはかなり大変だと思います。また,サーバへの営業と携帯への営業は全然違うので,EETimesが言うように,野心的でリスキーという表現は正しいと思います。

2.SamsungがARMデュアルコアのOrionを発表

  2010年9月7日のEETimesが,SamsungがCortex A9デュアルコアのASICであるOrionを発表したと報じています。半導体プロセスはSamsungの45nmローパワーで,クロック周波数は1.0GHzです。各コアは32KBの命令キャッシュとデータキャッシュを持ち,それに1MBの2次キャッシュがついています。

  そして,ストレージはNAND Flash,moviNAND,SATA,eMMCを サポートし,メモリはLPDDR2とDDR3をサポートしています。また,GPSレシーバのベースバンド処理部も集積されているとのことです。

  また,EETimesの9月9日の続報によると,Orionに集積されているGPUはPowerVRではなく,ARMのMaliだそうです。そしてディスプレイ出力はHDMI 1.3をサポートしています。

3.新Xbox 360は台湾のSpringSoft社のEDAを使用

  2010年9月7日のTech On!が,新Xbox 360プロセサは台湾のSpringSoft社のVerdiという検証ツールを使ったと報じています。このツールはバージョンの異なる設計間の比較や誤りの検出ができるツールで,マイクロソフトの検証エンジニアは「デバグ時間をほぼ半減」と述べています。

  8月28日の話題で紹介しているように,AMD(のATI部門)の設計のグラフィックスコアをブラックボックス状態でIBMプロセスに移植しており,「別の設計者が開発した馴染みのない設計の場合でも,検証エンジニアは,設計コードから短時間に複雑な相関関係や相互動作を見出して,誤りの原因を特定することができた」というコメントは,よく理解できます。

4.Hot Chipsで中国科学技術院がGS464VコアとGodson-3Bプロセサを発表

  2010年8月24日にHot Chipsで中国科学技術院のWeiwu Hu教授がGS464VコアとGodson-3Bプロセサを発表しました。このところ天河一号,星雲とTo10に入るスパコンを開発している中国ですが,頭脳となるCPUやGPUは米国製です。頭脳も中国製の純国産スパコンを目指すのが,このGS464Vの開発です。

  ということで,開発を主導するHu教授もアメリカ帰りではない,純国産の頭脳のようです。

  既に商品化されているGodson-2FはMIPSの64ビットアーキで4命令並列実行のO-o-Oプロセサで,このプロセサコアを4コアのマルチコア接続ができるように改良したのがGS464というコアです。そしてこのコアを4個と4MBのL2$を搭載するGodson-3Aプロセサは,今年商品化となっています。

  このGS464コアの2つのFP演算器を,それぞれ256ビット幅のSIMD演算ユニットに置き換えたのがGS464Vというコアです。また,メモリ上のデータの並びがSIMDに一致していない場合,並べ替えを行いながら転送するGodson Super Link,あるいはVECDMAというユニットを持っています。コアのGDSUを見ると,2/3くらいの面積が2個のSIMD演算ユニットとVECDMAで占められています。

  このGS464Vコアを8個と4MBのL2$を搭載するのがGodson-3BというプロセサでSTMicroの65nmプロセスで製造され,チップ面積は300o2で,1GHzクロックで動作する予定です。これでピーク演算性能は128GFlopsとなっています。

  「京」スパコンに使われる富士通のSAPRC64 [fxは同じ8コアで,クロックは2GHzでピーク演算性能は同じ128GFlopsですが,1世代進んだ45nmプロセスで22.7×22.6oで513mm2と1.7倍の面積です。L2$も5MBで大差ありません。何故,こんなに面積が違うのでしょうかね。また,消費電力はGodson-3Bが約40Wに対して,SPARC64 [fxは53Wでプロセス世代が新しいにも関わらず,Flops/Wでも劣っています。

  Godson-3Bは,メモリコントローラを内蔵しているのですが,400MHzのDDR2/3を2チャネルで,これでは128GFlopsに対して12.8GB/sのバンド幅しかなく,かなりアンバランスです。また,プロセサ間接続用に16ビットのHyperTransportを2チャネル持っているのですが,これも両方向の合計でも12.8GB/sしかないので, どちらも0.1B/Flopしかありません。中国の設計者はこれらのバンド幅のByte/Flopという概念が無いのでしょうか,それともバンド幅が無くても計算性能の出るアプリだけを想定しているのでしょうかね。

  また,HTだけでは8チップ程度のノードしか作れないと思いますので,更に大規模にするにはInfiniBandなどでノード間を接続する必要があると思いますが,Godson-3Bは32bitのPCI/PCIXが2チャネルということでここも非常に弱体です。中国は,プロセサコアに関しては,かなり実力を付けてきているけれど,高速I/Oは弱いようです。

  因みに富士通のSPARC64 [fxのメモリバンド幅は64GB/sで5倍,プロセサ間接続は,別チップのICC経由ですが,5GB/s双方向を10リンク持っており,両方向の合計では100GB/sと8倍です。

  Godson-3Bは,5月にテープアウトを済ませており,9月にはシリコンが出来るとのことで来年末くらいまでにはシステムとして何らかの動きが出てくると思います。また,このGS464Vコアはメディア処理にも向くので,1コアで各種のメディア向きの周辺を集積したGodson-2Fというチップも開発しているとのことで,こちらはPCIe2.0を持っているので,メディアのストリーミング処理ならOKかも知れません。

inserted by FC2 system