最近の話題 2008年9月20日

1.HotChipsでのTukwilaの発表

  先のIDFで華々しくNehalemが取り上げられたのに比べると,ひっそりという感じだったItaniumの次世代のTukwilaですが,技術的には,なかなかのものです。

  Tukwilaは,今年2月のISSCCで発表されており,65nmプロセスを使用して700平方mmという巨大チップであり,このチップに4コアと,合計30MB(L3$は各コア6MBで,合計24MB)にのぼるキャッシュを集積しています。また,QPINehalemベースの2ソケットサーバ用のチップであるNehalem-EPでは2本ですが,Tukwilaではフルバンド幅のQPI4本とハーフバンド幅のQPI2本装備しており,4ソケットのシステムでは,CPUチップ間をフルQPIで完全結合で結び,更にIOHにもフルQPIで接続することが出来るという豪華な構成です。そして,ハーフQPIも動員すると,完全結合ではないのですが,8ソケットのシステムが構成できるという図が示されました。

  また,このQPIでは,ディレクトリベースのキャッシュコヒーレンシをサポートし。メモリは4chのFB-DIMMをサポートしています。

  IntelはDICEと呼ぶ記憶ノードを2重化し,ソフトエラー率を1/80〜1/100に低減したラッチを使い,中性子などによるソフトエラーを減らしています。TukuwilもNehalemと同様,QPIとメモリコントローラの内蔵が大きな変更点で,プロセサコアは前世代のものを改良して使っているので,プロセサ部ではDICEラッチの使用率は33%ですが,新設計となったコア以外の部分では99%がDICEラッチを使っています。

  DICEを適用していないラッチの数や,DICEラッチで救えない組み合わせロジック部のソフトエラーの確率,本当に壊れてしまうハードエラーをどこまで検出できるかなどが不明なので,Tukwila全体としてどの程度,高信頼であるかは,今回の発表だけでは分かりません。しかし,富士通のSPARC64やIBMのPOWER6などが採っているパリティーチェックなどでエラー検出して命令リトライでエラーを訂正する構成では,チェックされていないラッチもあり,実効的なエラー率の改善はせいぜい1/10であるのに対して,全部のラッチをDICEにすれば,命令リトライなしでもこれより高い信頼度が達成できる可能性が高いと思います。ということで,TukwilaでのDICEラッチの採用は注目すべきアプローチだと思います。但し,通常ラッチと比べるとDICEラッチは,当然,面積も大きいし,電力も大きいので,命令リトライ機構などと,どちらが得かという損得勘定となります。

  また,メモリはFB-DIMMであるのでCRCがついており,CRCエラーを検出するとリトライを行います。これでソフトエラーなどの一過性のエラーは回復できます。それでもエラーが残るとチャネルのリセットを行います。パソコンのリセットボタンと同様に,リセットは強力なエラー回復手段です。これでも回復しない場合は,ECCを使います。通常のサーバプロセサではDRAM 1チップのエラーは訂正できるECCを使うのが普通ですが,TukwilaはDRAM 2チップのエラーまで耐えられるECCコードを使っています。従って,1チップが故障しても慌てて修理する必要は無く,次の定期保守の時に交換すればよいということになります。更に,DIMMに関してはホットプラグで交換できるので,DIMMの交換に際しても,ソフト的にそのDIMMの情報を他のDIMMに移して故障DIMMを論理的に切り離す必要はありますが,サーバを止める必要はありません。

  QPIに関しても,CRCエラーの検出によるリトライ,そしてチャネルリセットというエラー回復手段を持っています。それでもエラーが残ると,エラーの発生しているレーンを切り離すという手段も持っています。そして,QPIもまた,ホットプラグになっており,交換に際して電源を切る必要はありません。

  このCPUを使って,システム的には電源や冷却ファンはN+1冗長にして,コンソール,I/O,ネットワークのパスも二重化するような構成をとれば,ハード故障では,まず,止まらないサーバを作ることが可能です。ここで「作れる」と断定せず「可能」と付けたのは,設計上,考慮したシナリオでは止まらないのですが,止まるのは考慮漏れのケースだからです。そして,この考慮漏れをどれだけ減らせるかには,やはり経験がものを言います。

2.IntelがCore 2系の6コアサーバチップのDunningtonを発表

  2008年9月15日にIntelは,Dunningtonのコードネームで開発されてきた6コアサーバチップをXeon 7400シリーズとして発表しました。Dunningtonに関しては3月22日の話題で,IntelのGelsinger副社長の発表を紹介していますが,45nmプロセスを使っていますが,コアはCore 2アーキテクチャで,2コアのペアで3MBnoL2$をシェアし,3ペアが16MBのL3$をシェアするという構造になっています。

  そして,従来の7300と比較して,約50%の性能向上が得られるケースがあると書かれていますが,共有のキャッシュやメモリバスの使用率が低い場合は,4コア→6コアで50%スループットが上がるのは不思議ではありません。

  発表された製品は4種で,トップエンドのX7460は,6コア,16MB L3$でクロックは2.66GHz,TDPは130Wで,お値段は$2729,E7450はL3$が12MBでクロックは2.4GHzに下がりますが,電力も下がって90Wで,お値段は$2301です。そして,低電圧のL7455は,L3$は12MB,クロックは2.13GHzで,TDPは65Wと性能/電力では優等生ですが,$2729と性能のトップエンドと同じお値段です。

  そして,お買い得がE7440,E7430,E7420でコア数は4コアでTDPは90Wで,上からクロックが2.4GHzでL3$が16MBで$1980,2.13GHz 12MB $1391,2.13GHz 8MB $1177となっています。

3.NVIDIAが従業員の6.5%をレイオフ

  2008年9月18日のThe Inquirerが,NVIDIAが従業員の6.5%にあたる360人を10月26日までにレイオフすると報じています。NVIDIAがレイオフをするのは13年ぶりとのことで,レイオフをしない会社だったのですが,このところ連続で紹介している問題によるロスをカバーするためには止むを得ないというところでしょう。

  開発をフォーカスして,CUDAやTegra(携帯用のグラフィックチップ)などの戦略的発展分野に開発を集中すると述べられているので,削減は,これら以外の分野がターゲットののようです。

  NVIDIAには昔の仲間が何人かいるので心配です。

4.HPは26400人をレイオフ

  各紙が報道していますが,HPは,今後3年で26400人を削減するという計画を発表しました。HPは$13.9Bという巨費を投じてEDSを買収し,17万2千人の従業員が30万人を超える規模に膨らんでおり,重複する機能の削減は必至とみられていたので,不思議ではありませんが,やはり,驚くべき規模です。これで年間$1.8Bの費用が削減できるとのことです。

  まあ,HPはPA-RISCもAlphaもやめてプロセサは作っていないので,あまり知り合いはいないし,EDSの買収に伴う削減とのことで対象はハード関係ではなさそうです。それにしても,HewlettさんとPackardさんがやっていたころのHPは,レイオフをしない会社で,従業員の忠誠度が抜群の会社だったのですが,様変わりです。

5.IntelのデュアルコアAtom N330

  N270ベースの安価な小型ノートがあちこちから発売されていますが,このN270をデュアルコアにして,2スレッドのマルチスレッドをサポートするN330のサンプルが出荷されていると,2008年9月19日のThe Inquirerが報じています。クロックは1.6GHzでFSBも533MHzとN270と変わりませんが,当然,TDPは増えて8Wとなっています。

6.LenovoがThinkServerでサーバマーケットに参入

  2008年9月16日に,Lenovo社はThinkServerというブランドで5種のサーバ製品を発売すると発表しました。日本では,IBMから買ったPCビジネスのThinkPadは有名ですが,それ以外の製品はあまり見かけないのですが,デスクトップも作っており,今回のサーバ参入でノートPCから小規模サーバまでをカバーするメーカーになります。

  タワー型のTS100とラックマウントのRS110は,小規模なメールサーバやWebサーバ用で,Core2Duo,あるいはXeon3000/3200を搭載しています。そして,タワー型のTD100,TD100xとラックマウントのRD120はXeon3000/3200/5000を搭載しており,データベース処理や仮想化して複数のサーバとして使用できるとしています。

  名称から分かるように,TS,RSは1ソケット,TD,RDはデュアルソケットです。そして,お値段ですが,$749よりとなっています。

 

inserted by FC2 system