最近の話題 2011年5月28日

1.D-Waveが量子コンピュータの1号機を販売

  2011年5月26日のHPCwireが,D-Waveが量子コンピュータの1号機をLockheed Martinに販売したと報じています。

  D-Wave社は2007年の2月に16Qbitの試作機をデモしており,そのデモについては2007年2月17日の話題で紹介しています。この時は2008年2Qには512Qbit,2008年末には1024Qbitという計画だったのですが,今回,販売されたD-Wave Oneは128Qbitで,この計画よりはかなり遅延しています。やはり,多数のQbitを安定して動かすのは,予想していたより難しいようです。

  Lockheed Martinが,このマシンを何に使うのかは発表されていませんが,量子コンピュータが製品として販売されたというのはコンピュータの歴史に残るイベントです。長い開発期間を経て,製品化にこぎつけたという点でD-Wave社の粘り強い開発に敬意を表します。

  D-Wave Oneの床面積は100平方ftとのことで,正方形とすれば1辺が3m程度となります。人間が前に立っている写真が載っているのですが,ほぼ立方体で,高さも3m程度はありそうです。128Qbitの量子コンピュータ本体はワンチップで,大きさは数cm角 を超えないと思いますが,超電導を実現する冷却とノイズとなる磁気を除く磁気シールドなどがこの体積の大部分であろうと想像されます。なお,温度はデモの時には4mK(絶対温度で0.004度)と発表されています。

  D-Wave Oneの消費電力は15kWとのことで,これはデモ機の20kWより若干減少しています。

  お値段は?という質問にたいしては,大型のHPCシステムとつり合いの取れた価格という回答ですが,何しろ,特性が全く違うコンピュータなので性能的には何がつり合いかは難しいところです。しかし,体積とか重量でつり合いを考えると,まあ,1億円から数億円くらいはしそうな感じです。

  今回のマシンは128Qbitで素因数分解には2N Qbitが必要ということから,32bitのカギの暗号しか解けませんが,Qbit数が増えると各国の情報 機関などが競って購入ということになるかも知れません。

2.OpenSSLの楕円暗号の解読に成功

  RSAは素因数分解に基づく暗号ですが,同様な公開鍵を使う暗号に楕円関数を使う暗号があります。カギの長さを同じとすると,楕円関数を使う方が,素因数分解を使う暗号より解読に必要な計算量が多く,高性能と言われています。

  この楕円暗号に対して,フィンランドのAalto大学の研究者が,サーバが暗号を処理する時間から秘密鍵の探索範囲を減らし,OpenSSL通信の暗号解読に成功したと2011年5月24日のThe Registerが報じています。この報道には論文へのリンクも掲載されています。

  論文では,この攻撃を避けるため,サーバは処理が終わったらすぐに応答を返すのではなく,処理時間とは無関係に一定のタイミングで応答を返すというように修正することを提案しています。

3.CrayがGPUを搭載するXK6スパコンを発表

  2011年5月24日のThe RegisterがCrayのXK6スパコンの発表を報じています。現在のXE6はAMDの12コアプロセサを8個搭載するブレードがコンポーネントですが,このXK6では,フロント側の4個のOpteronの替わりに4個のTesla 20 GPUを搭載しています。

  このGPUですが,先週の話題で紹介したように,NVIDIAは512 CUDAコアを生かすM2090を発表しましたが,これと構成は同じですがフォームファクタが違うX2090というGPUとなっています。The Registerの記事には写真が載っています。

  XE6などのCrayのブレードは風上側のOpteronの放熱フィンはフィンの枚数が少なく,風下側はフィンの枚数が少なくなっており,風上のプロセサの発熱で空気温度が上がる風下ではフィン枚数を増やして熱抵抗を減らすという細かい技を使ってチップ温度を出来るだけ一定にしているのですが,NVIDIAはそこまではやってくれなかったようで,写真を見ると,GPUの方は風上も風下もフィンの枚数は同じのように見えます。

  M2090の消費電力は225Wとなっており,Opteronチップと4枚のDIMMの消費電力より増加すると思われますが,なんとか折り合いを付けているようです。

  そして,CPUはBulldozer 12コアのInterlagosを4チップ搭載するとのことです。現在の2.1GHz 12コアIstanbulではコアのピーク性能は8.4GFlopsで,チップ全体では100.8GFlops,8チップ 搭載のブレードでは806.4GFlopsとなります。Interlagosでは,256bit幅のAVXサポートになるもののFPUは2コアで共用なので,コアあたりのFP性能は変わりません。クロックも同じとすると16コアでは134.4GFlopsです。

  XK6のブレードはInterlagos 4チップとX2090 4台ですから,CPU側は537.6GFlops,GPU側は665×4=2660GFlopsで,ブレード全体の単純合計は約3.2TFlopsとなります。これはXE6のブレードと比較すると約4倍の ピーク演算性能です。Crayの筐体にはこのブレードが24枚入るので,筐体あたりは76.8TFlopsで300筐体程度のシステムで20PFlopsを実現できる計算になります。現在,Top500 2位のJaguarシステムを持つOak Ridge国立研究所は20PFlopsのシステムのTitanシステムの導入を発表していますが,現在のJaguarをこのXK6にアップグレードし,筐体数を1.5倍くらいに増やすのではないかと思われます。

  そして,The RegisterはGPU増強なので名称はXG6が妥当だが,Gと6は形が似通っているのでやめてXK6になったと書いています。Gがダメというのは理解できますが,何故,H,I,Jが没になってKなんでしょうかね。

4.32nm Atomは大幅値下げ

  2011年5月26日のSemiAccurateが,32nmプロセスで製造されるAtomベースのCeder TrailはNetbook用のN2800が$47,Nettop用のN2600が$42と,従来に比べて30%〜50%の価格ダウンとなっていると報じています。匿名ですが,台湾のOEMの情報ということで,確度が高いと思われます。

  先週の話題で,株主向けの説明でAtomへの注力を表明したという話題を紹介しましたが,大幅価格ダウンということで,ARMへの攻撃を本格化したというところでしょうか。

  また,CederTrailは,消費電力も大幅に減っているとのことです。

@868671

inserted by FC2 system