最近の話題 2010年5月8日

1.MLCでSLC並みを実現するSandforce社のSSDコントローラ

  2010年5月3日のSemiaccurateがSandforce社のSSDコントローラに関する記事を掲載しています。

  マルチレベルのFlashメモリは多値の識別をするので,その分,動作マージンが少なく,書き換え回数が1万回程度で動作速度も遅くなってしまう訳ですが,そのMLC Flashを使ってSLC並みの書き換え回数と速度を実現するというのがこのSandforce社のSSDコントローラです。

  Flashは書き換え回数が制限されるので,全体を一様の使うために上書きではなく,次々と後の方の新しいブロック(例えば4KB)に書き込んでいきます。このため,従来のコントローラでは,実際に書き込む必要があるデータの10倍程度のデータが書き込まれます。この比率をWrite Amplificationと言います。

  これに対してSandforce社のコントローラは書き込むべきデータと同じデータを持つブロックがある場合には,そのブロックへのポインタを書き込むだけで実際のデータは書き込みません。また,書き込みデータを圧縮してデータ量を減らして書き込みを行うことによって,Write Amplificationを平均的に0.5倍に減らしたとのことです。そうすると,書き込み量が1/20になるので,MLCの書き込み寿命が20倍になりSLC並みになります。

  そして,Flashの内部をRAID-5のように構成してブロックのエラーから回復できるという機能も備えています。RAID-5にすると当然,容量は減るので,この機能はOn/Offできます。

  また,Random Writeで10KIOPS,Random Readで30KIOPS程度を実現しており,性能的にもSLCを使う他社のSSDと比較して遜色ありません。

  本当にこんなにうまくいくのかという疑問が出ますが,POWER7 2チップで1.2M TPC-Cを出し8コアシステムではトップとなったIBMのシステムには3.5TBのSSDが3台含まれていますが,このSSDはSandforceのコントローラを使っているそうです。

  なお,Sandforce社のコントローラを使ったSSD製品はすでに秋葉原でも売られているようです。

2.IntelがMoorestownを発表

  2010年5月4日にIntelはMoorestownのコード名で開発してきたスマートフォンやタブレットなどをターゲットとするAtomコアのSoCを中心とするプラットフォームを発表しました。

  CPU SoCはZ6xxシリーズという正式名称となったLincroftで,Atomコアは,L2$は512KBでクロックは,スマートフォン用は最大1.5GHz,タブレット用は1.9GHzまでとなっています。そしてGMA600グラフィックス,LPDDR1/DDR2対応のメモリコントローラを搭載しています。そしてGMA600はMPEG4 part2,H.264のデコーダとエンコーダを備えています。チップは45nmプロセスで製造され140Mトランジスタとなっています。

  これにプラットフォームコントローラハブMP20(Langwell)とMixed Signal IC(Briertown)がセットになっています。

  アイドル時の電力を前世代製品の1/50に低減し,10日間のスタンバイが可能となっています。また,全体に消費電力を低減しており,連続5時間のWebブラウジングが可能と発表されています。

  OSはAndoroidとMoblin,MeeGoをサポートしていますが,この市場はARMベースのチップが押さえており,大方の見方は,Intelのシェアが急激に増えることはないだろうという感じです。

3.NVIDIAのTesla 20は更に仕様ダウンで登場

  2010年5月5日のSemiaccurateで,Charlie Demerjian氏が,NVIDIAのTeslaは更に仕様がダウンしたと書いています。

  2009年5月の発表では1.5GHzクロックで512シェーダ,175Wであったのが,11月には1.4GHz,448シェーダ,225Wにダウンし,今回は1.15GHz,448シェーダ,247Wで,昨年の5月からFlops/Wではほぼ半分の性能になってしまったと書いています。

  NVIDIAのサイトで確認すると,確かにシェーダクロックは1.15GHzになっており,倍精度浮動小数点演算のピーク性能は515GFlopsになっています。Intelの8コアのX7560は72.5GFlopsで130Wですから,まだ,ピークFlops/Wでは4倍程度のアドバンテージがあるのですが,今年末に出るとみられているSandy BridgeではサイクルあたりのFlopsを倍増すると考えられるのでかなり差が縮まり厳しいところです。

  とは言え,2010年5月6日のHPCWireの記事によると,株価の推移を過去のパターンと現在のパターンで予測する時系列分析では,前世代のGTX295を使うのに比べてFermi GPUを搭載したGTX480を使うと2.3倍高速に実行できると書かれています。つまり,従来の半分弱の時間で売り買いの注文が出せる訳で,ミリ秒単位で注文を出す高速トレーディングでは決定的なアドバンテージになります。

  なお,247WはファンのついたC2050/2070の仕様で,サーバに挿入するファン無のM2050/2070は225Wとなっています。しかし,4台のモジュールを入れたS2050/2070はTypicalで900Wとなっており,NVIDIAの言うTDPがどういうものか若干疑問があります。

4.Tesla 20を搭載する高密度サーバが登場

  そして2010年5月4日のThe RegisterがTesla 20を搭載するAppro社とSupermicro社のサーバについて報じています。

  ApproのTetra 1Uサーバは,4台のM2050とAMD,あるいはIntelのCPUを2個搭載できます。Tetra 1364G4は8コアあるいは12コアのOpteron 6100シリーズプロセサを2個,Tetra 1464G4はIntelのXeon 5600プロセッサを2個搭載しています。

  そして,Appro社は5Uのブレードシャシーに挿入するGreen Bladeシリーズにも2台のM2050を搭載するブレードを発表しています。Intel,あるいはAMDのCPUブレードとのペアで5Uに5枚のGPGPUブレードを搭載することができます。

  また,Supermicroの6016GT-TF-FM205は2ソケットのXeon 5600ベースのサーバで,2つのPCIインタフェースにM2050モジュールを搭載できるようになっています。

  しかし,ApproのM2050 4台のサーバはGPUとCPU,メモリで1200W程度の消費電力にはなると思われます。これはヘアードライヤーと同じ程度の消費電力で,The Registerに掲載された写真では2個のファンで冷却されているように見えます。1Uに入るファン2個の開口部はドライヤーの開口部と同じ程度の面積です。とすると吸気と排気の温度上昇×風量は同じですから,風量をドライヤー 並みとするとドライヤー並みの温度上昇になります。これは高すぎるので,半分の温度上昇とすると風量は2倍で,どちらにしてもかなり凄そうです。

  そして,1Uのこのサーバを40台ラックに詰め込むと,1.2KWのヘアードライヤー40個を24時間つけっぱなしで動かすというのは,1円でも安いスーパーに足を運び,無駄な照明は消すという庶民感覚からはかけ離れていますが,高速トレーダーの儲けに比べれば微々たるものなんでしょうね。

inserted by FC2 system