最近の話題 2010年5月8日
1.MLCでSLC並みを実現するSandforce社のSSDコントローラ
2010年5月3日のSemiaccurateがSandforce社のSSDコントローラに関する記事を掲載しています。
マルチレベルのFlashメモリは多値の識別をするので,その分,動作マージンが少なく,書き換え回数が1万回程度で動作速度も遅くなってしまう訳ですが,そのMLC Flashを使ってSLC並みの書き換え回数と速度を実現するというのがこのSandforce社のSSDコントローラです。
Flashは書き換え回数が制限されるので,全体を一様の使うために上書きではなく,次々と後の方の新しいブロック(例えば4KB)に書き込んでいきます。このため,従来のコントローラでは,実際に書き込む必要があるデータの10倍程度のデータが書き込まれます。この比率をWrite Amplificationと言います。
これに対してSandforce社のコントローラは書き込むべきデータと同じデータを持つブロックがある場合には,そのブロックへのポインタを書き込むだけで実際のデータは書き込みません。また,書き込みデータを圧縮してデータ量を減らして書き込みを行うことによって,Write Amplificationを平均的に0.5倍に減らしたとのことです。そうすると,書き込み量が1/20になるので,MLCの書き込み寿命が20倍になりSLC並みになります。
そして,Flashの内部をRAID-5のように構成してブロックのエラーから回復できるという機能も備えています。RAID-5にすると当然,容量は減るので,この機能はOn/Offできます。
また,Random Writeで10KIOPS,Random Readで30KIOPS程度を実現しており,性能的にもSLCを使う他社のSSDと比較して遜色ありません。
本当にこんなにうまくいくのかという疑問が出ますが,POWER7 2チップで1.2M TPC-Cを出し8コアシステムではトップとなったIBMのシステムには3.5TBのSSDが3台含まれていますが,このSSDはSandforceのコントローラを使っているそうです。
なお,Sandforce社のコントローラを使ったSSD製品はすでに秋葉原でも売られているようです。
2.IntelがMoorestownを発表
2010年5月4日にIntelはMoorestownのコード名で開発してきたスマートフォンやタブレットなどをターゲットとするAtomコアのSoCを中心とするプラットフォームを発表しました。
CPU SoCはZ6xxシリーズという正式名称となったLincroftで,Atomコアは,L2$は512KBでクロックは,スマートフォン用は最大1.5GHz,タブレット用は1.9GHzまでとなっています。そしてGMA600グラフィックス,LPDDR1/DDR2対応のメモリコントローラを搭載しています。そしてGMA600はMPEG4 part2,H.264のデコーダとエンコーダを備えています。チップは45nmプロセスで製造され140Mトランジスタとなっています。
これにプラットフォームコントローラハブMP20(Langwell)とMixed Signal IC(Briertown)がセットになっています。
アイドル時の電力を前世代製品の1/50に低減し,10日間のスタンバイが可能となっています。また,全体に消費電力を低減しており,連続5時間のWebブラウジングが可能と発表されています。
OSはAndoroidとMoblin,MeeGoをサポートしていますが,この市場はARMベースのチップが押さえており,大方の見方は,Intelのシェアが急激に増えることはないだろうという感じです。
3.NVIDIAのTesla 20は更に仕様ダウンで登場
2010年5月5日のSemiaccurateで,Charlie Demerjian氏が,NVIDIAのTeslaは更に仕様がダウンしたと書いています。
2009年5月の発表では1.5GHzクロックで512シェーダ,175Wであったのが,11月には1.4GHz,448シェーダ,225Wにダウンし,今回は1.15GHz,448シェーダ,247Wで,昨年の5月からFlops/Wではほぼ半分の性能になってしまったと書いています。
NVIDIAのサイトで確認すると,確かにシェーダクロックは1.15GHzになっており,倍精度浮動小数点演算のピーク性能は515GFlopsになっています。Intelの8コアのX7560は72.5GFlopsで130Wですから,まだ,ピークFlops/Wでは4倍程度のアドバンテージがあるのですが,今年末に出るとみられているSandy BridgeではサイクルあたりのFlopsを倍増すると考えられるのでかなり差が縮まり厳しいところです。
とは言え,2010年5月6日のHPCWireの記事によると,株価の推移を過去のパターンと現在のパターンで予測する時系列分析では,前世代のGTX295を使うのに比べてFermi GPUを搭載したGTX480を使うと2.3倍高速に実行できると書かれています。つまり,従来の半分弱の時間で売り買いの注文が出せる訳で,ミリ秒単位で注文を出す高速トレーディングでは決定的なアドバンテージになります。
なお,247WはファンのついたC2050/2070の仕様で,サーバに挿入するファン無のM2050/2070は225Wとなっています。しかし,4台のモジュールを入れたS2050/2070はTypicalで900Wとなっており,NVIDIAの言うTDPがどういうものか若干疑問があります。
4.Tesla 20を搭載する高密度サーバが登場
そして2010年5月4日のThe RegisterがTesla 20を搭載するAppro社とSupermicro社のサーバについて報じています。
ApproのTetra 1Uサーバは,4台のM2050とAMD,あるいはIntelのCPUを2個搭載できます。Tetra 1364G4は8コアあるいは12コアのOpteron 6100シリーズプロセサを2個,Tetra 1464G4はIntelのXeon 5600プロセッサを2個搭載しています。
そして,Appro社は5Uのブレードシャシーに挿入するGreen Bladeシリーズにも2台のM2050を搭載するブレードを発表しています。Intel,あるいはAMDのCPUブレードとのペアで5Uに5枚のGPGPUブレードを搭載することができます。
また,Supermicroの6016GT-TF-FM205は2ソケットのXeon 5600ベースのサーバで,2つのPCIインタフェースにM2050モジュールを搭載できるようになっています。
しかし,ApproのM2050 4台のサーバはGPUとCPU,メモリで1200W程度の消費電力にはなると思われます。これはヘアードライヤーと同じ程度の消費電力で,The Registerに掲載された写真では2個のファンで冷却されているように見えます。1Uに入るファン2個の開口部はドライヤーの開口部と同じ程度の面積です。とすると吸気と排気の温度上昇×風量は同じですから,風量をドライヤー 並みとするとドライヤー並みの温度上昇になります。これは高すぎるので,半分の温度上昇とすると風量は2倍で,どちらにしてもかなり凄そうです。
そして,1Uのこのサーバを40台ラックに詰め込むと,1.2KWのヘアードライヤー40個を24時間つけっぱなしで動かすというのは,1円でも安いスーパーに足を運び,無駄な照明は消すという庶民感覚からはかけ離れていますが,高速トレーダーの儲けに比べれば微々たるものなんでしょうね。