最近の話題 2011年9月17日

最近の話題 2011年9月17日

１．やはりARMのWindows8ではレガシーアプリは動かず

　　Windows8はWindows7のアプリがそのまま動くのですが，2011年9月14日のThe Inquirerが，MicrosoftのWindows部門のSinofsky VPがARMで動作するWindows8では，レガシーのx86ベースのWindowsアプリは動作しないということを認めたと報じています。

　　ARMでx86の命令をエミュレーション実行するということは原理的には可能でも，実行速度が遅くなるし，処理に必要なエネルギーも増えてしまういます。ということは，ARMがターゲットとするマーケットには適さないので，x86バイナリはダメだろうというのが一般的な見方でしたが，Microsoftは気を持たせるような言い方をしてきましたが，それをダメとはっきりさせたということです。

　　しかし，Sinofsky氏は，バイナリの非互換ではなく，レガシーのx86アプリはパワーマネージメントステートを意識したプログラミングになっておらず，電池寿命が非常に短くなってしまうことを，ARMではレガシーのx86アプリが使えない理由としてあげています。ということは，レガシーx86アプリはARMコンパイラで再コンパイルしてもダメで，電力を食わないように書き直すしかないということのようです。とすると，Andoroidではなく，Windowsに移植するメリットは？？？

２．Intelは半導体プロセスのリードを２周に広げる

　　San Franciscoで9月13日～15日にかけて開催されたIDFで，IntelのMark Bohr氏が22nmプロセスに関する講演を行いましたが，その中で，IntelとTSMC，Global Foundries，Samsung，IBMのプロセスの導入状況を比較したスライドを示しました。

　　それによると，SiGeを使う歪技術ではIntelは2003年中の90nmから導入しており，他社を3年リード。その次のHigh-K Metal GateはIntelは2007年中の45nmから導入で，これは3.5年のリード。そしてTrigate（FinFET）はIntelは2011年中の22nmから導入で，2015年の後半になるとみられる他社を4年リードと書かれています。

　　2年で1世代程度の進み方なので，2003年ころでも他社を1周半リードしていたのですが，その差をどんどん広げて，今や２周リードで完全独走態勢というところです。

３．Ivy BridgeはTick以上のもの

　　IntelのEden VPは，基調講演の中で，Ivy BridgeはSandy Bridgeの22nmプロセス版というだけではなく，グラフィックスやメディア機能などを大きく改良しており，単なるTickでは無いと述べました。

　　Ivy Bridgeに関するテクニカルセッションでの説明では，グラフィックス，メディア関係の強化が一番に上がっており，DirectX11のサポートと3D性能の向上，そして，メディア処理系もかなり改善されていると書かれています。

　　Eden VPの講演で示されたチップ写真では，ハイレベルのレイアウトは4コアのSandy Bridgeと同じです。しかし，Sandy BridgeのGPU部はCPUコアの1.2～1.3倍の幅しかないのですが，Ivy Bridgeではこれが2.4倍程度になっています。Tri-gateになったので，フルカスタムレイアウトのCPUコア部とASIC的なレイアウトのGPU部の縮小の割合は同じではないかも知れませんが，それでもGPUの物量はSandy Bridgeに比べて倍増に近いと思われます。

　　その他に，コアにも改良が色々と入っていますが，渋いのは物理乱数発生器の搭載です。

４．IntelのHaswellは１回の充電で１０日もつ？

　　IDFのキーノートでOtellini社長はHaswellに言及し，HaswellベースのウルトラブックPCは，インタネットの繋がった状態で１０日以上の電池寿命と述べました。現在のSandy Bridgeは32nmプロセスで新アーキテクチャのTockで，その次は22nmにプロセスを変更したTickのIvy Bridgeで，その次が22nmプロセスでアーキテクチャを進めるTockのHaswellということになります。

　　IntelはCPUだけでなく，周辺やディスプレイなどの省電力化も熱心に進めており，また，Microsoftと図って，Connected Standbyという状態を作るとのことです。まあ，スリープ状態に近いけど，ある程度の間隔でインタネット接続をチェックしているという動作をするようで，現在のノートPCに比べて消費電力を1/20以下にでき，この状態では1回の充電で10日以上もつとのことです。

　また，Eden VPのキーノートでは，Haswellのチップと称するものを見せ，動作しているというPCを見せました。ということでチップがパワーオンできるところまでは来ているようです。商品化までまだ1.5年ありますから，順調な進捗です。

　　しかし，次々世代のプロセサの最大のアピールポイントが待機電力の低減というのは，1990年代のクロック向上と性能向上の時代から，まったく様変わりです。

５．IntelがIDFでKnights Cornerのスケーラビリティーを発表

　　IDFの最終日のキーノートにIntelのCTOのJustin Rattner氏が登壇しました。その中で，メニーコアMICの最初の製品となるKnights Cornerのスケーラビリティーについて発表したと2011年9月15日のThe Registerが報じています。

　　表示されたグラフでは64コアまでのデータが載っており，Nigts Cornerは64コアを集積していると見られます。そして，不良コアをディスエーブルして残るのが50コア以上というのが従来のステートメントの意味であったようです。クロック周波数については明確に述べられませんでしたが，The Registerは1.2～1.6GHzと書いています。

　　これでKnights Ferryと同様に512bitのSIMDでFMAを実行するとすると，コアあたり16Flop/cycleとなるので，1.2GHzクロックでも倍精度で1.2TFlopsとなります。

　　グラフでは20種程度のアプリについて32コアと64コアのデータが載っており，32コアでは低いものでも20倍程度，64コアでは30倍程度と言った感じで，まあ，スケールするアプリを選んでいるのでしょうが，悪くないデータです。

　　Knights Cornerの製品化は2012年の後半の予定で，CPUとはPCI－Express 3.0で接続されるとのことです。1.2～1.6TFlopsはnVIDIAのM2090の2倍の性能で，nVIDIAも性能を強化してくると思われますが，競争力はありそうな感じです。

６．筑波大が800TFlopsのスパコンを導入

　　2011年9月14日のThe Registerが，筑波大が800TFlopsのスパコンをAppro社に発注したと報じています。

　　Frontierと呼ばれるこのシステムはXeon E5 CPU 2ソケットに4台のnVIDIAのM2090GPUを接続した計算ノードにConnectX-3 InfiniBandホストアダプタを搭載し，MellanoxのQDR InfiniBandスイッチで結合するという構成で，全体ではXeonコアが4288，GPUコアが54864個で，ピークFlopsが802.07TFlopsだそうです。

　　M2090は512コアなので，M2090の台数は1072台で，４台/計算ノードですから，計算ノード数は268となります。これでXeonが4288コアですから，計算ノードあたり16コアでE5チップは8コアという計算になります。M2090は665GFlopsと言っていますから，これが1072台で712.88TFlopsで，Xeonの分は89.19TFlopsと計算されます。これはXeonのコアあたり約20.8GFlopsで，AVXを使って8Flops/Cycleとするとクロックは2.6GHzとなります。

　　今年の12月に納入され，2012年の1月末には稼働開始という予定です。筑波大はT2KスパコンでApproを選択しており，当初は苦労したという噂も聞きますが，リピートオーダーになったということは落ち着いたということでしょうね。