20180217

最近の話題 2018年2月17日

１．GoogleがCloud TPUを1時間$6.50で提供

　　2018年2月12日のThe Registerが，GoogleがCloud TPUをクラウドで提供すると報じています。Cloud TPUですが，4個のTPU2チップを搭載するボードをCloud TPUと呼んでいます。従って，Cloud TPUの混合精度の積和演算性能は，180TFlopsとなります。

　　これを1時間使用するための料金は$6.50とのことです。AWSでトップエンドのGPUを使うと$24/Houｒかかるのに比べると，機械学習を行うプラットフォームとしては安上がりです。ResNet50を75%精度まで学習させるのに必要な料金は$200程度とのことです。

　　今回の発表は1つのCloud TPUの使用だけですが，今後，64TPUを収容するPodという単位での貸し出しも計画しているとのことです。

２．Gen-Zコンソーシアムが1.0版の仕様を公開

　　2018年2月13日のHPC Wireが，Gen-Z Consortiumの第1.0版のコア仕様の公開を報じています。これで，ハードメーカーがGen-Z仕様に準拠したインタフェースチップなどを作ることができるようになります。

　　Gen-Zは，メモリセマンティックでI/Oをアクセスするインタフェースで，NVメモリやアクセラレータを統一的に接続でき，かつ，メモリコヒーレンシも維持でき，レーテンシが短く高性能なインタコネクト仕様とのことです。第1版で規定されたリンク速度は，56Gbit/sと112Gbit/sと非常に高速です。

昨年11月のSC17ではGen-Zコンソーシアムはブースを出していましたし，HPEはGen-Zで大量の不揮発メモリを接続するThe Machineのプロトタイプを展示していました。

３．ISSCCでSamsungが0.026um²のSRAMセルを発表

　　2018年2月14日のEE Timesが，ISSCCでのSamsungの0.026um²のSRAMセルの発表を報じています。

　　下層の4～6層の露光にEUVを使っているとのことで，プロセスノードとしては7nmと書かれています。

　　同じISSCCで，Intelは10nmノードの0.0312um²のHDC SRAMセルと，0.0367um²のLVC SRAMセルを発表しました。こちらはEUV露光は使っていないので，EUVを使ったSamsungの方が小さいセルを作れるのは当然とも言えますが，量産できるSRAMセルのサイズで，IntelがSamsungに抜かれたのは，ニュースです。

　　Samsungの発表者は，この設計は完全にバリデーションが終わっており，EUVを使って量産ができると述べています。これを信じると，EUVの量産適用でも，SamsungがIntelを抜いたことになります。しかし，Intelの方がEUVの量産適用に慎重なだけで，技術レベルでそれほどの差はないという見方もあります。

　　また，TSMCは7nmプロセスのL1キャッシュを発表し，4.4GHzで動作するとのことです。16nmプロセスのL1キャッシュは3GHzであったので，アクセス時間は68％に減少しています。

４．SamsungとSK HynixがISSCCでGDDR6DRAMを発表

　　2018年2月15日PCWatchが，ISSCCでのSamsungとSK HynixのGDDR6 DRAMの発表を報じています。SK Hynixは22nmプロセスで，容量は8Gbit，転送速度は16Gbit/sのシングルチップに対して，Samsungは10nmクラスのプロセスで，8Gbitのダイを2個搭載する設計で，パッケージとしての容量は16Gbit，転送速度は18Gbit/sとなっています。

　　GDDR6はチップ当たり2チャネルという規格になっており，2つのダイで1チャネルずつ搭載する方がチップ内の配線も短くなり合理的とSamsungは主張しています。

　　18Gbit/sで384信号（12チップ構成）とするとピークバンド幅は864GB/sとなり，HBM2のメモリバンド幅に近くなります。もちろん，プリント板面積や消費電力の点ではHBM2の方が優れているのですが，値段が安いので，HBM2の採用は見送ってGDDR6を使おうという製品も出てくると思われます。

５．ARMがAIコアProject Trilliumを発表

　　2018年2月15日にARMは，マシンラーニング用のProject Trilliumというコアを発表しました。最初の製品はモバイル向けの低電力コアで3TOPS/Wという高い電力効率を持っています。

　　畳み込み演算などの定型的な処理を効率よく実行するFixed Function EngineとフレキシブルなProgrammable Layer Engineという2種の演算エンジンを搭載しており，プログラマブルな部分があるので，処理アルゴリズムが変わっても対応できる構成となっています。容量は明らかにされていませんが，ローカルメモリを持ち，ここに重みやネットワークの構成データを記憶させて処理することにより，外部メモリへのアクセス回数を減らして処理性能を上げています。

　　さらに，ネットワークコントロールユニットとDMAを持ち，外部メモリから必要なデータをローカルメモリに持ってくることができます。

　　ピーク演算性能は現実の処理で，最大4.6TOPSの性能を持つとのことです。

６．Intelがセキュリティーホールの発見賞金を増額

　　2018年2月15日のThe Inquirerが，Intelがセキュリティーホールの発見賞金を引き上げたと報じています。一般的なセキュリティーホールの発見者には＄100,000，SpectreやMeltdownのようなハードウェアの欠陥を利用するサイドチャネルアタックの発見者には＄250,000を出すとのことです。

　　これはセキュリティーホールを，より早く見つけ，対策を検討することができるようにするためです。

　　また，2月15日のThe Inquirerの別の記事は，NVIDIAとPrinceton大学のセキュリティーの研究者が，MeltdownPrimeとSpectrePrimeと名付けた新しいセキュリティーホールを見つけ，Proof of Conceptアタックを作ったと報じています。Prime+Probeサイドチャネルアタックでデータを読み出すとのことですが，詳細は分かりません。

　　投機実行して取り消された命令の副作用については，これまで考えていなかったので，SpectreやMeltdownのようなセキュリティーホールが，まだまだ，潜んでいる可能性は否定できません。

７．Intelのマイクロプロセサの市場シェアが60%を切った

　　2018年2月14日のEE Timesが，IC Insightsの調査報告を引いて，Intelのマイクロプロセサシェアが60%を下回ったと報じています。このカウントはチップ数ではなく，出荷金額のシェアをカウントしています。サーバ用プロセサやハイエンドのPC用プロセサは，携帯機器のプロセサやIoTのプロセサより単価が高いので，プロセサチップ数では，Intelのシェアは50%を下回っていると思われます。

　　2017年のマイクロプロセサの売り上げは$71.5Bで，その53%がPCやサーバに使われるCPUで，32%がスマホなどに使われるSoC，15%がIoTなどに使われる組み込みCPUとのことですが，2012年と比べると，PC，サーバ用CPUは，絶対金額では微増ですが，パーセンテージは64%から53%に減少し，組み込みとスマホなどのCPUが大きく伸びています。

８．IBMが6種のPOWER9サーバを発表

　　2018年2月14日のThe Registerが，IBMの6種のPOWER9サーバの発表を報じています。これは昨年12月に発表したAC922サーバに続くものです。

　　今回発表されたのは，L922，S914，S922，S924，H922，H924という6種のサーバです筐体は2Uのものと4Uのものがあり，4Uのサーバはより多くのドライブを搭載できます。搭載できるメモリはS914 は1TBですが，他の製品は4TBとなっています。そして，多くの製品はPCIe　G4を5チャネルとPCIe G3を6チャネルふぉうびしており，PCIe G4はCAPI2.0としても使えます。

　　POWER9 CPUは，1個の製品と2個搭載の製品があり，OSは，L922はLinuxだけ，S914，S922，S924はAIX，IBM iとLinuxが使えます。H922とH924はHANAを使いますが，1/4のコアでAIXあるいはIBM iを使えます。

　　GPUについては触れられていないので，AC922のようにVolta GPUは標準搭載にはなっていないようです。

９．Tsinghua Unigroupが10年間に$100Bを投資

　　2018年2月15日のEE Timesが，新華社の報道を引いて，中国の半導体企業であるTsinghua Unigroup（紫光集団）が10年間に$100B（約11兆円）を投資して，重慶に研究開発と半導体製造拠点を建設すると報じています。