最近の話題 2018年2月17日
1.GoogleがCloud TPUを1時間$6.50で提供
2018年2月12日のThe Registerが,GoogleがCloud TPUをクラウドで提供すると報じています。Cloud TPUですが,4個のTPU2チップを搭載するボードをCloud TPUと呼んでいます。従って,Cloud TPUの混合精度の積和演算性能は,180TFlopsとなります。
これを1時間使用するための料金は$6.50とのことです。AWSでトップエンドのGPUを使うと$24/Hourかかるのに比べると,機械学習を行うプラットフォームとしては安上がりです。ResNet50を75%精度まで学習させるのに必要な料金は$200程度とのことです。
今回の発表は1つのCloud TPUの使用だけですが,今後,64TPUを収容するPodという単位での貸し出しも計画しているとのことです。
2.Gen-Zコンソーシアムが1.0版の仕様を公開
2018年2月13日のHPC Wireが,Gen-Z Consortiumの第1.0版のコア仕様の公開を報じています。これで,ハードメーカーがGen-Z仕様に準拠したインタフェースチップなどを作ることができるようになります。
Gen-Zは,メモリセマンティックでI/Oをアクセスするインタフェースで,NVメモリやアクセラレータを統一的に接続でき,かつ,メモリコヒーレンシも維持でき,レーテンシが短く高性能なインタコネクト仕様とのことです。第1版で規定されたリンク速度は,56Gbit/sと112Gbit/sと非常に高速です。
昨年11月のSC17ではGen-Zコンソーシアムはブースを出していましたし,HPEはGen-Zで大量の不揮発メモリを接続するThe Machineのプロトタイプを展示していました。
3.ISSCCでSamsungが0.026um2のSRAMセルを発表
2018年2月14日のEE Timesが,ISSCCでのSamsungの0.026um2のSRAMセルの発表を報じています。
下層の4~6層の露光にEUVを使っているとのことで,プロセスノードとしては7nmと書かれています。
同じISSCCで,Intelは10nmノードの0.0312um2のHDC SRAMセルと,0.0367um2のLVC SRAMセルを発表しました。こちらはEUV露光は使っていないので,EUVを使ったSamsungの方が小さいセルを作れるのは当然とも言えますが,量産できるSRAMセルのサイズで,IntelがSamsungに抜かれたのは,ニュースです。
Samsungの発表者は,この設計は完全にバリデーションが終わっており,EUVを使って量産ができると述べています。これを信じると,EUVの量産適用でも,SamsungがIntelを抜いたことになります。しかし,Intelの方がEUVの量産適用に慎重なだけで,技術レベルでそれほどの差はないという見方もあります。
また,TSMCは7nmプロセスのL1キャッシュを発表し,4.4GHzで動作するとのことです。16nmプロセスのL1キャッシュは3GHzであったので,アクセス時間は68%に減少しています。
4.SamsungとSK HynixがISSCCでGDDR6DRAMを発表
2018年2月15日PCWatchが,ISSCCでのSamsungとSK HynixのGDDR6 DRAMの発表を報じています。SK Hynixは22nmプロセスで,容量は8Gbit,転送速度は16Gbit/sのシングルチップに対して,Samsungは10nmクラスのプロセスで,8Gbitのダイを2個搭載する設計で,パッケージとしての容量は16Gbit,転送速度は18Gbit/sとなっています。
GDDR6はチップ当たり2チャネルという規格になっており,2つのダイで1チャネルずつ搭載する方がチップ内の配線も短くなり合理的とSamsungは主張しています。
18Gbit/sで384信号(12チップ構成)とするとピークバンド幅は864GB/sとなり,HBM2のメモリバンド幅に近くなります。もちろん,プリント板面積や消費電力の点ではHBM2の方が優れているのですが,値段が安いので,HBM2の採用は見送ってGDDR6を使おうという製品も出てくると思われます。
5.ARMがAIコアProject Trilliumを発表
2018年2月15日にARMは,マシンラーニング用のProject Trilliumというコアを発表しました。最初の製品はモバイル向けの低電力コアで3TOPS/Wという高い電力効率を持っています。
畳み込み演算などの定型的な処理を効率よく実行するFixed Function EngineとフレキシブルなProgrammable Layer Engineという2種の演算エンジンを搭載しており,プログラマブルな部分があるので,処理アルゴリズムが変わっても対応できる構成となっています。容量は明らかにされていませんが,ローカルメモリを持ち,ここに重みやネットワークの構成データを記憶させて処理することにより,外部メモリへのアクセス回数を減らして処理性能を上げています。
さらに,ネットワークコントロールユニットとDMAを持ち,外部メモリから必要なデータをローカルメモリに持ってくることができます。
ピーク演算性能は現実の処理で,最大4.6TOPSの性能を持つとのことです。
6.Intelがセキュリティーホールの発見賞金を増額
2018年2月15日のThe Inquirerが,Intelがセキュリティーホールの発見賞金を引き上げたと報じています。一般的なセキュリティーホールの発見者には$100,000,SpectreやMeltdownのようなハードウェアの欠陥を利用するサイドチャネルアタックの発見者には$250,000を出すとのことです。
これはセキュリティーホールを,より早く見つけ,対策を検討することができるようにするためです。
また,2月15日のThe Inquirerの別の記事は,NVIDIAとPrinceton大学のセキュリティーの研究者が,MeltdownPrimeとSpectrePrimeと名付けた新しいセキュリティーホールを見つけ,Proof of Conceptアタックを作ったと報じています。Prime+Probeサイドチャネルアタックでデータを読み出すとのことですが,詳細は分かりません。
投機実行して取り消された命令の副作用については,これまで考えていなかったので,SpectreやMeltdownのようなセキュリティーホールが,まだまだ,潜んでいる可能性は否定できません。
7.Intelのマイクロプロセサの市場シェアが60%を切った
2018年2月14日のEE Timesが,IC Insightsの調査報告を引いて,Intelのマイクロプロセサシェアが60%を下回ったと報じています。このカウントはチップ数ではなく,出荷金額のシェアをカウントしています。サーバ用プロセサやハイエンドのPC用プロセサは,携帯機器のプロセサやIoTのプロセサより単価が高いので,プロセサチップ数では,Intelのシェアは50%を下回っていると思われます。
2017年のマイクロプロセサの売り上げは$71.5Bで,その53%がPCやサーバに使われるCPUで,32%がスマホなどに使われるSoC,15%がIoTなどに使われる組み込みCPUとのことですが,2012年と比べると,PC,サーバ用CPUは,絶対金額では微増ですが,パーセンテージは64%から53%に減少し,組み込みとスマホなどのCPUが大きく伸びています。
8.IBMが6種のPOWER9サーバを発表
2018年2月14日のThe Registerが,IBMの6種のPOWER9サーバの発表を報じています。これは昨年12月に発表したAC922サーバに続くものです。
今回発表されたのは,L922,S914,S922,S924,H922,H924という6種のサーバです筐体は2Uのものと4Uのものがあり,4Uのサーバはより多くのドライブを搭載できます。搭載できるメモリはS914 は1TBですが,他の製品は4TBとなっています。そして,多くの製品はPCIe G4を5チャネルとPCIe G3を6チャネルふぉうびしており,PCIe G4はCAPI2.0としても使えます。
POWER9 CPUは,1個の製品と2個搭載の製品があり,OSは,L922はLinuxだけ,S914,S922,S924はAIX,IBM iとLinuxが使えます。H922とH924はHANAを使いますが,1/4のコアでAIXあるいはIBM iを使えます。
GPUについては触れられていないので,AC922のようにVolta GPUは標準搭載にはなっていないようです。
2018年2月15日のEE Timesが,新華社の報道を引いて,中国の半導体企業であるTsinghua Unigroup(紫光集団)が10年間に$100B(約11兆円)を投資して,重慶に研究開発と半導体製造拠点を建設すると報じています。