最近の話題 2018年7月28日

1.DARPAがERIの4プロジェクトのパ―トナーを発表

  2018年7月24日のEE Timesが,DARPAがElectronis Resurgence Initiative(ERI)の6つのプログラムの内の4つのプログラムの研究パートナーを発表したと報じています。DARPAのERIは,Mooreの法則の終わりが近づき進歩が鈍ってきたエレクトロニクスを再生させるためのイニシアチブで,今後,5年間で$1.5Bを投じると見られています。

  Skywater Technology Foundryはmonolithicな3D LSI技術で,90nmプロセスで7nm相当の密度を実現するというターゲットに挑みます。昔のCypressのファブを使い,プロセスを行うとのことです。monolithicな3D LSIでは上の層の製造では400℃以上の高温のプロセスは使えないので,低温で半導体を作ることが必要になります。この部分は,Stanford大のカーボンナノチューブトランジスタの技術やMITのResistive RAMの技術が候補なると見られます。この技術ができれば,コンピュータの計算速度を50倍に引き上げることが出来ると見込まれています。

  また,DARPAはMRAMと将来のメモリを開発するFoundations Required for Novel Compute(FRANC)プログラムを開始する予定です。FRANCの主要なコントラクタはGlobal Foundries,Applied Materials, Ferric,HRLとUCLA,U.of MinnesotaとU.of Illinoisとのことです。FRANCプロジェクトではSRAMと同等のアクセス速度でより高密度の不揮発メモリの開発を目指します。

  Software Defined Hardwareプロジェクトでは,Intel,NVIDIA, Qualcommが主コントラクタで,Georgia Tech, Princeton,Stanford,U.Mich,U.Washingtonが加わるとのことです。SDHは処理するデータに応じてリアルタイムに構造が変わるハードウェアの開発を目指します。

  Domain-Specific Systems on Chip(DSSoC)プログラムは,IBM,ORNL,Arizona State,Stanfordなどが参加し,アプリスペシフィックと汎用の機能をバランスさせる方法を見つけるのが目標とのことです。

  残る2つのEDA関係のプログラムの詳細は,6月のDACで発表される予定になっています。

2.中国はAI半導体の開発で最も開発費を集めている

  2018年7月24日のEE Timesが,中国はAI半導体の開発に米国を上回る資金を集めていると報じています。

  日本でもNシステムで,車がどこを走っているのかはかなりの精度で分かってしまいますが,中国は監視カメラで顔認識を使って個人を識別しており,2020年までにこのシステムを全土に設置すると方針だそうです。

  このシステムを供給しているSenseTimeは今年の2Qに$1.2Bを超える投資を集めており,さらにSoftbankのビジョンファンドが$1B近い投資を行うという話もあるようです。

  今月,清華大学がリリースしたレポートによると,2013年から2018年1Qの期間の世界のAIの開発投資の60%は中国だとのことです。また,中国の2017年のAI市場は$3.5Bで,2018年には75%伸びると見られています。

  2017年の中国のAIタレントの数は18,232人でこれは世界の8.9%に当たるとのことです。これは米国の13.9%に次ぐ数字です。そして,AI関係の論文の引用数では,既に中国は米国や日本を超えているとのことです。

3.GoogleがEdge TPUを発表

  2018年7月25日のThe Registerが,Google Next 2018において,GoogleがEdge TPUを発表したと報じています。現在のCloud TPUは低精度の浮動小数点演算をサポートし,ニューラルネットの学習を行えるチップですが,Edge TPUはInt8とInt16だけをサポートする推論専用のTPUです。

  AI Ops/W,AI Ops/$などを最大化する設計と書かれていますが,具体的なAI OpsやWなどの数字は発表されていません。ただし,カメラからの30fpsのビデオストリームをリアルタイムで処理して対象を認識することが出来ると書かれています。

  これまではセンサーからの信号をGoogleのデータセンターに送って,認識することが必要だったのですが,エッジデバイスにEdge TPUを備えれば,エッジデバイスで認識ができるので,応答が速くなり,通信のバンド幅も少なくて済みます。センターでの推論処理も減りセンターへの負荷集中も軽減できます。

4.SamsungはモバイルGPUを用意していた

  2018年7月23日のEE Timesが,Samsungは独自設計のモバイルGPUを用意していたと報じています。シミュレーション結果ですが,他のGPUを超える性能/Wとなるとのことです。複数の命令を束にして1サイクルで実行できるグループを作って実行するという方式で,いわゆるVLIW方式は使われていないとのことです。このチップは既にテープアウトされているとのことです。

  設計のリーダーはChien-Ping Lu氏で,NVIDIAでGPU設計の経験を積み,MediatekでもモバイルGPUを開発したのですが,結局は使われなかったとのことです。Medaitekの後,IntelやAIのスタートアップのNovuMindにも短期間所属し,Samsungに移ってから1年も経っていないとのことで,Lu氏が元々のアーキテクチャを作ったわけではなさそうです。

  この情報を報道したJon Peddie氏は,素晴らしいアーキテクチャで,コックピットやスパコンにも使えると評していますが,まずはSamsungのExynosスマホに使われると見られます。

5.インタネット越しに秘密情報を盗み出すNetSpectre

  2018年7月26日のThe Registerが,ネット越しに攻撃して秘密情報を盗めるNetSpectreについて報じています。MeltdownやSpectreは,攻撃コードを含んだプログラムをローカルに実行する必要があり,危ないメールなどを開かなければ大丈夫だったのですが,ほぼ,どのコードにも含まれているガジェットというコードの切れっ端を実行させて,ネットワーク経由でも秘密情報を盗み出せるNetSpectreを研究者が発表したとのことです。

  盗み出しは条件分岐予測を間違うようにして,秘密情報を読み出すコードを実行させます。これはSpectre v1と同じですが,このコードを作らなくとも,ネットワークのパケット処理のコードにこの命令列がありガジェットとして利用できます。

  そして,MeltdownやSpectreはキャッシュのラインのアクセス時間の違いを検出して情報を漏洩するガジェットを使っていたのですが,この論文ではAVX2命令の応答時間の違いで情報を漏洩させる新しい方法を提案しています。AVX2命令では,暫く(約0.5ms),256bitのレジスタの上半分を使わないと,その部分をパワーオフして節電します。このため,上半分を使うデータの場合は,再度,上半分のレジスタをパワーオンするために,応答時間が長く掛かります。この応答時間の違いで,投機実行状態のデータを盗み出してしまいます。

  キャッシュを使うコバートチャネルでは,読み出し速度は15bit/h程度であったものが,AVX2命令を使う方法では60bit/hと4倍の速度で読めるようになったとのことです。しかし,それでも毎時60bitですから1ビットに1分掛かります。盗み出すデータがどこに格納されているかを調べるには,大量のメモリアクセスが必要ですから,現実にはこの脅威は問題にならないという意見もあります。

6.TachyumがProdigyプロセサをEUに売り込み

  2018年7月27日のThe Registerが,Prodigyプロセサを開発しているスタートアップのTachyumがスロバキアにR&Dセンターを開設し,EuroHPCに意欲を示していると報じています。

  TachyumのProdigyプロセサは,汎用の64bitプロセサで,消費電力は1/10でサーバコストを1/3に引き下げると主張しています。Prodigyチップは64コアを集積し,完全にコヒーレントなメモリやバリア,ロックなどをサポートし,トランザクショナルメモリもサポートするとのことです。そして,2つの400Gb Eternetポートを持っています。

  Prodigyは,リネームやチェックポイントなどのOut-of-Order実行の機能をソフトウェアに移して,消費電力を減らしているとのことです。これらの機能はコンパイラが担うとのことです。それでも,Prodigyのシングルスレッド性能は,通常のコアより高いとのことです。

  複雑で電力も食うOut-of-Order実行機構を省くことが出来れば。電力は減ります。リネームはレジスタがあればコンパイラでやることは可能ですが,データフロー的な実行のメカニズムがコンパイラで代替できるというのは,私には俄かには信じられません。

  いずれにしても,低電力のProdigyプロセサを使い,2020年には人間の脳の規模のニューラルネットをリアルタイムで処理できると主張しています。そして,EuroHPCでTachyumのProdigyを採用すれば,2023年までにExascaleのスパコンを開発すると宣言している米国,中国,日本などを抜いて2020年の早い時期にExascaleスパコンを実現できると売り込んでいます。

7.IntelがXeon PhiのEnd of Lifeを発表

  2018年7月25日のHPCWirerが,IntelのXeon Phi製品の終息戦略の発表を報じています。昨年,IntelがPCI Express版のKnights Landingボードの販売を打ち切ったことで,IntelがXeon Phiの終息を図っていることは明らかでしたが,このほど,2018年8月31日で受注を打ち切り,2019年7月19日が最後の出荷日となることが発表されました。

  GPUに比べてプログラムの容易なアクセラレータを目指したのですが,期待したほど販売が伸びず,終息ということになりました。しかし,Xeon Phiと並行して生まれたOmni-Pathインタコネクトは,Xeonプロセサでも使われて残ります。

  

inserted by FC2 system