20170401

最近の話題 2017年4月1日

１． Uberの自動運転車の事故の分析

　　2017年3月30日のEE Timesが，Uberの自動運転車の事故に関するレポートを載せています。この分析は，Linley GroupのDemler氏の助けを借りて行っています。

　　事故は3月24日にTempe市のS. McClintock Dr.とE. Don Carlos Aveの交差点で発生しました。McClintockを南向きに走って，交差点を直進しようとしたUberのVolvoに，McClintockを北向きに走って来てDon Carlosで左折（米国では大回りになる）しようとしたHonda CRVがぶつかったというものです。直進のVolvoに優先権があり，左折のHondaが譲るべきで，Hondaの女性ドライバが悪いという結論になっています。

　　これを受けて，Uberは自動運転車の実験を再開しました。

　　S. McClintockは，片道3車線で，中央寄りに左折レーンがあります。3車線のうちの中央寄りの2車線は渋滞で，交差点の先にも車が止まっている状態でした。UberのVolvoは，たまたま，空いていた右端の車線を時速38マイルで走って来て交差点に進入したところで，左折してきたHonda CRVがVolvoの左側にぶつかり，Volvoは，その反動で，交差点の向こう側にある信号にぶつかって横転し，3車線の真ん中のレーンで止まっていたHyndaiとFordにぶつかったというのが事故の概要です。

　　Volvoが交差点に進入したのは，信号が黄色に変わるタイミングですが，自動運転システムはブレーキを掛けず，アクセルも踏まず，それまでのスピードで進入したとのことです。

　　記事が指摘する問題点は，中央側の車線に渋滞で止まっている車の陰になったHonda CRVは屋根に搭載したLIDERでは見えたのではないか，見えないとしたら，左側から左折車が来る可能性の高い交差点に38マイルで進入するのが妥当かという点です。それから，ぶつかったHondaのドライバは急ブレーキをかけて止まりましたが，自動運転のVolvoはブレーキを掛けず，信号にぶつかり，跳ね返って隣の車線に止まっていた2台の車にもぶつかっています。

　　一義的にはHonda CRVのドライバが悪いのですが，Blind Intersectionに38マイルで漫然と侵入したのは過失ですし，衝突されてブレーキを掛けていないのも不適当な運転であると思います。Uberの自動運転システムは，このような事態を想定していなかったと思われます。

２． IntelがM.2カードの3D XPointを発売

　　2017年3月27日のEE Timesが，IntelのM.2カードの3D XPoint NVRAMの発売を報じています。16GBのものが$44，32GBのものが$77です。

　　PCのブート速度が2倍，Outlookの起動が6倍，ストレージの性能が最大14倍などの大きな改善もありますが，システム全体の性能改善では最大28%，ゲームの起動が最大18%改善という程度で，お値段に見合うのか難しいところです。

３． Intelが10nmプロセスと密度計算式を発表

　　2017年3月28日のEE Timesが，Intelの10nmと22nmプロセスの発表を報じています。10nmは，既に発表されているTSMCやSamsungの10nmプロセスに対抗するものですが，後に述べる密度計算法では，Intelのプロセスは，他社の2倍の密度になるとのことです。22nmプロセスはGlobal Foundryなどの22nm FDSOIに対抗するものです。

　　Intelの10nmプロセスですが，フィンピッチが34nm，フィンハイトが53nm，最小メタルピッチが36nm，セル高さが272nm，ゲートピッチが54nmと発表されました。

　　そして，2つの2入力NAND（トランジスタ8個）とトランジスタ72個のスキャンFFのセルを作り，NANDのトランジスタ密度の0.6倍とスキャンFFのトランジスタ密度の0.4倍の和で，トランジスタ密度を定義しています。

　　Intelの10nmプロセスは，シュリンクに加えて，Contact On Active Gateを可能として10%トランジスタ密度を改善していいる。その結果，密度は100.8Mトランジスタ/mm²になるが，他社は半分くらいしか出ないと述べています。

４． IntelのKnights Mill（KNM)のマシンラーニングサポート

　　2017年3月30日のOgawa, TadashiさんのTweetに，CERNで行われたマシンラーニングのワークショップでのIntelの発表スライドが公開されています。

　　それによると，KNMは，サイクルあたり2倍のFP演算を行うことが出来，ニューラルネットの計算に高い性能を発揮すると書かれています。そしてQFMA演算器はKNLのSP演算より2倍速く，KNMは2サイクルに１つのQFMAが実行できると書かれています。

　　QFMADの図を見ると。4個のFMAがカスケードに接続されていて，積和を計算するのには有難いのですが，4つカスケードで2サイクルで動くとは思えません。この表現は，4つのQFMAを8サイクルで実行できるということでしょう。SP演算器を倍増し，レジスタのR/Wのバンド幅を倍増していると思われます。

　　もう1枚のスライドは，新しいVariable Precision Instructionsに関するものです。可変精度といっても要は16ビット整数演算のサポートで，VNNI命令は，32bitのレジスタに16bitの2つの整数データを入れて2つの積を計算し，32bitの整数レジスタにアキュムレートするC0=C0+A0*B0+A1*B1という演算を行います。QVNNI命令は，これを4つ並列に実行する命令でAVX-512のSPでの計算の4倍のAI計算性能が得られます。

　　32bitのアキュムレートを行うことにより，SPと同程度の精度が得られるとIntelは言っています。