最近の話題 2017年4月1日

1. Uberの自動運転車の事故の分析

  2017年3月30日のEE Timesが,Uberの自動運転車の事故に関するレポートを載せています。この分析は,Linley GroupのDemler氏の助けを借りて行っています。

  事故は3月24日にTempe市のS. McClintock Dr.とE. Don Carlos Aveの交差点で発生しました。McClintockを南向きに走って,交差点を直進しようとしたUberのVolvoに,McClintockを北向きに走って来てDon Carlosで左折(米国では大回りになる)しようとしたHonda CRVがぶつかったというものです。直進のVolvoに優先権があり,左折のHondaが譲るべきで,Hondaの女性ドライバが悪いという結論になっています。

  これを受けて,Uberは自動運転車の実験を再開しました。

  S. McClintockは,片道3車線で,中央寄りに左折レーンがあります。3車線のうちの中央寄りの2車線は渋滞で,交差点の先にも車が止まっている状態でした。UberのVolvoは,たまたま,空いていた右端の車線を時速38マイルで走って来て交差点に進入したところで,左折してきたHonda CRVがVolvoの左側にぶつかり,Volvoは,その反動で,交差点の向こう側にある信号にぶつかって横転し,3車線の真ん中のレーンで止まっていたHyndaiとFordにぶつかったというのが事故の概要です。

  Volvoが交差点に進入したのは,信号が黄色に変わるタイミングですが,自動運転システムはブレーキを掛けず,アクセルも踏まず,それまでのスピードで進入したとのことです。

  記事が指摘する問題点は,中央側の車線に渋滞で止まっている車の陰になったHonda CRVは屋根に搭載したLIDERでは見えたのではないか,見えないとしたら,左側から左折車が来る可能性の高い交差点に38マイルで進入するのが妥当かという点です。それから,ぶつかったHondaのドライバは急ブレーキをかけて止まりましたが,自動運転のVolvoはブレーキを掛けず,信号にぶつかり,跳ね返って隣の車線に止まっていた2台の車にもぶつかっています。

  一義的にはHonda CRVのドライバが悪いのですが,Blind Intersectionに38マイルで漫然と侵入したのは過失ですし,衝突されてブレーキを掛けていないのも不適当な運転であると思います。Uberの自動運転システムは,このような事態を想定していなかったと思われます。

2. IntelがM.2カードの3D XPointを発売

   2017年3月27日のEE Timesが,IntelのM.2カードの3D XPoint NVRAMの発売を報じています。16GBのものが$44,32GBのものが$77です。

  PCのブート速度が2倍,Outlookの起動が6倍,ストレージの性能が最大14倍などの大きな改善もありますが,システム全体の性能改善では最大28%,ゲームの起動が最大18%改善という程度で,お値段に見合うのか難しいところです。


3. Intelが10nmプロセスと密度計算式を発表

   2017年3月28日のEE Timesが,Intelの10nmと22nmプロセスの発表
を報じています。10nmは,既に発表されているTSMCやSamsungの10nmプロセスに対抗するものですが,後に述べる密度計算法では,Intelのプロセスは,他社の2倍の密度になるとのことです。22nmプロセスはGlobal Foundryなどの22nm FDSOIに対抗するものです。

  Intelの10nmプロセスですが,フィンピッチが34nm,フィンハイトが53nm,最小メタルピッチが36nm,セル高さが272nm,ゲートピッチが54nmと発表されました。

  そして,2つの2入力NAND(トランジスタ8個)とトランジスタ72個のスキャンFFのセルを作り,NANDのトランジスタ密度の0.6倍とスキャンFFのトランジスタ密度の0.4倍の和で,トランジスタ密度を定義しています。

  Intelの10nmプロセスは,シュリンクに加えて,Contact On Active Gateを可能として10%トランジスタ密度を改善していいる。その結果,密度は100.8Mトランジスタ/mm2になるが,他社は半分くらいしか出ないと述べています。

4. IntelのKnights Mill(KNM)のマシンラーニングサポート

   2017年3月30日のOgawa, TadashiさんのTweetに,CERNで行われたマシンラーニングのワークショップでのIntelの発表スライドが公開されています。

  それによると,KNMは,サイクルあたり2倍のFP演算を行うことが出来,ニューラルネットの計算に高い性能を発揮すると書かれています。そしてQFMA演算器はKNLのSP演算より2倍速く,KNMは2サイクルに1つのQFMAが実行できると書かれています。

  QFMADの図を見ると。4個のFMAがカスケードに接続されていて,積和を計算するのには有難いのですが,4つカスケードで2サイクルで動くとは思えません。この表現は,4つのQFMAを8サイクルで実行できるということでしょう。SP演算器を倍増し,レジスタのR/Wのバンド幅を倍増していると思われます。

  もう1枚のスライドは,新しいVariable Precision Instructionsに関するものです。可変精度といっても要は16ビット整数演算のサポートで,VNNI命令は,32bitのレジスタに16bitの2つの整数データを入れて2つの積を計算し,32bitの整数レジスタにアキュムレートするC0=C0+A0*B0+A1*B1という演算を行います。QVNNI命令は,これを4つ並列に実行する命令でAVX-512のSPでの計算の4倍のAI計算性能が得られます。

  32bitのアキュムレートを行うことにより,SPと同程度の精度が得られるとIntelは言っています。


  

   
inserted by FC2 system