最近の話題 2019年7月13日

1.AMDがRyzen 3000 CPUを発売

  2019年7月9日のSemiAccurateが,7月5日のRyzen 3000 CPUの発売を報じています。SemiAccurateの記事はRyzen 3000について詳しく書いているというよりも,Intelの価格政策を非難する記事ですが,見方としては当たっていると思います。興味のある方はCharlie Demerjian氏の記事を読んでください。

  発表されたのは,Ryzen 9 3900X,Ryzen 7 3800X,Ryzen 7 3700X,Ryzen 5 3600X,Ryzen 5 3600とRyzen 5 3400GとRyzen 3 3200Gの7品種です。ただし,3400Gと3200Gは古いRyzen2/Zen+チップを使っており,技術的には今回発売のRyzen 3とは別物です。

  Ryzen 3000はcIODというメモリとI/Oを接続するチップと,CCDという8個のCPUコアを搭載するチップで構成されるマルチチップのシステムです。Ryzen 9 3800Xとそれ以下の品種はCCDが1個ですが,3900Xは2個のCCDを使っています。3900Xは2個のCCDで合計16個のコアがあるのですが,不良コアを許容して12個だけを使っています。

  なお,16コア32スレッドの3950Xは9月に出る予定になっています。

  そして,2 CCDの品種でもcIOD経由でメモリアクセスが行なわれるので,CPUは2チップに分かれているのですが,前世代のように別チップ側のメモリをアクセスすると長いアクセス時間が掛るといいうNUMA問題は無くなっています。

  最上位の3900Xはクロックが3.8/4.6GHz,12コア24スレッドで,お値段は$499となっています。一方,IntelのCore i9 9900Kは8コア16スレッドでクロックは3.6/5.0GHzで$488です。これは,従来のAMDのプロセサと異なり,1コアの性能はIntelと互角で,ほぼ同じ値段となっています。しかし,3900Xは105Wという低電力で,24レーンのPCIe4.0を搭載している点で20レーンでPCIe3.0のCore i9とは大きな違いです。

  基本的なI/Oインタフェースとして4レーン必要ですから,それに16レーンのハイエンドGPUを付けると,Intelの方は,NVMeなどを付けることができません。しかし,Ryzen 3000の方は,まだ,4レーンあるので,ここにNVMeを付けることができ,単に4レーンの違いだけでなく,機能的に大きな差が付いてしまいます。

  また,Ryzen 3600から3800Xもお値段はIntelの対応するCPUと同じ程度の値段となっています。Ryzen 3000は秋葉原でも売れ行き快調のようで,AMDの利益を押し上げると期待されます。

2.GoogleとNVIDIAがMLPerfの性能を発表

  2019年7月10日のEE Timesが,MLPerf Training V0.6の発表とGoogleとNVIDIAなどが登録した性能値を報じています。

  それによると,翻訳,オブジェクト認識,画像分類の3つのベンチマーク性能ではGoogleがNVIDIAを抑えて1位になり,リカーレントな翻訳,Mask R-CNNを使う高度なオブジェクト認識,MiniGOの強化学習のベンチマークではNVIDIAが1位になりました。

  Googleが1位になったベンチマークではTPUv3チップを1024個使っており,NVIDIAもV100  GPUを240~1536個使っています。NVIDIAが1位になったのは処理が複雑なベンチマークで,GPUを256個~24個の使用です。また,全てのベンチマーク結果を16チップのケースに正規化すると,イメージ認識以外ではNVIDIAが勝っています。

  MLPerfに参加している会社は約40社とのことですが,このベンチマークに使われたNVIDIAのDGX2hシステムは,$38Mだそうで,GoogleやIntelはともかく,大部分のメーカーはトップ争いには付いて行けないと見られます。

  また,スタートアップ各社は,他社にひけをとるとまずいのか,様子見で,どこも登録を行っていません。

Eta Compute社のエッジ用低電力AIチップ

  2019年7月10日のEE Timesが,Eta Computeという会社のエッジ用の低電力AIチップについて報じています。

  Eta ComputeのECM3531というチップは,ARM Cortex-M3とNXPのCoolflux DSPをベースにして作られています。そして各種の組み込み用のインタフェースとSRAMとFlashメモリを持っています。

  このTensaiと名付けられたチップは,TensorFlowやCaffeでプログラムでき,低電力が重要な各種の組み込み用途に使うことができます。

  ECM3531SPは音声認識やキーワード認識用に学習済み,ECM3531PGは医療用のPhotoplethysmogram(PPG)用に学習済み,ECM3531SFはジャイロ,磁力,加速センサーの情報の融合用に学習済みとなっています。

  Eta社のアルゴリズムは他社のものと比較するとSNRが低いところでも認識精度が高く,消費電力を1/30にできるとのことです。ECM3531の消費電流は認識時には1mA,スタンバイ時には1uA以下とのことです。そして,8Mオペレーションの画像認識に必要なエネルギーは0.04mJ とのことです。

4.高性能メモリを開発するBlueshift Memory

  2019年7月10日のEE Timesが,高性能メモリを開発しようとしているBlueshift Memory社について報じています。イギリスのCambridgeに本拠を置くBlueshift Memoryは,メモリ素子としてはDRAMを使うのですが,配線を変えてメモリの格納方法を変えて,巨大なデータセットの処理に適した形にするのだそうです。

  同社は,XilinxのFPGAを使って同社のメモリのモデルボードを作り,大幅に高性能のアクセスができることを確認しました。それで,実際のチップを開発するために投資を募っているとのことです。

  DNAのフラグメントのマッチング処理は100倍速く,天気予報や気候変動のアルゴリズムも100倍速くなったとのことです。また,ビデオ編集のソフトウェアも10倍速くなったとのことです。

  Blueshift Memoryは,このテクノロジのライセンスについてDRAMやFRAMのメーカーと会話を始めているとのことです。

5.CMUとFacebookの研究者が作ったポーカーAIがプロに快勝

  2019年7月12日のThe Registerが,CMUとFacebookの研究者が作ったPluribusというポーカーAIロボットが5人の人間のプロのポーカープレイヤーと対戦して快勝したと報じています。

  将棋や囲碁は,相手の手が完全に見えるのですが,ポーカーは相手の持っているカードは見えない不完全情報のゲームという点が大きな違いです。また,囲碁や将棋は1対1の対戦ですが,このゲームでは5人の相手と戦っている点も違います。

  この対戦は,チップでやり取りされ現金は掛かってなかったのですが,1万回の手をプレイして,1回のプレイで平均的に$1000勝ったそうです。

  Counterfactual regret minimizationというアルゴリズムで学習させたとのことで,このアルゴリズムは他のポーカーボットでも使われている一般的なものとのことです。しかし,例えば$200を賭けるのと$201を賭けるのは違うプレイで,普通は別々に将来の展開を読むのですが,Pluribusでは,どちらも同じような展開になると考えて典型ごとに先を読むというような方法で,計算量を減らしています。

  そして,Pluribusは64コアのCPUと512GBのメモリのサーバで8日間学習を行ったとのことです。これはクラウドのCPUを借りても$150くらいで学習ができ,GoogleやNVIDIAのMLPerfの学習環境とは大違いです。

  このボットの基本的な部分はCMUのToumas Sandholm教授の研究室で作られたもので,教授が設立した2つの会社がライセンスを行っており,公開されていません。従って,コードをダウンロードしてPluribusを作ってオンラインポーカーで荒稼ぎということはできません。

6.Teslaの自動運転ソフト開発部門から11人が退社

  2019年7月10日のThe Registerが,Teslaモーターの自動運転ソフトの開発部門の11人のエンジニアが退社したと報じています。

  Musk社長が,TeslaのAutopilotで,来年にはFull Self Drivingを実現すると期限を明示したことに賛成できなかったことが退社の原因と見られています。

  昔から,Musk氏は自動運転に対して楽観的ですが,この楽観的発言を実現するはずの技術陣には,その見方を共有できない人がかなり居たということでしょう。

  まあ,Teslaを辞めても引く手あまたで,再就職には困らないでしょう。

inserted by FC2 system