最近の話題 2019年11月2日
1.Linley Fall Processor ConferenceでのAI関係の発表
2019年10月29日のEE TimesがLinley Fall Processor Conferenceの発表を報じています。Linley Gwennap氏は1990年頃からMicroprocessor Reportのエディタを務め,Microprocessor Reportが潰れた後,自分でLinley Groupという調査会社を興してLenley Fall Processor Conferenceを興してプロセサ関係の学会を継続してきました。
しかし,1990年代のRISCプロセサの開発フィーバーが下火になると,LinleyのConferenceの主題は組み込みプロセサにシフトしていったのですが,最近のマシンラーニングの隆盛で,注目Conferenceの地位を取り戻しているようです。
今回は,Intelの低電力,高性能のTremontコアの発表と,RISC-VのSiFiveのOut-of-Order実行のU84コアが発表されましたが,それ以外に,Marvelが2020年にThunderX3,2022年にThunderX4を出すことが発表されました。また,MellanoxはBluefield-2というI/Oプロセサを発表しました。Bluefield-2は8個のCortex-A72コアを搭載し,TCP/IP,ソフト定義のネットワーキング,セキュリティーなどの処理をオフロードできます。
AchronixはAlteraやXilinxに遅れじと7nmプロセスのSpeedster 7tというFPGA製品を発表しました。INT8でのML処理性能は80TOPSで,PCIe Gen5をサポートするとのことです。
HabanaはGaudiチップを使う学習用のアクセラレータHLS-1を発表しました。NVIDIAのDGXの対抗製品です。
Cadenceは低電力のMLアクセラレータのTensilica HiFi 5 DSP,Tensilica Vision DSPと独立のAIアクセラレータのTensilica DNA 100プロセサを発表しました。
そして,armはEthos MLアクセラレータを発表しました。Ethos-N77は1GHzクロックで4TOPSで,1-4MBのSRAMが付けられます。Ethos-N57は2TOPS,Ethos-N37は1TOPSとなっています。
CEVAは自動車向けのNeuPro-S AI &Visionプロセサを発表しました。SynopsysのARC VPX5 DSPプロセサも自動車向けで,センサフュージョンやセンサ処理向けのAI処理を行います。
Cornamiというスタートアップはシストリックアレイのコアを使って自動運転用とを狙っています,ArtemisIPはCPUやアクセラレータ等を接続する自動車用のNoCを発表しました。
AIではEdgeでの処理がホットで,Eta ComputeはCortex-M3とカスタムDSPとインタフェースで,RTCだけが動作であとはスリープの状態では500nAで動作するマイクロコントローラを発表しました。このチップは,EEMBC Coremarkを13μA/MHzで実行するとのことです。このチップの一つの応用はLPWANを使って運送用のパレットの位置を追跡するというもので,AAバッテリ4個で5年動作という仕様とのことです。このチップは移動や振動などをCNNを使って検出する機能も持っており,1回の推論に必要なエネルギーは0.4mJとなっています。
Latticeは5.4mm2という小さなパッケージのiCEUltraPlusというFPGAで推論を行うという発表を行いました。消費電力は10mW以下とのことです。
FlexLogixはInferX X1というプロセサを発表しました。低レーテンシの推論をターゲットにしており今年12月にテープアウトの予定です。
BrainChipというスタートアップは,Akidaと呼ぶSpiking Neural Netの処理チップを開発しています。必要な部分だけをスパイクで動かすので,非常に低い消費電流で推論を行えます。また,推論だけでなく,Incremental Learningもできるとのことです。
GrAI Matter LabsはGrAI(greyと発音する)Oneチップを発表しました。GrAI OneもIntelのLoihiと同様な神経系と同様に動作するチップで,Incremental Learningが可能と思われます。GrAI Oneは196コアを持ち,200Kニューロンをモデルできるとのことです。チップサイズは20mm2と小さいとのことです。
NovuMindはビデオ処理用のAIチップを開発しており,12nmプロセスを使う量産チップを設計中です。このチップは2304MACを搭載し,1GHz動作で5Wの消費電力とのことです。そして,8Kビデオを60FPSで処理できるとのことです。
2.IntelがTremontコアを発表
2019年10月29日のEE TimesがLinley Fall Processor ConferenceでのTremontコアの発表を報じています。
TremontはIntelの10nmプロセスで作られる電力効率の高いプロセサとのことで,MicrosoftのSurface Neoにも採用されるとのことです。
最大の狙いは,シングルスレッド性能の向上で,前世代のGoldmont Plusと比較してIPCが30%向上とのことです。
Intelの資料では,命令のデコードは6命令と書かれていますが,実態は3wideのユニットが2つあるようです。実行のアロケーションは4命令で,10個の命令実行ポートに命令を発行する。ロード,ストアのパイプは2本となっています。
2次キャッシュはsaidai4.5MBとGoldmont Plusの1.5倍に増強されています。
実装はシリコンチップを2段に重ねるFoverosを使い,小型化を行っています。FoverosはI/O端子部分の寄生容量も減らせるので,電力低減にも貢献しそうです。
Tremontの登場はLakefield PCで,1個のビッグコアと4個のTremontコアが搭載されるとのことです。とすると,IntelはTremontがLITTLEコアと見られるのを嫌っているようですが,やはりLITTLEコア的に使われるのではないかという気がします。
ただし,ビッグコアが1個なので,通常の使用状態では4個のTrementで乗り切り,どうしてもそれ以上の性能が必要な時だけビッグコアを動かすという使い方で,armのbig.LITTLEとは若干異なる使い方とも言えます。
3.SiFiveがOut-of-OrderのU8アーキテクチャのコアを発表
2019年10月29日のEE TimesがLinley Fall Processor ConferenceでのSiFiveのOut-of-Orderコアの発表を報じています。この発表はU8アーキテクチャの内のU84実装を中心とした発表であったとのことです。
発表資料によると,整数演算の場合は10段のパイプラインで,ロード/ストアの場合は12段のパイプラインとなっています。U84は3命令をOt-of-Orderで発行できるとのことで,armのA72の対抗馬とのことです。
リオーダバッファは数ダースのエントリを持つとのことですが,詳細は発表されませんでした。U84は完全にカストマイズができるコアで,命令発行スロット数,ファンクションユニット数,キャッシュサイズ,浮動小数点演算器の数などをカストマイズできるとのことです。
U84は7nmプロセスを使った場合,2.6GHzクロックで動作するとのことです。
また,SiFiveは来年には上位のU87を登場させる予定で,U87では,SIMD Vector拡張を取り入れる予定です。