最近の話題 2021年4月17日

1.AIスタートアップのGroqがCラウンドで$300Mを調達

  2021年4月14日のEE Timesが,AIスタートアップのGroqがシリーズCのラウンドで$300Mを集め,CEOのJonathan Ross氏は,もっと投資したいという申し込みを断って$300Mに抑えたと言っています。このシリーズCを含めて合計$367Mの投資を集めたのですが,SambaNovaの$1.1B,Graphcoreの$710Mに比べると,まだ,少ない額です。

  この資金を使って,現在,122人の従業員を,今年の年末までに250人に増やすことを考えているとのことです。これまでは,ハードのエンジニアがソフトの会社に行くという流れの方が多かったのですが,最近では,逆にハードのエンジニアの方が集めるのが難しいようです。

  GroqはTensor Streaming Processor(TSP)というアーキテクチャで,縦方向には同じ機能ユニットが並び,横方向のスーパーレーンで演算カラムを接続し,パイプライン的に処理を行っていくという作りになっています。従って,全部の演算器が整然と動くと,非常に高い性能が出る。ということで,評価が高いのです。

  しかし,どの列の機能にどの列を繋いでパイプラインが作れるかにどれだけの自由度があるのかは気になるところです。新しいアルゴリズムに上手く対応できないと,あまり性能が出ないという恐れもあるのではないかと心配ですが,これは今回の話題ではありません。

2.AIチップとシステムの会社であるSambaNovaがDラウンドで$676Mを調達

  2021年4月13日のEE Timesが,AIチップとAIシステムを開発,販売するSambaNovaがシリーズDのファンディングで$676Mを集め,総額は$1.1Bになりました。そして,SambaNovaの企業価値は$5Bを超えたと書いています。

  SambaNovbaはAIサーバを販売するだけではなく,DataFlow-as-a-serviceがスローガンでシステムとして動くところまで面倒を見るという姿勢なのが評価されていると思います。

  SambaNovaのSN-10 AIアクセラレータチップは,PCUというコンピュートタイルとPMUというメモリタイルを3次元メッシュネットワークで接続する構造で,資料を見た感じでは,Groqのものより,接続の自由度が高いように思います。従って,新しいネットワークが出てきても対応できる可能性が高いと思います。

  一方,Groqの方が計算やメモリタイルに割くチップ面積が少なく,チップ面積あたりの性能は高いのではないかと思われます。


3.TSMCが2021年の設備投資額を再度引き上げ$30Bに増額

  2021年4月15日のEE Timesが,半導体不足で操業停止に追い込まれる企業が出ている現状から,増産を求められているTSMCが2021年の設備投資を$30Bに引き上げると報じています。昨年の設備投資は$17.2Bですから,ほぼ2倍の額になります。

  これほどの伸びとなると,半導体の製造装置などを作るメーカーの製造能力が追いつくのか?デリケートな微細加工装置を動かせるエンジニアが足りるのかというあたりから,一番細いところでパイプが詰まるのではないかと心配です。


4.NVIDIAがGrace CPUを発表

  2021年4月12日のEE Timesが,NVIDIAのarmアーキテクチャのGrace CPUの発表を報じています。普通のシステムはGPUーCPUーDRAMと直列の接続が4組あるだけですが,Graceを使うと,隣接するGrapeがNVLINKで接続され,4つのDRAMはコヒーレントなメモリになります。

  このGPU-Grace-DRAMが4組のシステムでは,4個のGPUがLPDDR5x DRAMにアクセスするバンド幅は2000GB/sで,普通のCPUがDDR4 DIMMにアクセスする場合の30倍のメモリバンド幅となります。

  このシステムでは,GraceはarmアーキテクチャのCPUとして動作するのと,GPUとDRAMメモリの接続バンド幅を大きくし,おまけにDRAMをコヒーレントに接続するという役目を担っています。

  AWSのGraviton CPUのソフトウェアスタックを使えば,AWSのGravitonノードと同様な働きはできると思いますが,x86バイナリを動かす用途には使えないと思われます。ということは,GraceがXeonを追い出すという状況がすぐに起こるとは思えませんが,性能が7倍に向上するというこの発表はNVIDIAの株価の上昇とIntelの株価の下落に繋がりました。

5.Esperantoが1093コアのRISC-VアーキテクチャのAIエンジンを発表

  2021年4月15日のCool Chipsで,Esperantoが1088コアのRISC-V CPUを集積するAIエンジンを発表しました。この発表は2020年12月8日に開催されたRISC-Vサミットでの発表とほぼ同じですが,幾つか初めて見るスライドも含まれています。

  なお,ET-SoC-1チップは1088個のミニオンコアと4個のマキシオンコアとサービスプロセサ用のミニオンコア1個を持っています。また,ミニオンコアは冗長コアを設けていますから,シリコンチップにはもっとたくさんのコアが作られています。

  ET-SoC-1チップは,TSMCの7nmプロセスで作られ,23.8Bトランジスタを集積しています。ミニオンコアは,256bit幅の浮動小数点演算ベクトルユニットを8個,512bit幅の整数ベクトルユニットを16個,超越関数計算用のROMを4組備え,L1$を付けたCPUコアになっています。CPUコアは,低電力が目標ですから,O-o-O実行のようなトランジスタを多く使う機構は搭載していません。

  ミニオンコアを8個纏め,それを4つ4x4のクロスバに接続しています。クロスバの反対側は4つの1MBのSRAMバンクに繋がっています。このメモリはキャッシュだけでなく,スクラッチパッドやローカルな同期用のメモリとしても使えます。これがメッシュネットワークに接続される「ミニオンの州」になります。

  面白いのはSRAMバンク部は正規の電源電圧で動かし,32コアのミニオンと4x4クロスバは0.4Vという低電圧で動かしている点です。低電力を良く知っているTransmetaの技術の流れを感じさせます。

  4個のマキシオンコアは汎用プロセサで,O-o-O制御で,最大5命令/クロックでRV64GC命令を実行できます。そして,典型的な動作状況では20W以下の消費電力とのことです。そして,6個のET-SoC-1チップを搭載するGlacier Point v2カードは6,558 RISC-Vコアと192GBのLPDDR4 DRAMを搭載し,消費電力は~150Wの見込みです。ET Minionのクロックを1GHzとすると,このカードの8bit整数でのピーク性能は800TOPSを超えるとのことです。現在,チップはファブで製造中とのことで,まだ,実物はできていないようです。



  

  

inserted by FC2 system