最近の話題 2020年8月29日

1.2020年のHot ChipsでIntelがXe GPUを発表

  2020年8月17日のHot Chips 32において,IntelはXe GPUを発表しました。XeはExaのマシンをEveryoneが使えることを目指す命名だそうです。そしいて,Xeは一つの製品ではなく,下の方から順に,XeLPXeHPGXeHPXeHPCというブランドの製品群があり,LPはCPU内蔵のエントリGPU,HPGはミッドレンジのゲーミングGPU,HPはデータセンター/AI用の高性能GPU,HPCはエクサスケールのスパコン用のGPUで,アルゴンヌ国立研究所に納入されるAuroraスパコンに使用されるハイエンドのGPUです。

  一番ハイレベルのハードウェアアーキテクチャの図では3D/Compute Slice,Media SliceとMedory Fabricという層が描かれていますが,このレベルではどこのGPUも大差ありません。3D/Compute SliceにはGeometory,Raster,Pixel Dispatchという固定機能のブロックと16個のEUが入ったSubsliceが並んでいます。

  面白いのはSubsiceの固定ファンクションの中の3D sampler,Media sampler,Ray Tracingの機能がオプションになっている点です。

  そして,それぞれのEUはThread Control, Register Fileなどを持ち,FP演算器,INT演算器,拡張演算器,オプションのFP64演算器と,同じくオプションのマトリクス演算器を持っています。

  オプションを全部外したら何が残るのかという心配をするほど,あれもこれもオプションという作りです。最初に書いたように5種の製品系列があり,それぞれにオプションの有無があるとすると,製品の種類は」膨大になりそうな気がします。

  メモリ系はCompute SliceからL3$とオプションのRambo$に繋がっています。そして,L3$からGTIを経由して外部DRAMやPCIeなどが出ています。

  そして,実装ですが,Xe HPCのPonte Vecchio GPUは,Base tile,Compute tile,Rambo$ tile,Xe link I/O tileをFoverosとCO-EMIGでつなぐというテクノロジオンパレードの作りです。

  ただし,今回の発表はほんの触りだけで,詳細は,数週間後の製品発表時に公開されるとのことです。


2.2020年のHot Chipsの大トリはLightmatter

  2020年8月17日のHot Chips 32において,大トリを務めたのはLightmatterという会社です。Lightmatterは2017年にMITからのスピンアウトして設立された会社です。このLightmatterの発表について,2020年8月24日のEE Timesが報じています。

  電子回路でAI計算をやれば100ns掛かるところを光でやれば100psで実行できる。そしてて,電子回路では1mWの電力を必要とするのですが,光なら1uWでやれるとのことです。

  光を変調するMZI素子は大きいのですが,Lightmatter社が使うNano Optical Electro Mechanical System (NOEMS)は低ロスで数100MHzで動作するとのことです。

  光の単方向カプラとフェーズシフタで,2×2のマトリクスに1×2のベクトルの積を計算することができます。Lightmatter社は2×2のマトリクスの積の計算を,ほとんど電力を使わず,光の速度で実行することに成功したとのことです。

  この回路をアレイ状に並べれば大きなマトリクスとベクタの積が計算でき,LightmatterのMarsチップは64×64のマトリクス,入力ベクタのエンコード,重みのモジュレータを持ち,演算結果を読み取るデコーダも集積したチップです。ベクタの処理速度は1GHzで,50mWのレーザで動作し,8bitの符号付のオペランドを処理することができます。そして,演算のレーテンシは200psです。

  このチップは90nmのフォトニクスの標準プロセスで製造でき,チップサイズは150mm2となっています。

  また,Lightmatter社は,光回路で作りにくい非線形のアクティベーション演算や,アキュムレータの部分は電子回路で作るMars SoCというチップを14nmプロセスのSoCで製作しました。このMarsチップの上にMars SoC載せて,デモ用の光で演算するAIプロセサを作っています。

  Lightmatter社のMarsチップは,64個のDACと64個のADCを使って4096個のMAC演算を行うことができるチップですが,これに加えて波長多重や位相多重の技術を使えば,1個のプロセサでN個の演算を並列に実行することができることになります。

  Lightmatterは製品チップの開発を行っており,このシステムはNVIDIAのフラグシップのA100 GPUを超える性能を目指しているとのことです。




inserted by FC2 system