最近の話題 2020年10月17日

1.ついに常温超電導物質がつくられた

  2020年10月15日のThe Registerが,常温で超伝導性を示す物質ができたとNatureに発表されたと報じています。この物質はCarboneceous Sulfer Hydriteという粉末状の物質で,287.7K(15℃)で超伝導となるとのことです。しかし,まだ,喜ぶのは早く,超電導にするには,この物質に260万気圧の圧力をかけた状態で532nmの波長の10mWのレーザーを照射する必要があるとのことです。

  260万気圧という超高圧で電子の動きが制約されることで超伝導になると考えられています。

  炭素と硫黄が主成分の粉末はX線の回折では構造が分からず,まだ,どのような構造を持っているかなどは調べられていないそうです。

  常温超電導の達成はおおきな成果ですが,この物質が何かに使えるようになるのは,まだまだ,先になりそうです。

2.AIチップのスタートアップに成熟の兆し

  2020年10月15日のEE Timesに,Sally Ward-Foxton記者がHailo,Groq,Graphcoreを取り上げて,AIチップのスタートアップに成熟の兆しという記事を書いています。

  Hailoは推論専用ですが,3TOPS/Wの電力効率で26TOPSの性能を達成しています。この性能は,IntelのMyriad-XやGoogleのEdge TPUの性能を大きく超えるとのことで,記事に比較の棒グラフが載っています。

  そして,Hailoは自動車業界への進出をもくろんでおり,ASIL-Bの認証を受けているとのことです。

  Hailo-8はFoxconnのBOXiedgeやSocionextのSynQuacerなどに使用されています。

  次はGroqで,Gropmo既にTensor Streaming Processor(TSP)シリコンを出荷しています。TSPは8枚のTSPカードを使ったデータセンター用のAI推論エンジンで,1PetaOPSの性能とのことです。そして,ResNet-50v2でバッチサイズ1で18,900推論/秒の性能を持つとのことです。

  Groqは命令の実行のスケジューリングはソフトウェアで行う方式を取っており,実行効率が高い様です。

  8個のTPUを使うGroqの新しいカードは6POPsの性能を持ち,5Uサイズのサーバで消費電力は3.3kWとなっています。この電力効率はデータセンタのTCOに大きなメリットをもたらすとGroqは言っています。

  英国のAIアクセラレータスタートアップのGraphcoreは,世界的なチャネルパートナのネットワークの構築を発表しました。2018年に最初の製品を発表したGraphcoreは,2020年夏に第二世代のColossus Mark 2を発表しました。Mark 2チップはFP16でのAI計算で,1PFlopsの性能を持つとのことです。

  NVIDIAのA100は疎行列の圧縮を使っても600TFlopS程度ですから,2倍近い性能です。

  GraphcoreもElite Partner ProgramとPartnerProgram銘打ってディストリビュータやリセラーを組織しているとのことです。

3. armがNeoverse CPUのロードマップを発表

  2020年9月22日のThe Registerが,armのNeoverse CPUのロードマップを報じています。今回の発表は7nm/5nmのNeoverse V1(Zeus)です。V1はN1と比べると50%性能アップで,2×256bのSVEを備え,Bfloat16をサポートしています。メモリはGDDR5とHBM2eをサポートしています。そして,PCIeとCCIX 1.1 をサポートしています。

  2021年は5nm世代でN2プラットフォームが登場します。N2はPerseusと呼ばれ,SVEは持ちますが2×128bと小型です。性能もN1から40%向上となっています。しかし,2021年には5nmプロセスの採用で,CPUのコア数は128コアに増加します。メモリはHBM3をサポートし,CCIX2.0やCXL2.0をサポートする予定です。

  そして,2022年かそれ以降にPoseidon世代の新プラットフォームの登場です。そして,インタコネクトはCCIX next,CXL nextとなる予定です。そして,CPUはInfra WLの性能が30%アップで,MLやベクタ性能も向上となっています。そして,コアの密度も向上するとのことです。

4. V100 GPUをA100に買い替えるべきか

  2020年10月16日のHPC wireが,A100 GPUの性能向上は,GPUを買い替える意義があるかという記事を載せています。記事を書いたのはHartwig Anzt氏で,カールスルーへ大のコンピュータサイエンスの研究者で,MAGAオープンソースライブラリの開発者でもあります。

  それによると,V100をA100に置き換えることにより,Ginko Iterative Solverは1.5倍~1.8倍速くなったとのことです。また,MAGMAのバッチ化されたルーチンの実行速度はコードの変更なしで,最大1.6倍速くなったとのことです。

  これはコード変更なしの場合ですが,A100ではFP64でのTensor Coreのサポートが行われ,これを使えばFP64のピーク性能は19.5TFlopsとV100の2.6倍にアップします。

  より詳しいレポートはhttps://arxiv.org/abs/2008.08478に掲載されています。



inserted by FC2 system