最近の話題 2021年4月24日


1.ML CommonsがInference v1.0の結果を発表

  2021年4月21日にMLCommonsが,Datacenterベンチマークのv1.0の推論の結果を公表しました。前の版のv0.7では7つのベンチマークだったのですが,v1.0ではRecommendationを行うDLRMが追加されました。リコメンデーションは過去の閲覧履歴から,興味のありそうな広告を表示するような推論で,Webで一番使われているマシンラーニングです。

  それから,もう一つの大きな追加は,システムの消費電力が結果の項目として追加された点です。ただし,電力はシステム全体の電力で,他のマシンの結果と比較するには,単位性能あたりの消費電力に変換する必要があります。

  今回発表されたのはDatacenterの推論だけで,エッジシステムの結果は入っていませんし,また,学習のベンチマークの結果は発表されていません。しかし,v0.7の発表ではこれらも含まれていたので,それほどの遅れなしにこれらの結果も公表されるのではないかと思われます。

.Cerebrasの第二世代Wafer Scale Engine

  2021年4月20日のEE Timesが,Cerebrasの第二世代のWefer Scale Engineについて報じています。WSE2は,昨年8月のHot Chipsで発表されたのですが,その時は最初のロットがファブから戻ってきたところという感じでしたが,今回は,プレス等にも正式発表になったようです。

  WSE1は16nmプロセスで製造されているのですが,WSE2はTSMCの7nmプロセスを使っています。トランジスタ数は2.6Tで,WSE1は1.2Tとランジスタでしたから2.17倍のトランジスタということになります。16nmを7nmに微細化すればトランジスタ数は5.22倍になってよい計算ですが,それと比べると物足りない数字です。TSMCの7nmが物足りないプロセスなのかもしれません。

  Feldman CEOは,すべての方向に2.3倍に性能を引き上げ,Cerebrasの技術は微細化に対応できる技術であることを示したと述べています。

  WSE2の諸元は,チップサイズはWSE1と同じで46,225mm2で,トランジスタ数は2.6T,コア数は850K。オンチップメモリは40GB,メモリバンド幅は20PB/s,ファブリックバンド幅は220Pbit/sとなっています。

   WSE1の経験からマイクロアーキテクチャを改善したとありますが,具体的にどんな改良が加えられているのかは記事にはかかれていません。

  Cerebrasの従業員数は300人,シリーズEまでで集めた資金は$475M,Cerebrasの企業価値は$2.4Bになっているとのことです。

  そして,WSE-2を搭載したCS-2サーバの発売は3Qの予定だそうです。


3.NVIDIAがGTC 2021でDrive Atlanを発表

  2021年4月18日のEE Timesが,GTC 2021でのNVIDIAのAtlanの発表を報じています。現在のNVIDIA Driveを実行するハードウェアはXavierは30TOPSですが,2022年には,次世代のOrinを出すと発表しており,Orinは254TOPSとのことです。

  そして,その次が2025年に出すAtlanです。Ampere Next GPUを搭載するAtlanは1000TOPSのAI処理性能を持ちます。そして,セキュリティーや通信機能を担当するBluefield DPUとメモリバンド幅を拡張してAI処理やHPC性能を引き上げるGrace-Next CPUも搭載しているとのことです。

  しかし,AI処理だけで1000TOPSが必要とすると,30TOPSのXavierや254TOPSのOrinで自動運転している車には怖くて乗れませんね。それに1000topsのAtlanでも不足ということになりそうな気がします。この程度あれば,大体OKというのはどのくらいのAI性能なんでしょうね。

4.スパコンでCOVID-19の変異ウイルスを解析したら…

  2021年4月22日のHPC WireがCatholic University of AmericaのVictor Padilla-Sanchez氏がTACCのFronteraスパコンを使って,N501Y変異を持つ英国型の変異ウイルスを解析した結果,このウイルスでは結合する効率が高くなっており,感染性が高まっていることが分かったとのことです。

  また,E484K変異は免疫の効きが低下するカギとなっているとのことで,Padilla-Sanchez氏は,これらの変異ウイルスには個別のワクチンが必要と述べています。

  そして,このようなたんぱく質の結合計算は大量の計算を必要とするので,Fronteraが無ければできなかったと述べています。


5.アレシボ天文台のデータを救出

  2020年11月21日の話題で老朽化したアレシボ天文台の巨大パラボラアンテナは爆破に決定したと書きましたが,爆破するまでもなく,12月2日にケーブルが切れて落下して壊れてしまいました。しかし,この望遠鏡の3PBを超える60年間の観測データが近くにあるデータセンタに残っています。このデータセンタはアンテナの落下の影響を受けず,無事だそうです。2021年4月21日のHPC Wireが,そのデータの救出が行われると報じています。

  天文学では,観測のターゲットの天体のデータは使われますが,その他の大部分の天体のデータも,別の研究では使われるということがあり,観測データは保存され,天文学者はそのデータを取り出して利用できるようになっています。そのため,アレシボの観測データを救出しようとしました。そして,NSFが資金をだしているEngagement and Performance Operations Center (EPOC)と Cyberinfrastructure Center of Excellence (CI CoE) Pilot projectに援助を依頼し,TACCのテープアーカイブのRanchにデータを格納することに決まったとのことです。Ranchは70PBの容量があり,ハードを増設すれば1000PBまで拡張できるアーカイブです。

  データは可搬型のストレージに入れてプエルトリコ大学に運び,そこからアップロードするのだそうですが,データのコピー速度は12TB/日とのことで,かなり時間が掛ります。しかし,TACCのRanchは仮のストレージで,さらに,最終格納場所を探すのだそうです。


6.スパコンで渦を入れたモデルで南極の氷の溶け方をシミュレートしたら…

  2021年4月19日のHPC Wireが,オランダのユトレヒト大の研究者が,南極の氷の溶け方をシミュレートするときに,従来のモデルに海水の流れに生じる渦をモデルに追加したシミュレーションを行った結果,渦があるモデルの方が南極の棚氷の融解が25%少ないという驚くべき結果が得られたと報じています。

  融解が少ないということは,海面上昇が少ないということで,喜ぶべき結果です。

  シミュレーションに使われたのはCartesiusというスパコンですが,1.84PFlopsとのことですから,今ならば,それほど大きなスパコンではありません。


7.英国のMet Officeの次期システムはMicrosftのAzureで構築

  2021年4月22日のHPC Wireが,英国のMet Officeの予算$1.56Bの気象予測と気候研究のスパコンは,AMDのMilan CPUを使うHPEのハードウェアを,Microsoft Azureでシステム構築すると報じています。

  第1期のシステムは2022年7月に稼働開始の予定で,当初のピーク演算性能は60PFlopsとのことです。これを4つのシステムに分け,それぞれのシステムは15PFlops程度の性能とのことです。天気予報は止まっては困るので,同じシステムを2重化して使うのが普通で,そのため,システムを分割していると思われます。

  このシステムは2030年まで使用する予定で,最終的には当初の4倍の性能に引き上げる予定とのことです。

  Azureですから,クラウドでSupercomputer-as-a-service的な使い方ができるようになるのだそうです。このような基幹的な天気予報システムがクラウドになるのは例がなく,問題なく動くのかどうか多少,気になります。また,これがうまく行ったら他の気象庁にもクラウドが増えるのかも気になるところです。




inserted by FC2 system