最近の話題 2020年2月29日

1.ISSCCのプレナリでGoogleがAIを使った配置配線を発表

  2020年2月26日のEE TimesがISSCCのプレナリセッションでのGoogleのJeff Dean氏の配置配線についての発表を報じています。

  Googleはマシンラーニングを使ってゲームなどを人間のプレイヤーよりうまくプレイできることを示したのですが,今回の発表は,LSIの配置配線をマシンラーニングにやらせ,人間のエキスパートより良い結果を出すことができたというものです。

  今回の結果がすごいのは,LSIの配置配線は囲碁などと比べても圧倒的に規模が大きい問題で,かつ,一つのモデルで,何種類ものブロックの配置配線をうまく行うことができているという点です。

  低電力の,MLアクセラレータの配置配線では,人間のエキスパートの設計に比べて配線の混雑度は20.2%小さく,配線長は26.7%短くなったとのことです。もっとも,人間のレイアウトは細長い形の領域になっているのに対してML配置配線の方は円に近い形になっており,配線ができれば,MLの方が配線長は短くなりそうで,なぜエキスパートが細長い領域を選んだのか私には理解できません。

  また,GoogleのTPUの中の4つのブロックとGitHubに公開されているAriane RISC-V CPUの配置配線を行い,市販の配置配線ツールとGoogleのML配置配線ツールの配線長コストを比較しています。無関係なブロックを学習した状態(ゼロショットと呼ぶ)から,それぞれのブロックに対して12時間のファインチューンを行った結果を示していますが,配線長コストは市販ツールと比べて10%から20%程度小さくなっています。

2.ISSCCのプロセサセッションでAMDが2つの論文を発表

  2020年2月24日のEE TimesがISSCCのプロセサセッションでのAMDのZen2とEPYC発表を報じています。ISSCCは回路の学会なので,今回の発表は,回路関係の話が中心になっています。

  Zen2とEPYCは,CPUコアを集積した1個以上のチップと1個のI/Oチップで構成されています。CCXと呼ぶCPUチップレットはTSMCの7nm FinFETプロセスで作られ,IOチップレットはGlobal Foundriesの12nmプロセスで作られています。

  CCXは4個あるいは8個のCPUコアとL2,L3キャッシュを集積しています。CCXは,前世代のチップレットでは44mm2であったのに対して今回の7nmチップレットでは31.3mm2になっています。前世代は10.5トラックの論理回路を使っていましたが,今回は6トラックの高密度の論理回路を使っています。そして,前世代と比べて組み合わせ論理回路に使う電力を3%増やして,論理回路の遅延を減らし,クロックを4.7GHzまで引き上げています。

  2番目の論文は,今回のEPYCの構造の発表です。今回はIOチップレットと8個の8コア搭載CCXで最大64コアのパッケージとなっています。今回のIOチップレットを使う構造は平均的なメモリレーテンシは改善しているのですが,ベストケースの場合でもCPU-I/Oチップ―メモリという経路になるので,レーテンシが長くなります。このため,AMDはベストケースのレーテンシ短縮に努力し,チップ経由が1回増えているのですが,レーテンシの増加を4nsに抑えています。

  そして,電源電流が増加した時のドループを抑えるため,電流シャントを備えているとのことです。

3.Microsoftが,AzureでAMDのEpycを使うHBv2インスタンスの正式提供を開始

  2020年2月27日のHPCWireが,マイクロソフトのAzureでのAMDのEpyc 7002シリーズCPUコアを使うHBv2インスタンスの正式提供の開始を報じています。

  インスタンスは3.3GHzクロックのEpyc 7002 コアを120個備え,メモリは480GB持っています。メモリバンド幅は340GB/sとなっています。そしてHBv2はMPIで80,000コアまでスケールするとのことです。ネットワークはMellanoxのHDR IBで,200Gbit/sの通信速度でレーテンシは1.5usとなっています。

  ピーク演算性能は倍精度浮動小数点演算で4TFlopsとのことです。

  お値段は,レギュラーなインスタンスは$3.96/Hrで,優先度が低いインスタンスでは$0.901/Hrという安いものもあります。

4.先週のNOAAのスパコンのフォローアップ

  2020年2月24日のHPCWireが,先週の記事のフォローアップを載せています。このシステムはHPE CrayのShastaスパコンで,2021年2月から2022年2月の間に現在のスパコンから切り替えるとのことです。

  一つのShastaシステムは,10個のキャビネットに収容された2560のデュアルソケットノードからなっています。CPUはAMDのEpyc 7742 を使っており,ピーク性能は12PFlopsとなっています。ネットワークはCrayのSlingshot です。1システムのメモリ容量は1.3PBで,26PbのCRAYのClusterStorが付いています。

5.ローレンスリバモア国立研究所のSequoiaスパコンが退役

  2020年2月27日のHPCWireが,2012年6月のTop500で1位となったローレンスリバモア国立研究所のSequoiaスパコンの退役を報じています。SequoiaはBlue Gene/Qを使うスパコンで2012年6月に日本の京コンピュータを抜いて1位になりました。

  BG/Qを1,572,864コア使い,17.1732PFlopsのHPL性能を持っていました。

  2019年11月のランキングでは12位で,退役することになりました。

inserted by FC2 system