最近の話題 2020年2月1日

1.IBMのRometty CEO&Presidentが退任し,Arvind Krishnan SVPがCEOに昇格

  2020年1月30日のThe RegisterがIBMのCEOの突然の交代の発表を報じています。現在のCEO&PresidentはVirginia Rometty氏ですが,Rometty氏は4月6日にCEOを退任し,Arvind Krishnan SVPがCEOとなり,元Red HatのCEOで,買収に伴いIBMのSVPとなったJames Whitehurst氏がPresidentとなると発表されました。

  Rometty氏がCEOになって以来,S&P 500の株価は160%,NASDAQ Compositの株価は257%上がったのに対してIBMの株価は約26%値下がりしました。そして,2018年の1月に増収を発表するまでの連続22四半期は減収が続きました。また,決算を改善するため,大量のレイオフを行いました。ということで,Rometty氏の退任の発表を歓迎して,取引時間後にIBMの株価は約6%上がったとのことです。

  次期CEOとなるArvind Krishnan氏は,Red Hatの買収を担当し,現在はCloudやCognitive Software,量子コンピューティングなどを担当しています。Krishnan氏はインドのIITの卒業生で,理系のCEOです。

2.IBMがデータ管理とAI推論用のIC922サーバを発売

  2020年1月28日のHPC Wireが,IBMのIC922サーバの発売を報じています。このサーバはSummitスパコンに使われているAC922サーバの姉妹サーバで,2Uの筐体に2個のPOWER9 CPUが入っています。そして,AC922は3個のVolta GPUが付いていますが,IC922は8個のT4 GPUが付いています。

  そしてIC922には最大24台のSFFドライブが付き,大量のデータを扱えるようになっています。また,AC922のVolta GPUは専用のNVLINKでPower9に接続されていますが,IC922のT4 GPUは標準のPCI Express 4.0で接続されます。

  IC922はデータの前処理に力を発揮し,前処理を終わったデータを使って,AC922のVolta GPUでAIの学習を行い,学習結果を使ってIC922のT4 GPUのTensorコアを使って推論を行うという使い方が示されています。

  また,アクセラレータとしてはGPUだけでなく,FPGAや他のASICを接続することも考えられているようです。

3.IBMがDoD向けのコンテナ型のスパコンを開発

  2020年1月29日のEE Timesが,IBMが国防総省向けに開発したコンテナ型のスパコンについて報じています。この戦術用スパコンはコンピュート用に22台のAC922サーバを持ち,推論用に128台のIC922サーバを使っています。

  AC922は2個のPower9 CPUを持ち,それぞれが3個のV100 GPUに繋がっているので,全体では132個のV100 GPUを含んでいます。そして,IC922も2個のPower9CPUを持ち,それぞれのPower9に6個のT4 GPUを接続しているので,全部で1536個のT4 GPUを含んでおり,学習,推論ともにかなり強力な機械学習スパコンです。

  コンテナには水冷のためのチラー,無停電電源,耐火システムなどを備えているそうです。記事では言及は有りませんが,耐火に加えて耐震も必要で,普通のデータセンター用とは異なるサーバを使っていると思われます。

  データセンターへの5Gなどの接続なしに強力なAI処理を実行する必要がある用途向けのスパコンで,艦船や潜水艦などに搭載されるのではないかと思われます。

  このコンテナスパコンは,既に動作しており,近いうちに正式に発売されるとのことです。

4.Mellanoxのインネットワーキングコンピューティング

  2020年1月27日のHPC Wireが,InfiniBandのインネットワーキングコンピューティングに関する記事を載せています。InfiniBandの伝送バンド幅は順調に増えており,最新のHDR規格では4レーンで200GB/sの伝送ができます。しかし,データが届くまでのレーテンシは,バンド幅の増大ほど性能向上ができていません。

  このため,InfiniBandの主要機器メーカーのMellanoxはパケットがCPUに到着してから処理を始めるのではなく,ネットワーク内を移動している間に処理を行うインネットワーキングコンピューティング機能の開発に力を入れています。

  MPIには,全ノードの持っているデータを集めて,例えば合計をとり,その結果を全ノードに通知するAllReduceという機能がありますが,CPUで処理する場合はノード数が多いと時間が掛ります。そこで,MellanoxはHDRで,ネットワークインタフェースの部分で合計の計算を行わせるSHARPという機構を追加しました。

  これにより,1500ノードの256バイトのデータをAllReduceする場合のレーテンシを1/7に短縮しています。また,翻訳のGNMTというMLPerfのベンチマークでは,SHARPの使用でスループットが18%向上し,Variable Auto Encoderでも18%スループットが上がったとのことです。

  もう一つの改善はMPI_Iscattervコールの改善で,Iscattervは非同期に,ソースのノードからそれぞれのノードに指定されたバイト数のデータをばらまく処理で,個々の伝送の順序を最適化して無駄を減らすことで性能を改善しています。256ノードの処理では,メッセージサイズが64KB以下の場合は大差ありませんが,メッセージが1MBになると,標準では20%くらいしかオーバラップができませんが,ハードウェアサポートを使うと,ほぼ100%のオーバラップができるとこことです。

5.ECMWFが次期スパコンをAtosから調達

  2020年1月15日のHPC Wireが,ヨーロッパの中央気象庁(European Centre for MidiumRange Weather Forecast)の次期スパコンを$89MでAtosから調達する契約を結んだと報じています。

  Atosはフランスの大手メーカーで,次期システムはAtosのBullSequana XH2000サーバをHDR Infinibandで接続するシステムです。そして,使用するCPUはAMDのEPYC 7742(64コア,2.25GHz)です。そしてストレージはDDN製です。

  ECMWFは一時,富士通のVPP5000が取ったのですが,その後はIBM,最近はCrayが世界中の気象予報システムを独占する状態が続いていましたが,ヨーロッパの次期システムはフランスのAtosということになりました。

inserted by FC2 system