最近の話題 2018年6月2日

1.ARMがSkylake対抗のハイエンドコアを発表

  2018年5月31日のEE TimesがARMのハイエンドコアの発表を報じています。Cortex-A76 CPU,Mali G76 GPU,V76ビデオコアは新設計のハイエンドコアで,Intelのモバイル版のSkylakeと比較して,SPEC性能で10%以内に収まる性能を持つとのことです。A76を使うノートPCは,Intel CPUを使うノートPCとほぼ同等の性能を,1/4のチップ面積と半分の消費電力で実現できえるとのことです。

  また,10nmプロセスのCortex-A72コアと比べると,7nmプロセスで製造されるA76は,35%高い性能,あるいは40%低い消費電力となると見込まれます。

  A76のブロック図が乗っていますが,それによると,命令フェッチやデコードは4命令/サイクルで,毎サイクル,最大8個のuOPを発行することができます。A72の命令フェッチやデコードは3命令/サイクルだったと思いますので,命令発行バンド幅が上がっています。

  また,整数系は2つのALUと1つのMAC/ALU/DIVとBranch実行ユニットを持ち,最大4命令を処理できます。FP系は,16B幅のASIMD/FPがデュアル発行と書かれており,128bit幅の演算器を2系統持っています。Load/Store系は2-LS+1-STと2つのLoadと1つのStoreでしょうか?

  G76 GPUはBifrostアーキテクチャのハイエンドGPUで,7nmのG76は,10nmのG72と比較すると,全体的にみて50%性能がアップしているとのことです。G76は最大20個のシェーダコアを搭載することができ,L2キャッシュは512KBから最大4MBまで選択が可能となっています。

  そして,記事にはA73,A75と今回のA76のSPECintSPECfp,GeekBench,Javascript,LMBench memory,低精度GEMMの性能比較の棒グラフが載っています。最初の4つのベンチマークではA76はA73の1.56倍~1.79倍といったところですが,LMBench memoryでは2.44倍,低精度GEMMでは9.7倍となっており,Deep Learning演算性能を強化していると見られます。

  Intelと比較して消費電力が半分で,ほぼ同じ性能でARMベースのノートPCが売れるかというと,懐疑的な見方をするアナリストが多いようです。一方,スマホのハイエンド機向けには必要と見られています。 

2.Cortex-A76のカーネルモードは64bitオンリー

  2018年5月31日のThe RegisterがARMのA76は,カーネルモードでは64bitアーキテクチャしかサポートしないと報じています。従来のプログラムを実行する必要があるので,ユーザモードでは32bitアーキテクチャの命令と64bitアーキテクチャの命令の両方をサポートします。

  カーネルモードで走るのはOSやドライバなどで,Androidなどは64bitアーキテクチャオンリーへの対応は済んでいるとのことで,大きな問題にはならないようです。一方,32bitアーキテクチャのアプリは山とあるので,完全64bit化は大変で時間が掛かるとのことです。

  ユーザモードよりもカーネルモードの方が機能が多く,動作も複雑なので,カーネルモードでは32bitアーキテクチャをサポートしなくて済むのは,設計者や動作を顕彰するエンジニアにとってはかなりの仕事の削減につながります。また,機構が簡単になるので,多少は,消費電力も減らせる可能性があります。

  なお,A76コアのブロック図については,このThe Registerの記事の方が,先に上げたEE Timesの記事より詳しいです 

3.CISCOがAMDのEPYCベースのサーバを発売

  2018年5月31日のThe RegisterがCISCOのEPYCベースのUCSサーバの発売を報じています。CISCOは元々はネットワークの大手の会社ですが,UCSシリーズというサーバも開発,製造して販売しています。GoogleやFacebook,Microsoftなどの巨大クラウドはサーバを自社仕様で開発してしまいますが,中小のクラウドではHPE,Dell/EMSやCiscoのサーバを購入します。

  従って,CiscoがEPYCサーバをUCSのラインナップに採用したことは,同じ領域のサーバを供給するHPEやDellとの競合だけでなく,データセンタのコストの点で,Google,Facebook,Microsoftのサーバの選択にも影響する可能性があります。

  このCiscoのC125 M5サーバは2Uシャシーに挿入できるハーフ幅のサーバで,2UのUCS4200シャシーに最大4サーバ収容できます。また,4台のサーバに加えて24台のディスクドライブも収容できます。

  C125 M5サーバは,最大2個のEPYC 7000 CPUを搭載でき,1台のサーバの最大,搭載コア数は64,UCS4200シャシーには最大256コアが搭載できます。

  メモリは,EPYC 7000 CPUあたり8枚のDDR4 DIMMを搭載できます。128GB DIMMを使えば,最大8TBのメモリを搭載できます。そして,サーバあたり,前面側から6台のSAS/SATAドライブを接続できます。また,OCP20準拠のメザニーカードを経由して10/25/40/100Gbpsのネットワークインターフェースが使えます。

  Ciscoとしては,コアあたりのコストが安いこと,消費電力が低いこと,そして,メモリの暗号化が行えることなどが利点と考えているとのことです。

4.NVIDIAがデータセンタ向けのHGX-2を発表

  NVIDIAはV100 GPUを16個搭載し,NVSwitchで結合するDGX-2を昨年のGTCで発表し,既に出荷していますが,今回の台湾GTCでデータセンタk向けのHGX-2を発表しました。

  HGX-2はサーバのスキンが無く,冷却ファンが無いように見えますが,16個のV100 GPUと12個のNVSwitchチップが搭載されている部分はDGX-2と同じであるように見えます。HGX-2はDGX-2と中身は同じですが,冷却はデータセンタ全体の冷却を利用するというように変更したデータセンタ向けの製品と思われます。

  また,HGX-2はある意味,部品であり,全体のシステムとしてはDGX-2と同じようなものを作っても良いし,例えば,CPUの構成が違うものを作っても良く,さらに,HGX-2をNVLink2で結合して,さらに大きなシステムを作ることもできます。そして,8個のGPUだけでGPUボードが1枚という低価格のシステムを作ることもできます。

5.Appleがオレゴンに秘密の研究所を開設

  2018年5月31日のThe Inquirerが,AppleがIntelから3んジニアうぃ引き抜き,既に20人あまりのエンジニアを集めて秘密の研究所を設立していると報じています。研究所が作られたのはポートランドの西のBeavertonとHilsboroの間とのことで,ここにはIntelの工場があります。

  先月,この動きを報じたBloombergはARMベースのMacBook Proを開発していると書いています。また,MacBook Pro派生のARMベースのタッチスクリーンのガジェットを開発しているという話もあります。このデバイスは,SIMカードスロット,GPSを装備し,防水機能を持つデバイスだそうです。

inserted by FC2 system