最近の話題 2017年5月20日

1.Googleが第二世代のTPUを発表

  2017年5月17日のEE Timesが,Google IOにおける第二世代のCloud TPUの発表を報じています。初代はINT8演算で推論用に限定されていましたが,第二世代は学習にも使えるとのことです。4個のLSIを搭載するボードの性能は180TFlopsと発表されています。

  単位にFlopsを使っているので,浮動小数点演算になったことは確かですが,精度は発表されていません。まあ,NVIDIAのV100のTensorコアと同じFP16ではないかと思われます。4個で180TFlopsですから,1個当たりでは45TFlopsで,V100の120TFlopsには及びません。

  公開された写真では,ボードには大きなフィンを付けたCloud TPUが4個搭載されています。フィンの大きさから見て100W級の発熱ではないかと思われます。TPU1ではボード上にあったDRAMが無く,TPU1の論文で最大の性能改善項目と書かれていたHBMを採用しているのではないかと思われます。

  そして,このボードを2次元トーラスで接続し,ポッドとよぶ単位を構成します。ポッドは最低64ボードで,11.5PFlopsとのことで,計算は合います。そして,記事には,このポッドの写真が掲載されています。一つのラックに8段×4枚で,2ラックで1ポッドを構成しているようです。

  Cloud TPUのボードは,前後の辺に4個づつのコネクタがあり,これで2次元トーラス接続を行っていると思われます。Cloud TPUのラックの左右には別のラックがあり,間に8本のケーブルが接続されており,トーラスの外側から,ストレージへの接続が行われていると思われます。また,ノードの1辺に2個の幅広のコネクタがあり,ここにはM.2SSDが刺さるのではないかと思われます。Cloud TPUのボードにはCPUのようなものは無く,どのようにして制御を行っているのかは不明です。

  Googleは,Google Cloudで1000台のCloud TPUシステムを提供し,研究成果をオープンに公開し,オープンソース化を考える研究者には無償で使わせるとのことです。

  なお,Google IOの基調講演でSundar Pichai CEOは,Googleはmobile-firstからAI-firstに変わる。クラウドTPUは将来のデータセンタアーキテクチャの鍵となると述べています。

2.Samsungがファウンドリ部門を分社か

  2017年5月16日のEE Timesが,Koria Economic Daily誌び報道をひいて,Samsungがファウンドリ部門をシステムLSI部門から切り離すことを計画していると報じています。

  Samsungはスマホではトップグループのメーカーで,それがAppleがSamsungからTSMCに注文を移した理由と言われるように,特に,Samsungと競合する製品のメーカーはSamsungのファブの使用に懸念をもっています。

  ファブを分社化すると,このような競合の懸念が減ります。そしてSamsungは16nm世代では6か月,10nm世代でも3か月TSMCに先行しているという技術的優位があり,アナリストのAndrew Lu氏は,Samsungのファブのシェアが毎年2%上がると見ています。それに対して,TSMCは顧客を取られて毎年1%シェアが下がると見ています。

  最も大きな影響を受けるのは,互換性の高いプロセスを提供しているGlobal Foundriesと見ています。

3.AMDが16コアRyzen Threadripperを発表

  2017年5月17日のThe Inquirerが,Analyst DayでのAMDの16コアRyzenの発表を報じています。現在のRyzen 7は8コア16スレッドですが,Ryzen Threadripperと呼ぶ新チップは16コア,32スレッドです。発売時期は,今年の夏となっています。

  これはIntelが今月末に発表を計画していると言われるCore i9の12コア,24スレッドを上回る規模で,2週間先行してRyzen Threadripperを発表することでIntelの出鼻を挫こうという作戦です。また,Threadripperは64コアまでスケールすると書かれており,4チップのシステムが組める仕掛けがあるのかも知れません。

  また,AMDはRyzen CPUコアとVega GPUを組み合わせたラップトップ向けのチップも年内に出すとのことです。当然,クリスマス商戦に間に合わせようという作戦です。

  なお,Threadripperも,次の話題のEPYCと同様,8コアチップ2個で作られているという観測があります。

4.AMDが32コアのサーバ用プロセサEPYCとサーバプロセサのロードマップを発表

  2017年5月17日のSemiaccurateが,Analyst DayでのAMDのEPYCの発表を報じています。これはNaplesのコードネームで開発されていたものです。

  32コアですが,これは8コアのZeppelinチップ4個をマルチチップパッケージに搭載して実現されています。製造コストはシングルチップより高そうで,競合するIntelのチップより安いのが売りですから,厳しいビジネスです。

  EPYCは32コア,メモリチャネルは8チャネル,PCI Expressを128レーン持ち,IOなどを接続するチップセットも内蔵しています。Zeppelinチップ間はInfinity Fabricと呼ぶHyperTransportを拡張したファブリックで接続されています。と最初のスライドには書かれているのですが,後のスライドを見ると,メモリチャネル数とPCI Expressのレーン数は,EPYCの2ソケットシステムのものの様にも思えます。

  このInfinity Fabricはソケット間の接続もでき,より大きなシステムを作ることができます。Vega GPUもInfinity Fabricを使っているので,GPUもコヒーレントに接続できるという絵になっています。

  2個のEPYCを接続すると,Intelより45%コア数が多く,メモリバンド幅は122%増し,PCIeレーン数は60%増しと言っています。

  AMDは7nmプロセスを使うZen 2,7nm+プロセスを使うZen 3を開発するというロードマップを発表しました。Zenが2017年に始まり,Zen3が2020年に終わりという絵なので4年で3世代と書かれていますが,はっきりした時期は発表されていません。

  そして,今回,ZenベースのEPYCが発表されたのですが,Zen 2ベースはRome,Zen 3ベースはMilanというコード名で後継のサーバ用プロセサを開発するとのことです。 

5.HPEが160TBメモリを持つThe Machineのプロトタイプを発表

  2017年5月17日のThe Inquirerが,HPEのThe Machineプロジェクトの進捗状況の発表を報じています。

  今回のThe Machineは160TBのメモリを中心にして,40台のCavium Thunder X2プロセサのノードを接続しています。元々はMemristerメモリを使おうという事であったのですが,まだ,実用レベルに達しないので,今回はDRAMを使っています。160TBは8GB DIMMで2万枚です。

  具体的に,このような処理をして,この程度の性能が得られたというような話は,報道には書かれていません。コンセプトは分からないではありませんが,やはり,実績がでてこないとなかなか信じて貰えないのではないかと思います。

6.ImaginationがIMGworks部門を売却

  2017年5月19日のEE Timesが,Imagination Technology Groupが,SoCの設計サービスを行っているIMGworksという部門をSondrelという会社に売却すると報じています。

  SondrelもLSIの設計サービスを提供する会社で,どちらも英国にある会社です。売却額は公開されておらず,AppleからPowerVR GPUのライセンス打ち切り通告を受けたImaginationの苦境に,どの程度役に立つかは分かりません。

  GPUはディープラーニングを含めて,需要が増えており,LSIのデザインサービスを提供するSondrelは,GPUに関連するIMGwroksの経験に魅力を感じているとのことです。

7.ロボット副操縦士の方が安上がりかも

  2017年5月17日のThe Inquirerが,ロボット副操縦士の方が安上がりかもという記事を掲載しています。Aurora Flight Sciences社がB737をロボットが操縦して,着陸に成功したと発表したとのことです。

  これらの旅客機が自動操縦で着陸するのは珍しくないのですが,副操縦士席に座ったロボットが着陸に成功したのは初めてとのことです。

  現在のオートパイロットシステムに自動着陸機能を組み込むのは大変で,クルーとも音声でやり取りできるロボット副操縦士を搭乗させる方が安上がりではないかとのことです。

  となると副操縦士という仕事はロボットに替わり,残るのは最終責任者の機長と,接客スタッフという事になるかも知れません。そして,格安航空では接客もロボットになり,乗務している人間は機長だけということになるのでしょうか?

8.IBMが17Qubitの量子プロセサの試作に成功

  手術2017年5月19日のThe Inquirerが,IBMが17Qubitの量子コンピュータの試作に成功したと報じています。16Qubitの量子コンピュータも動作するものが得られ,こちらはGithubからアクセスできるとのことです。

  17Qubitの量子コンピュータもIBMクラウド経由でアクセスできるプログラムが行われるとのことです。

  3月11日の話題で紹介した5Qubitから,大幅な進歩で,50Qubitという目標は比較的短期間で実現できるのではないかと期待されます。

9.しばらくお休みをさせていただきます

  手術のため入院することになりました。そのため,3週間ほどお休みをさせて戴きます。




inserted by FC2 system