最近の話題 2018年12月15日

1.Intelが3D実装技術Froverosを発表

  2018年12月12日のEE Timesが,Intelの新3D実装技術の発表を報じています。現在はインタポーザに複数のチップを載せる実装は,CPU,GPUのロジックとメモリは異なる場所に置かれていて重なっておらず,3D実装とは言えません。

  Foverosは,CPUチップとI/OなどのチップをDace to Faceでマイクロバンプで接続し,I/Oなどを搭載するベースダイはTSVでパッケージ基板に接続します。このTSVとバンプで,I/Oの信号や電源,GNDを接続します。そして,大容量のLPDDRメモリなどをPoPでその上に載せるという図が載っています。

  CPUは10nmプロセス,ベースダイは22nmプロセスで,その上のPoPのDRAMを含んで12×12×1mmに収まり,スタンバイ状態の消費電力は2mWとのことです。

  CPUの放熱パスが多少気になりますが,もともと発熱が小さいので問題にならないのかもしれません。

  また,Intelは次世代のプロセサのマイクロアーキのコードネームはSunny Coveで,IPCが改善され,汎用処理を行う場合の電力効率が改善されているとのことです。また,AIや暗号化などの性能を改善するアクセラレータが含まれるとのことです。

  そして,バッファやキャッシュを増加しデータセントリックな処理に最適化したと述べられています。

  Sunny CoveアーキのXeonやCoreプロセサが出てくるのは2019年の遅い時期となるとのことです。このプロセサではXeと呼ばれる新アーキテクチャのGen 11の組み込みグラフィックスも搭載されるとのことです。そしてXeアーキのグラフィックスコアはディスクリートのGPUにも使われるとのことです。

2.QualcommがSnapdragon 855を発表

  2018年12月7日のEE Timesが,QualcommのSnapdragon 855の発表を報じています。

  855は7nmプロセスで作られ45%の性能アップ,5Gをサポートするというのがウリです。

  通信関係では,5GをサポートするX50モデムを搭載します。また,現在のX24 Category 20 LTEモデムを搭載し,7xのキャリアアグリゲーションをサポートしています。WiFiは60GHzの802.11ayと標準化前の802.11axをサポートします。これらは10Gbit/sの通信速度をもっています。

  プロセサは7nmプロセスで作られ,従来の10nmの845と比較して45%の性能アップとのことです。しかし,10nmプロセスと比べて,プロセスによる性能アップは殆どないと見られ,設計だけでこの性能アップを実現したとすれば大したものです。8個のarmコアを搭載していますが,A76プライムコア1個とA55パフォーマンスコア3個,エフィシェンシーコア4個という内訳です。クロックは,プライムコアは2.84GHz,パフォーマンスコアは2.42GHz,エフィシェンシーコアは1.8GHzとなっています。

  コアグループの種別ごとにクロックは変えられますがmプライムコアとパフォーマンスコアの電源は共通になっています。

  GPUブロックのALUを50%増加,DSPのベクタ拡張を4倍に増加,DSP制御の新Tensorコアを追加,AlexaやCortanaをサポートするためDSPに音声処理ブロックを追加,CPUに内積計算命令を追加,8%bit整数の演算を追加して,推論性能を向上しています。整数のTensor演算は7TOPS以上の性能とのことです。

  これらの強化で,AI性能は845と比較して3倍に向上し,他社の7nm Androidと比べて2倍の性能という比較の棒グラフが載っています。

  その他に,イメージプロセサにComputer visionのパイプラインを追加,4Kビデオのサポート,H.265/VP9コーデックのハードウェア性能の向上,Vulkan 1.1とHDR 10+などのサポートも加わっています。

3.IEDMでIntelとSamsungが組み込みMRAMを発表

  2018年12月11日のEE Timesが,San Franciscoで開催されたIEDMでIntelとSamsungが組み込みMRAMを発表したと報じています。

  intelは22FFLプロセスにSTT MRAMを組み込み,Samsungh28nmのFDSOIプロセスにSTT MRAMを組み込んでいます。Intelの22FFLはFinFETプロセスで,FinETにMRAMが組み込まれたのは,これが初めてです。

  Global Foundriesは昨年から22FDXプロセスにMRAMを組み込んでいますが,あるアナリストは,使っているところは聞いたことがないとのことです。MRAMは磁性材料を使う必要があり,プロセスのコストが高いとみられ,これが採用へのブレーキになっている可能性があり,Intel,Samsungがどのような値段をつけるかが注目されます。

  IntelのMRAMは200℃で10年の保持時間を持ち,106回の書き換え寿命を持つとのことです。セルサイズは216×225㎜(nmの誤記か?)となっています。

  Samsungの方も,10年の保持,106回の書き換え寿命とのことです。Sansungは最初はIoTなどに使う予定で,自動車や産業用に使うには,もっと,信頼性を改善する必要があると述べています。

4.AIの研究では欧米が先行,中国が猛追

  2018年12月13日のThe Registerが,AIの研究論文の発表では,欧米が先行し,中国が猛追していると報じています。

  Scopusの論文の内の28%がヨーロッパの論文で,中国が25%,米国が17%とのことです。米国は論文数は少ないのですが,欧州や中国の論文と比べると参照数の多い,重要な論文が多く,平均参照数が2弱となっています。これに対して,ヨーロッパの論文は1.5を下回り,中国は1998年には0.5だったのが2016年にはほぼ1になったとのことです。

  中国のAI研究者はエンジニアリング,テクノロジ,農業科学に興味があり,欧米では人間性,医療,健康科学などに興味が移っていると分析しています。

  また,民間と政府の資金による研究の比率を見ると,中国では国の研究費による論文の比率が,米国の場合の6.6倍となっています。中国では,国の資金による研究が2009年に比べて倍増していますが,民間の研究は1.7倍で,国の方が高い伸びを示しています。

  米国で民間の研究が多いのは,Amazonが$16.1B,Alphabetが$13.6Bというように,大手のIT企業が大量の開発費をつぎ込んでいることが効いています。

5.MLPerfの6種のベンチマークでNVidiaが1位を獲得

  2018年12月12日のHPC Wireが,AI性能のベンチマークであるMLPerf v0.5の6つのベンチマークの測定でNVIDIAが1位を獲得したと報じています。MLPerf v0.5にはイメージの分類,オブジェクト検出,翻訳など7種のベンチマークが含まれているのですが,そのうちの6つのベンチマークでNVIDIAが1位を獲得しました。なお,7番目のNeural Collaborative Filteringというベンチマークは,まだ,GPU向きの最適化ができていないということで,NVIDIAは性能を提出していません。

  https://mlperf.org/results/ に結果が公表されていますが,イメージ分類でいうと,1位のNVIDIAは80台のDGX-1を使って1424.4という成績ですが,240台のTPUを使うGoogleのシステムは1243.8で,LSIあたりの性能ではV100よりもTPUの方が高いという計算になります。

  Top500と同じように,ハードの物量とは関係なく,実現した性能だけでランクキングされています。



inserted by FC2 system