最近の話題 2018年9月22日

1.SC18でのGordon Bell賞のファイナリストが決定

  2018年9月20日のHPC Wiresが,2018年のGordon Bell賞のファイナリスト(最終候補)が決まったと報じています。6件のファイナリストの論文の内の5件はTop500の1位になったSummitを使った研究の論文だそうです。そして,もう1件のファイナリストは巨大なグラフの処理を行う中国の論文です。

  米国の5件の内の,最初の1件は,ORNLの論文で遺伝子を比較する研究でV100 GPUの混合精度の計算を有効に使って2.36EOp/sの性能を達成しています。2件目は東大の市村准教授のチームの地震シミュレーション,3件目は,LBNLのチームの気象シミュレーションの結果からディープラーニングを使って異常気象になるパターンを見つけ出すという研究です。これもV100 GPUのTensorコアを使っており,1.13EOp/sの性能を出しています。

  4件目もディープラーニングを使っており,電子顕微鏡の画像から物質の原子レベルの構造を自動的に見つけ出すプログラムを生成するというORNLチームの研究です。5件目は,LBNLとLLNLのチームの中性子の寿命を計算するという研究です。

  HPC計算でも,ディープラーニングを使って見込みのありそうなケースに絞り込んで,それを詳しく解析するというアプローチが増えています。

2.Cadenceが8TMAC/sのDNA 100 AIコアを発表

  2018年9月19日のEE Timesが,Cadenceが4000個のMAC演算器を集積するTensilica DNA 100 AIコアを発表したと報じています。使用する半導体プロセスは16nmで,ResNet-50の場合,2550FPSの性能を持ち,3.4TMAC/s/Wの電力効率を持つとのことです。DNA 100は1GHzクロックで8TMAC/sの性能をもっています。そして,重みや入力が疎な場合にも対応できると書かれていますが,詳細は不明です。

  DNA 100はネットワークの枝刈り機能を備えており,実質的には12TMAC/s程度の性能を持つと書かれています。1MACが積和演算とすると,8TMAC/sは16TOps/sで,これはかなりの性能で,ARMのMLコアは4.6TOps/sですから,これを大きく上回る性能です。ただし,この場合のDNA 100のチップ面積や電力がどの程度になるのかは公表されていません。

  CadenceのDNA 100 IPは一部の先行顧客には12月に提供が開始され,一般ユーザが使えるようになるのは来年4月からとのことです。

3.AmpareがARMサーバチップをLenovoに出荷

  2018年9月19日のEE Timesが,AmpareがARMサーバチップの出荷を始めたと報じています。Ampareは,元Intel CEOのRenee James氏が興した会社で,ARM v8AアーキテクチャのサーバCPUを開発しています。ARMのサーバ用CPUとしては,CaviumとQualcommがやっており,CaviumのThunder X2はCaryやHPEのHPCサーバに採用されています。また,QualcommもCentriq 2400も2017年11月から出荷を始めています。

  しかし,CaviumはMarvelに買収され,Marvelはネットワーク関係に力を入れていてARMサーバのビジネスにはあまり関心が無く,プロセサビジネスの先行きがどうなるのか懸念される状況です。また,QualcommもARMサーバのビジネスは縮小傾向です。

  こうなると,American Micro(AMCC)のX-Geneの技術と開発者を受け継いだAmpareがARMサーバの期待を一手に引き受ける感じになっています。

  そのAmpareがeMAG 8180という名前の32コアARMプロセサチップを発表しました。先週,同社のチップがバリデーションやテストをパスし,性能要件も満足したとのことです。

  eMAG8180はターボ時3.3GHzクロックのARM v8Aコアを32コア,DDR4-2667インタフェースを8チャネル,I/OとしてはPCIe3.0を42レーン,SATA3.0を4チャネル,USB2.0を2チャネル搭載しています。そして,セキュアブートやマネジメント用のプロセサを備えています。

  使っている半導体プロセスはTSMCの16nmで,TDPは125Wとなっています。

  IntelのXeon Gold 6130は16コアで,ベースクロック2.1GHz,ターボ時3,7GHz,TDPは125Wで,メモリは6チャネル,PCIeは48レーンで,$1900ですが,Ampareの8130は$850と半値以下だそうです。eMAG8130を搭載したサーバは現在でもLenovoから買えるそうです。

  値段が安いのは大きなメリットですが,データセンタでサーバハードのコストは,機器の選択にもよりますが,半分程度で,電気代やその他のコストも大きいので,それだけでは決め手にはなりません。

4.スタートアップのHabanaのディープラーニングアクセラレータがCPU,GPUを負かした

  2018年9月17日のEE Timesが,スタートアップのHabanaという会社のDLチップが,推論のジョブでGPUやGPUを負かしたと報じています。EE Timesによると,HabanaはAmazonと関係があるとのことで,AmazonがAWSで使うとなればAIスタートアップの勢力図が変わるかもしれません。

  Goyaという名前のHabanaのチップは16nmプロセスで作られており,ResNet-50でバッチサイズ10で遅延1.3msで15,000イメージ/秒の処理ができるとのことです。この時の消費電力は100Wです。これはNVIDIAのV100が2657イメージ/秒,デュアルソケットのXeon 8180が1225イメージ/秒に比べて大幅に高い性能です。しかし,Goyaは32bitから8bit長のINTとFPを扱えると書かれており,処理の精度や枝刈り,コンパイラの最適化がどうなっているかなどの条件が不明で,公平な比較かどうか分かりません。しかし,相当な高性能で,データセンター向けの推論チップであることは間違いありません。

  Goyaチップは8個のVLIWコアを持ち,C言語でプログラムができるそうですが,VLIWコアの積和乗算器の数など中身についての情報は,殆ど公表されていません。公表されているのは,チップのTDPが200Wでパッケージは42.5mm角で,x16のPCIe4.0ポートとDDR4チャネルを持つということくらいです。

  Habanaは2019年Q2には学習に使えるGaudiチップのサンプル出荷を開始する予定です。このチップは,数千個のGaudiチップのクラスタを作るための2T-bit/sのインタフェースをサポートするとのことです。

5.米国の下院が量子コンピューティングの開発に$1.275Bをつぎ込む法案を可決

  2018年9月17日のHPC Wireが,米国の下院が量子コンピュータの開発に5年間で合計$1.275Bをつぎ込む法案を可決したと報じています。ただし,本決まりになるには上院でも可決されることが必要です。

  $1.275Bですが,NISTの活動やワークショップに$400M(2019-2023に毎年$80M),NSFのMultidisciplinary Centers for Quantum Research and Educationに$250M,エネルギー省のResearch and National Quantum Information Science Research Centersに$625Mという配分となっていますが,この額は上院との調整で変わる可能性があります。

  その次の5年間に予算が付く保証はないとのことですが,米国政府が量子コンピューティングに本腰を入れ始めたようです。

6.中国の兆芯のx86互換プロセサ開先KX-6000

  2018年9月20日のPC Watchが,中国の兆芯の開先KX-6000プロセサについて報じています。KX-6000は今年1月に発表した開先KX-5000の後継モデルで,KX-5000は28nmプロセスであったのがKX-6000には16nmプロセスが使われ,クロックが2GHzから3GHzに向上しています。

  プロセサのマイクロアーキテクチャはLuJiaZuiと呼ばれるのだそうですが,意味は分かりません。CPUは8コアで合計8MBのキャッシュを搭載しているとのことです。メモリはデュアルチャネルのDDR4-3200となっています。CPUは,完全な自主開発のIPで作られているとのことですが,x86アーキの特許はどうなっているのでしょうか?

  KX-6000は完全なx86命令互換を実現しており,第7世代のCore i5と同等のシステム性能をターゲットにしており,デスクトップからサーバ,組み込みまで全方位に使えると謳っています。ただし,キャッシュの容量やメモリ系をみると,本格的なサーバには難しいという気がします。

  

inserted by FC2 system