最近の話題 2018年11月10日

1.IntelのCascade Lake-APはマルチチップ

  2018年11月5日のEE Timesが,来年の前半にリリース予定のCascade Lake-AP(Advanced Performance)について書いています。それによると,Cascade Lake-APはマルチチップパッケージで,2チップで,最大48コア,12 DDR4チャネルとなるとのことです。AMDが4個のZeppelinチップを使うマルチチップで最大32コア,8 DDR4チャネルの製品を出しているので,Intelもマルチチップでこれを上回るコア数とメモリチャネル数を提供しようというところでしょう。

  Intelの評価結果ですが,デュアルソケットのサーバで比較すると,Cascade Lake-APは,AMDのEpyc 7601と比べて,Linpackでは3.4倍,Stream Triadでは1.3倍の性能になるとのことです。とは言え,2018年11月5日のSemiAccurateは,Linpackは演算器の数,Streamはメモリバンド幅で決まり,他の要素はあまり効かないベンチマークで,あまり意味がない。Cascade Lakeはマシンラーニング向けのVNNI命令を別とすれば,Skylakeのバグ(SpectreやMeltdownなど)修正を行っただけのチップと酷評しています,

  さらに,Intelは3D Xpointメモリを組み合わせて魅力を引きあげるとのことです。3D Xpointの使い方は2種類あり,一つはAPP Direct Modeと呼ばれ,3つのメモリチャネルにはOptane DCを接続し,1つのメモリチャネルにはDRAMをつなぐという絵が描かれています。こちらは高性能を必要とするデータはDRAM,不揮発性を必要とするデータはOptaneの方を使うという使い方で,瞬断などからの回復が早くできます。ただし,どちらのメモリを使うかはアプリケーションが直接判断するようです。

  もう一つはMemory Modeと呼ばれ,DRAMのキャッシュの下にOptaneがついているという構成で,3D Xpointは不揮発性よりも,DRAMよりもビット単価が安いことが強調され,不揮発性は利用されないように書かれています。より大きなメモリを持つ,あるいは,同じメモリなら安価でコンパクトに作れることになります。

2.AMDが7nmプロセスを使うZen 2プロセサを発表

  2018年11月7日のEE Timesが,7nmプロセスを使うAMDのZen 2プロセサ(Rome)の発表を報じています。パッケージの写真が載っていますが,中央の大きなチップが14nmプロセスで作られたI/Oチップで,その両脇に置かれた8個のチップが8コアのプロセサチップです。8コア×8個で,最大64コアを集積するパッケージとなります。なお,I/Oトランジスタは3Vなどを必要とする場合もあり,7nmプロセスでは作れない。また,I/OチップはI/O接続が多く,パッド面積でチップサイズが決まってしまうので,こちらは14nmプロセスを使っています。

  そして,PCI Expressは,Gen4を128レーンサポートしています。このポートはInfinity Fabrickにも使えるようです。

  Cascade Lake-APはEpyc 7601の3.4倍のLinpack性能と言っていますが,Romeは7601と比べると,コア数が2倍で各コアのスループットが倍増しており演算性能が2倍ですから,全体では4倍の浮動小数点性能となり,Cascade Lake-APと同じか,負けないレベルの性能が期待されます。

  Intelの14nmプロセスは,TSMCの10nm相当という話はありますが,AMDのRomeはTSMCの7nmと1世代微細化の進んだプロセスを使っているので,Intelがこれに対抗するのは大変です。Romeがちゃんと考えて作られているのに対して,IntelのCascade Lake-APはその場しのぎという感じがします。

3.AMDが7nmプロセスを使うGPUを発表

  2018年11月6日にAMDが,業界初の7nmプロセスを使うVega GPUを発表しました。14nmプロセスと比べて,同一クロックなら半分の電力,同一電力なら30%高いクロックで動作させられるとのことです。

  今回発表されたのは,MI60とMI50という製品で,MI60 GPUは4096個のStream Processorを持ち,ピーク倍精度浮動小数点演算で7.4TFlopsの性能を持ち,FP32ではその2倍,FP16ではその4倍の性能となっています。また,INT32からINT4までサポートしています。

  NVIDIAのVoltaはML演算専用のTensor Coreを作ったのですが,AMDは全ストリーム演算器が低精度演算をサポートする構造になっており,これでVoltaと比べて7%以内の性能差に収まる。そして,Voltaが800mm2を超えるチップであるのに対して,MI60は331mm2と半分以下のサイズのチップとなっています。12nmと7nmですからプロセスの微細化は違いますが,それを考慮しても小さいチップでVoltaと大差ない性能を実現しています。2018年11月7日のEE Timesにグラフが載っていますが,FP32でのResnet50ではV100の0.94倍,SGEMMでは1.07倍,DGEMMでは1.01倍となっていますが,これは性能でしょうか?それとも実行時間でしょうかね。

  各GPUは2本のInfinity Fabrickのポートを持ち,GPU間を200GB/sでデータ転送することができます。また,PCI ExpressはGen4 x16をサポートしています。

  メモリはHBM2 4個搭載し,メモリ容量は32GBで1GHzクロックで動作します。もちろん,ECCも付いています。

  これでGPUボードのTDPは300Wとなっています。

  MI50はStream Processorが3840個で,クロックも1746MHzと少し下がって,FP64性能は6.7TFlopsとなっています。

4.中国の大型スタートアップがSamsungより先に曲げられるディスプレイを出荷

  2018年11月9日のEE Timesが,$1.7Bの資金を集めた中国の大型スタートアップのRoyoleという会社が,今年12月にも折りたためる曲がるディスプレイを出荷すると報じています。FlexPaiと呼ぶディスプレイはAMOLEDで,スマートフォンサイズの筐体を柏餅のように包み込むディスプレイを持つタブレットの写真が載っています。ディスプレイのサイズは7.8インチで1920×1440 Pixelで308Pixel/Inchの解像度です。Samsungのものは7.3インチですが,1536×2152なので,420Pixel/Inchと一回り高解像度です。

  200,000回以上の折り畳みテストを行ったとのことで,普通の使い方ならば問題ない耐久性を備えているようです。

  FlexPaiは,QualcommのSnapdragon 8シリーズのSoCを使い,MicroSD,指紋認証,USB-C,ステレオスピーカを装備し,256GBのメモリをつけたモデルで,売値は$1469とのことです。

  大きなスクリーンは望ましいのですが,現在のスマホのスクリーン向けに作られたアプリが,折りたたみスクリーンの上でどのように動くのかは問題です。技術的には面白いのですが,ユーザに受け入れられて主流になっていくかどうかは,もう少し様子を見る必要がありそうです。

5.Bitcoinなどの仮想通貨の採掘コストは,貴金属の採掘コストより高い

  2018年11月6日のThe Registerが,仮想通貨の採掘に必要なエネルギーは貴金属類の採掘に必要なエネルギーと大差ないと報じています。これは米国の2人の研究者がNatureに投稿した論文を引用した記事です。

  仮想通貨は,トランザクションの記録にNounceという可変の値を付け加えてハッシュ値を計算し,それが指定された値より小さくなるNounceを見つけると褒美のコインが与えられ,採掘成功ということになります。そのためにはNounceの値をとっかえひっかえしてHashを計算する必要があり,コンピュータをガンガン動かすために電力が必要です。

  Natureに掲載された論文によると,$1の仮想通貨を採掘するために必要なエネルギーは,BitCoinでは17MJ,Etheriumは7MJ,Litecoinも7MJ,Moneroは14MJだそうです。これに対して,アルミの製造は122MJと大きいのですが,銅は4MJ,金は5MJ,プラチナは7MJ,希土類は9MJであり,こららの金属の採掘,精錬よりも仮想通貨の採掘の方が多くのエネルギーを必要としています。

  そして,仮想通貨の採掘のための電力を作るために,2016年1月から2018年6月までの間に,二酸化炭素を3Mトンから15Mトン発生させたと見られます。

  また,Bitcoinは発行量の上限がプログラムに組み込まれていて,既に,その81%が採掘されています。採掘が進むと,Hash結果の上限値を操作して採掘の困難度が引き上げられるので,さらに採算は悪くなります。そして,2140年には最後のBitcoinが採掘されると見込まれています。

inserted by FC2 system