最近の話題 2016年5月21日

1.Googleがディープラーニング用チップTPUを発表

  2016年5月18日のGoogleは同社のブログで,TPU(Tensor Processing Unit)と呼ぶディープラーニング用のカスタムチップを完成させ,1年以上前からRankBrainやStreetViewなどのサービスに使っている事を明らかにしました。

  Deep Learningの計算では,それほど計算精度が高くなくも良いので,演算精度を減らして演算器に必要なトランジスタ数を減らして,高密度,低電力を実現しているとのことです。8ビット精度という報道もあります。このような最適化を行ったカスタムチップの使用により,同社のDeep Learning用のプラットフォームであるTensorFlowを実行する性能/電力が1桁改善したとのことです。

  3月26日の話題で,AlphaGoが半年で劇的に強くなったと書きましたが,李世ドル9段との対戦には,このTPUが使われ,処理が速くなり,より深く読めるようになったとのことです。

  ブログにTPUカードの写真が載っていますが,カードはPCI Expressインタフェースで,ハードディスクの代わりに搭載できるサイズとのことです。そして李世ドル氏との対戦に使われたというサーバの写真が載っていますが,大型のラック2本で,これにTPUを満載にすれば相当なパワーになりそうです。

  2016年5月19日のEE TimesがTPUの開発を率いたNorman Jouppi氏のインタビュー記事を載せていますが,専用チップを開発するという決断は3年前に行われたのだそうです。今回は,GoogleはTPUの造りについては情報を出していないのですが,秋には詳細が発表される可能性があるとのことです。

2.PEZYグループが人工知能チップの開発に名乗り

  2016年5月20日のマイナビが,PEZYグループがDeep Insightsという会社を立ち上げ,人工知能チップの開発に乗り出すと報じています。着手という点では,上記のGoogleから3年遅れですが,2年以内に現状の1000倍の性能のチップを作るという目標なので,ターゲットは野心的です。

  7nmプロセスを使う高性能,高密度化で10倍,磁界結合による超高メモリバンド幅の実現で10倍,可変精度演算の実現で10倍の性能/電力を改善すれば,全体で1000倍という目論見です。

  これが実現できるかどうかは分かりませんが,彗星のように現れて,昨年6月にはGreen500の1〜3位を独占という快挙を成し遂げたPEZYグループですから,期待は持てます。

3.富士通フォーラムでExaScalerがビジネス用液浸サーバを展示

  2016年5月20日のマイナビが,5月17日から20日に掛けて東京国際フォーラムで開催された富士通フォーラムでの液浸のビジネスサーバの展示を報じています。基本的に液浸槽はスパコンと同じものですが,マルチXeonブリック,マルチXeon Dブリック,マルチGPGPUブリックという3種のサーバブリックとストレージノード ブリック,オールフラッシュ ストレージノード ブリックというビジネス向けのコンポーネントを新規開発しています。

  特徴は,液浸冷却なので高い発熱密度で動かせるという点を活かした,高密度実装です。マルチXeonブリックはXeon E5-2660v3を16個搭載,マルチGPGPUブリックはXeon 4個とGPGPU 8台,マルチXeon DブリックはXeon D1577を64個搭載します。また,ストレージノードブリックは8TBのHDDを24台に480GBのSSDを24台搭載し,総容量は200TBを越えます。オールフラッシュブリックは,1TBのSSDを1480台搭載し,こちらは1.48PBという巨大容量です。そして,Xeon D 4個をヘッドノードとして搭載し,4枚のInfiniBandやEthernet,OmniPathなどのアダプタカードを接続できます。

  富士通はExaScaler社に出資しており,この液浸サーバを富山富士通に設置して,1万人規模の社内ユーザに仮想デスクトップを提供するという試行を行って来ているとのことです。この試行では,設置面積は70%減,消費電力は30%あまり減少し,TCOとして30%の削減が見込まれるとのことです。

  来年には,規模を10倍に拡大して試行を続け,これで安定性が確認されたら,顧客向けの提供を検討するとのことです。

4.ARMの10nmプロセスのテストチップ

  2016年5月18日のEE Timesが,ARMのテストチップについて報じています。未発表のArtemisコアを4個搭載し,これも未発表のGPUとメモリサブシステムを集積し,CPUはクロックは2.8GHzとのことです。製造プロセスはTSMCの10nm FinFETです。

  1月にテープアウトしたとのことですから,もう,チップはできていると考えられます。。

  10nmプロセスの採用の狙いは,性能向上よりも消費電力の削減とのことです。16FF+プロセスで作られるCortex A-72と比較すると同じ性能の場合,消費電力は30%減となっています。そして,消費電力を同じとした場合の性能は12%アップとなっています。

  10nmプロセスのARM SoCは,今年の終わりころにはスマホに搭載されて出回るとのことですが,ARMのRon Moore氏は28nmプロセスのLSIを開発するのは$5.5M程度で出来たけれど,10nmプロセスの場合は$32.5M掛かる(これは調査会社の International Business Strategies社の値)と述べています。つまり,10nmプロセスはたくさん売れて高い開発費が回収できるような製品にしか使えないことになりそうです。

5.IBMが3値を書き込める相変化NVRAMを発表

  2016年5月18日のHPC Wireが,IEEE International Memory Workshopでの,IBMの相変化メモリの発表を報じています。セルはカルコゲナイト系の合金とのことで,Intel-Micronの3D Xpointと同じ系統です。

  微細なセルを使うNVRAMは,特性ばらつきを抑えることが難しく,当初はアナログ的な動作も考えたHPのMemristorは,現在 は2値のメモリとして使おうという方向になっています。相変化メモリも例外ではなく,特性ばらつきや経年変化を抑えることが課題でした。

  しかし,3値/セルとなるとばらつきや経年変化を1/8以下に抑える必要があり,格段に厳しくなります。実験室の試作ではあります が,IBMの相変化メモリが,これを実現したというのは非常に大きな前進です。また,3値/セルを実現できれば,ビットコストが下がり,Flashとの競 合が視野に入ってきます。

  なお,Flashはブロック単位で消去して再書き込みを行うという動作しかできませんが,相変化セルの場合は1bit単位で書き換えられるのも大きなメリットです。

  しかし,この手の不揮発性メモリは,華々しく発表されても,大容量のチップを量産できるところまで行かずに消えてしまうものが多いので,今後の実用化の進展を注意深く見守る必要があります。

6.ARMがApicalを$350Mで買収

  2016年5月18日のEE Timesが,ARMが組込み用の画像認識や画像処理のIPをライセンスしているApical社を$350Mで買収したと報じています。ApicalのIPはTexas Instruments,Samsung,LGなどがライセンスを受けており,15億台以上のスマートフォンと3億台以上のディジカメ,IPカメラなどに使われているとのことです。

  買収に伴い,画像認識のSpirit,周囲の環境に合わせてディスプレイの輝度などを変えるAssertive Display,ダイナミックレンジの拡大やカラーマネジメントなどを行うAssetive CameraなどのIPをARMは手に入れることになります。

7.Appleが中国版UberのDidiに$1Bを投資

  2016年5月13日のEE Timesが,Appleが中国版UberのDidi Chuxingに$1Bを投資すると報じています。DidiにはAlibabaとTencentという中国の大手IT企業がバックについており,Didiのビジネスは急速に伸びているとのことです。

  Appleは,ここに投資することで,Ride Shareビジネスのノウハウを吸収し,最終的にはロボタクシーなどの無人運転車の開発につなげる意図があるとみられています。


inserted by FC2 system