最近の話題 2014 年1月18日

1.AMDが初のHSAサポートAPUとなるKaveriを発表

  2014年1月14日にAMDはKaveriの名称で開発されてきたAPUを発表しました。今回発表されたのはA10-7850K,A10-7700K,A10-7600というハイエンドのデスクトップ向けの製品で,最初の2つの消費電力は95W,7600は65W/45Wとなっています。 タブレットなどに使える15Wの製品という話も出ていますが,今年後半になるようです。

  CPUコアはSteamrollerコアになり,2014年1月14日のPCWatchの後藤さんの記事によると,Piledriverコアに比べてIPCは20%向上とのことです。 今回発表の製品は,このSteamrollerコアを4コア搭載しています。CPUクロックは,順に,3.7GHz,3.4GHz,3.3/3.1GHZとなっており,ターボ 時のクロックは,4.0GHz,3.8GHz,3.8/3.3GHzとなっています。

  そして,GPU側はSIMTのGCNアーキに変わり,7850KはGPUを8コア,その他の2品種は6コア搭載しています。1GPUコアは,64FMA演算器を搭載しているので,7860Kは512FMA,その他は384FMAです。GPUのクロックは3品種とも720MHzとなっています。ターボがあるのかも知れませんが,発表には書かれていません。

  CPUコアとGPUコアが更新され,性能が上がった点に加えて,Kaveriは,TensilicaのHiFiテクノロジを使うTrueAudio搭載,そして,4Kグラフィックス対応が目玉です。

  お値段は7850Kが$173,7700Kが$152,7600が$119となっています。

  Kaveriの大きな特徴は,CPUとGPUが一つのメモリ空間を共有する機能を備えた点で,GPUで処理をう場合のCPUからGPUへのメモリ転送と,GPUでの処理結果をSPUに戻す場合のメモリ転送を不要にしている点です。これはCPUコアとGPUコアのキャッシュにコヒーレンシを維持して一つのメモリ空間を実現しているのですが,GPUのL2$はDRAMと直結したキャッシュなので,これをバイパスしてCPUのキャッシュとのコヒーレンシをとっています。L2$がメモリキャッシュなのでやむをえないのですが,GPUからのキャッシュコヒーレントなメモリアクセスの性能がどうなるのか,多少,気になります。とはいえ,CPU-GPU間のメモリ転送が不要になるのは,プログラミング上の最大の問題が取り除かれたことになります。

  これで,残る問題は,割り込みで実行する仕事を切り替えるプリエンプションとなります。

  また,2014年1月14日のSemiAccurateが,A10-7850Kと,Intelのi7-4770K,そして,AMDのこれまでのハイエンドのA10-6800Kとの比較のベンチマーク結果を載せています。それによると,ゲームを使ったGPU性能では,A10-7850Kは,i7-4770Kの2.6倍の性能,A10-6800Kと比較しても27%の性能アップとなっています。一方,シングルコアのCPU性能の比較では,A10-7850KはIntelの60%の性能です。また,A10-6800Kとは同じ性能です。これはA10-6800Kが4.1GHzと少しクロックが高いことが効いています。

  CPU+GPUの性能を測るLuxMarkとratGPUベンチマークでは,A10-7850KはIntelとほぼ同等です。A10-6800Kと比較するとLuxMarkでは1.52倍ですが,ratGPUでは3.16倍と大差となっています。

  なお,共有メモリは,それをサポートするOSとそれを利用するアプリが出てこないと威力を発揮せず,現状ではベンチマークはできません。

2.GPUのCAEソフトウェアのライセンス料は?

  2014年1月17日にNVIDIAのManufacturing Dayというワークショップが,東京駅の隣のJP Towerで開催されました。GPUのHPC応用というセッションで,NVIDIAの杉本事業部長が,一般に,CAEソフトのライセンスはCPUコア数ベースとなっている。これにGPUを追加した場合は,ANSYSなどはCPU 1コアとGPU 1チップが同じカウントになっていると述べていました。

  アプリケーションの性質によってGPUのアクセラレーション効果は変わりますが,8コアCPUに比較してGPU 1チップが数倍から5倍くらいの性能になるケースは多く見られます。仮に,GPU 1チップは,8コアCPUの4倍の性能とするとソフトのライセンス単価は1/32ということになります。

  そして,製造業では,ハードのコストは全体の20%で,残りの80%のコストはソフトウェアとのことで,この80%のコストが1/32になるのは大きなコストダウンで,GPUを使わないという手はありません。筆者は,これが製造業に対してGPUの普及を強力に後押ししていると思います。

  今回,AMDは,Kaveriでは,64FMA演算器を持ち,別のプログラムを実行する能力を持つユニットを,CPUコアと同じCompute Unitと呼びました。実はスパコンの性能ランキングのTop500では,このようなコアカウントを採用しています。ということで,今回のAMDのカウントは,技術的には妥当に近いと思うのですが,これに移行すると,1チップが1CPUコア相当という現在のANSYSなどのライセンス料カウントに比べると,GPU用のCAEのライセンス価格が大幅に上がってしまいます。

  なお,NVIDIAのKepler GPUで,異なるプログラムを実行する機能を持つSMXは,単精度では192FMA,倍精度では64FMAを持ち,AMDのCUと比較すると単精度では3倍,倍精度は同じで,KaveriのようなカウントではK20xが14コア,K40は15コアという計算になります。

3.IntelがFab42の建設を凍結,5%の人員も削減

  IntelがFab42を閉めるというニュースも流れましたが,2014年1月17日のEE Timesが,その後のフォローアップを載せています。

  アリゾナのFab42は3年前に建設を決めたのですが,当時の需要予測に比べて,PC向けのチップの需要が落ち込んできており,14nm世代は,既にあるFabで生産がまかなえる状況になっているとのことで,Fab42は建屋を建設したところで凍結し,製造装置は設置しないで空けて置き,将来,利用する可能性を残して置くとのことです。

  クリーンルームの建設も安くは無いでしょうが,製造装置はそれよりも高いので,無駄な出費を抑えられます。

  また,2014年1月17日の別のEE Timesの記事は,Intelは2014年のうちに,現在の10万7000人の従業員の5%を削減すると報じています。仕事の優先順位が変わってきており,それに労働力をあわせるためとのことでが,どの分野で削減が行われるかなどの詳細は明らかになっていません。

4.IBMが$1.2Bを投じて15のデータセンタを建設

  2014年1月17日のThe Registerが,IBMが$1.2Bを投じて,15のデータセンタを建設し,所有するデータセンタを40箇所に増加させると報じています。自社でコンピュータを設置するのではなく,クラウドサービスを使うケースが増えており,データセンタの需要が増えると考えられています。この分野では,Amazon Web Serviceなどが伸びており,これに対抗する動きです。

  中国,インド,日本が建設の予定地になっているとのことです。また,需要が集中しているロンドン,ワシントンDC,ダラス,メキシコシティーにも建設の予定だそうです。

  $1.2Bで15箇所というのは単純計算すると,1箇所$80Mです。当然,大部分はIBM製品を使うでしょうから,通常の販売価格ではなく,社内の取引価格なのでしょうね。

inserted by FC2 system