最近の話題 2020年11月7日

1.米国の半導体シェアは12%

  2020年10月27日のHPC Wireが,米国の半導体製造シェアはわずか12%と報じています。かつては米国は,世界でも大きな半導体生産シェアを持っていたのですが,世界の各国が多額の補助金を出して半導体産業を誘致した事から流出たと述べています。

  それでもチップの販売シェアでは,まだ,47%という最大のシェアを誇っていますが,製造シェアは1/4を下回っており,減少分は,日本,韓国,台湾,中国に流出したとのことです。特に,中国は2030年には半導体販売のシェアで世界一になるという路線をひた走っています。

  元になったWSJの記事に掲載されたグラフによると,米国のシェアは,チップ製造の原料では12%,チップ製造装置では50%,チップ設計IPでは52%とのことです。

2.中国の長江存儲がFlashで世界をリードする?

  2020年11月2日のEE TimesがYangtze Memory Technologies Co. (YMTC; 長江存儲)がフラッシュでSamsungやMicronをリードするという記事を載せています。YMTCはXtacking Technologyと呼ぶ3D積層の技術を開発し,2018年のFlash Memory Summitで表彰を受けています。

  YMTCのCEO代行を務めたCharles Kau氏が2~3年の内には,YMTCは2~3年の内には,この技術が世界のFlash市場を席捲すると述べたとのことです。

  YMTCのXtackingではFlashのメモリ素子と周辺回路は別々のウェファで製造し,周辺チップレットは,裏向きにして,メモリ素子チップレットに重ねて接続します。

  Flashでは100層程度,メモリセルを3次元積層しますが,周辺部分はこのような積層は不要です。そして,周辺とメモリでは,トランジスタに要求される特性も異なるのですが,両者の要求の中を取ったようなトランジスタが使われており,最適ではありません。

  YMTCのXtackingは別のチップなので,それぞれに最適なトランジスタを使うことが可能です。また,周辺回路はメモリ素子の上に載せるので,チップサイズも小さくできます。

  その意味では,Xstackingは技術的には良い方法なのですが,別々のチップレットを作って,メモリチップに組み上げるのには手間もかかります。その意味で,今の3DスタックのFlashと比べて経済的かは難しいところではないかと思います。

  加えて,現在,中国で使える半導体プロセスは28nm程度で,このプロセスで世界的に競争力のある製品が作れるのかも疑問のあるところです。


3.AmazonがP4 A100インスタンスで4000+ GPUのクラスタを構築

  2020年11月2日のHPC WireがAWSのPシリーズインスタンスとして,NVIDIAのA100 GPUを4000個あまり採用すると報じています。

  新しいP4dインスタンスは8個のA100 GPUをNVLinkで接続し,48個のIntelのCascadeLake CPUが付いています。これらのP4dインスタンスは400Gbpsのネットワークで接続されています。この接続はElastic Fabric Adaptorと呼ぶアダプタ経由で接続されるとのことです。EFAは,GPUDirectを使うことによりGPU間の通信を高スループットで低レーテンシで実行できるとのことです。

  前世代のV100を使用するのと比べると,A100 GPUを使うP4dインスタンスはディープラーニングの実効性能が2.5倍に向上しているとのことです。また,倍精度の浮動小数点演算性能は2倍,メモリ性能は2.5倍,ネットワークバンド幅は16倍,ローカルのNVMeストレージのバンド幅は4倍になっているとのことです。

  Google Cloudは今年7月にA100 GPUを使うA2ファミリの提供を開始しており,Microsoftは8月にA100 GPUをプレビューモードでの提供を開始しています。

4. ローレンスリバモアで新型コロナ研究用のMammothクラスタが稼働

   2020年11月4日のHPC WireがLawrence Livermore国立研究所での新型コロナウイルス研究用のMammothクラスタの稼働を報じています。Coronavirus Aid, Relief and Economic Security (CARES) (法)の施行でつけられた予算措置で,64ノードのMammothクラスタはノードメモリを2TB/Nodeから,4TB/Nodeと倍増させました。

  従来は1ノードで12~16計算しか並列計算できなかったのですが,メモリの増強で128シミュレーションを並列に実行できるようになったとのことです。


inserted by FC2 system