最近の話題 2021年5月22日

1.シンガポールのUnisantisがDRAMより高密度,高速のDynamic Flash Memoryを学会発表

  2021年5月19日のEE Timesが,シンガポールのUnisantisという会社のDynamic Flash Memoryという新しいメモリの学会発表を報じています。Unisantisは,東芝でFlashMemoryを発明(原理としての発明は半導体エネルギー研究所の山崎氏の方が早い)した増岡 富士雄氏がシンガポールに設立した会社で,今回の論文の発表者もKoji Sakui(作井康司)氏とNozomu Harada氏となっています。

  Webで色々な報道を探したのですが,DFMの動作原理を詳しく書いたものは見当たらず,どのように動作するのか良く分からず,私の想像で書いているところもあり,間違っているかも知れません。

  DFMはシリコン基板の表面に円柱上の柱をエッチングで残し,円柱の表面にゲート絶縁膜を作って,その上にゲート電極を付け,さらにエッチングで2重のゲートを形成します。これがアクセストランジスタと記憶トランジスタになるようです。下側のトランジスタのゲートは鉢巻の幅が広く,ここを記憶キャパシタとして使っていると思われます。

  記憶キャパシタの容量は小さいのですが,トランジスタがシリコン柱を囲むGate All Around構造になっているので,ゲートの制御が良く効いてリーク電流が小さいので,必要な保持時間が得られるようです。普通のDRAMの記憶セルでは,読み出しは破壊型ですから,読み出しを行ったら,その値を記憶セルに再書き込みする必要がありますが,DFMでは記憶している電荷は消えない非破壊読み出しですから再書き込みは不要で,DRAMに比べて短いサイクルタイムで動作できます。

  そして,セルが垂直方向に伸びる構造なので,平面型のDRAMに比べて4倍のビット密度が実現できるとのことです。

  また,リークが少ないので,リフレッシュの頻度が少なくて済み,リフレッシュ電力が減り,ビットアレイをアクセスできる時間が長くできます。ただ,記憶トランジスタのゲートがどこに繋がっているのかが書かれておらず,どうなっているのか分かりません。

  非常に素晴らしい発明で,すでにいくつかの半導体メーカーから引き合いが来ているそうです。

2.GoogleがGoogle I/Oの基調講演でTPUv4を発表

  2021年5月21日のNextPlatformが,今週開催されたGoogle I/Oの基調講演におけるSundar Pitchai CEOのTPUv4の発表を報じています。

  Pichai CEOがTPUv4について述べたのは約2時間の基調講演の中で僅か1分42秒で,TPUv4はTPUv3の2倍以上の性能という事とTPUv4ボードの写真を見せただけで,後は,Next PlatformのTim Morgan記者の推測です。

  v3に比べてチップ数が2倍になり,演算性能が2倍なら,基本的に,LSIはほぼ同じ性能でつじつまが合います。ただし,プロセスが7nmに微細化されている分,消費電力は小さくなっていると考えられます。なお,これまでにGoogleはv4はv3のマシンラーニング性能では2.2倍~3.7倍と言う結果を公表していますが,これはハード性能の比ではなく,ソフトのチューニングを含んだ数字と考えられます。

  そして,TPUv4のPodの性能は,AI演算で1ExaFlopsを若干上回るとのことです。

  NextPlatformによると,GoogleはTPUv4について記者発表を行うことを約束したとのことで,この場で,どのような質疑が行われるのか興味深いところです。

3.Ampereが順調なビジネス状況を発表

  2021年5月21日のNextPlatform2021年5月19日のE  E Times2021年5月21日のNextPlatformが,Ampere Computingが順調なビジネス状況を発表と報じています。以前,IntelのCEOを務めたRenee James氏が創立した会社で,armアーキテクチャのデータセンター向けCPUを開発しています。2020年から出荷を始めた80コアのプロセサは,以前に発表されているMicrosoftとOracleに加えて,Tencent,Byte Dance,Equinix,CloudFlare,uCloudを新たな顧客として獲得したことを発表しました。また,最近,FoxconnとInspurグループともと折衝していることを公表sています。

  これらは,全て80コアのAltraの顧客ですが,その次の128コアのAltra Maxがサンプル提供の段階にあり,その次の世代も2022年にサンプル提供を行うという計画で進んでいるとのことです。

  Ampereは,AltraファミリのCPUはAMDやIntelのCPUに比べて,コア数を増やしてもリニアに性能が上がるというグラフを示しています。また,128コアのAltraMaxはAMDのMilanの2倍のコア数で,AMDのRomeやMilanと比べてPower/Coreは半分と言っています。また,クラウドワークロード性能は1.5~1.6倍とのことです。

  しかし,AltraMaxは5nmプロセスでAMDは7nmのCPUですから,比較の公正さには多少疑問があります。

  いずれにしても,毎年,新しいCPUを出し,データセンタの消費電力を減らすというロードマップの公表と,これまでの実証はユーザには良い印象を与えています。

4.NVIDIAとEthereumのマイニング

  2021年5月18日のThe Vergeが,NVIDIAの新しいRTX3080とRTX3070カードでも暗号通貨Ethereunのマイニング性能を落とすという報道を掲載しています。

  Ethereumなどの暗号通貨のマイニングは,GPUの性能がマイニングコストに直接効く分野で,マイナーは新しい,性能の高いGPUを使用します。このため,RTX3070,3080が発売された時には,それらのGPUの大半がマイナーに買い占められて,ゲーマーが買えないという事態になり,大ブーイングが起こりました。

  そこで,NVIDIAはRTX3060の発売時には,ドライバに手を入れて,Ethereumのマイニングを行っていることを検出すると,ハッシュ演算の性能を半減するという改造を行いました。そうすると,Hash/$で見て魅力がなくなり,マイナーはRTX3060を買わず,ゲーマーの手に入るというわけです。

  しかし,ドライバの改版は日常的に行われており,RTX3060のベータ版のドライバでHash性能を落としていないものを,NVIDIAが出してしまったというポカもあり,なかなかうまく行っていませんでした。

  ということで,NVIDIAはドライバを統一して,RTX3070,RTX3080でもハッシュ性能は制限したものだけにすることになったというのがこの記事です。

  しかし,NVIDIAとしてはGPUはゲーマーに買ってもらいたいのですが,マイナーにも買ってもらえば売り上げがさらに増えるということで,30HX,40HX,50HX,90HXというマイニング専用のGPUを出しました。30HXは26MH/sで125W,40HXha36MH/sで185W,50HXは45MH/sで250W,最上位の90HXは86MH/sで320Wとなっています。

  30HX~50HXはTuringアーキテクチャで,90HXはAmpereアーキテクチャのGPUを使っているようです。そして,これらのゲーミング用GPUではマイニングに必要のないTensorコアやRTコアなどはディスエーブルされ,グラフィック機能もディスエーブルされているようです。マイニングに不要な機能のディスエーブルは消費電力を減らし電気代の節約に効果があり,マイニングコストを低減できます。また,マイナーは効率の高いGPUが出ると買い替えて,古い方のGPUは中古市場で売却するのですが,マイニング専用GPUはゲーマー向けの中古市場での売却が難しいので,中古市場でのGPUのだぶつきは起こらず,NVIDIAにとっては好都合というところでしょう。

inserted by FC2 system