2024年3月、NVIDIA(エヌビディア)はAI半導体の「ブラックウェルB200」を発表しました。この製品は、従来よりも最大30倍の速度を実現できるとして話題になりました。
このように、AI技術の普及によりAI半導体が注目される機会が増えています。しかし、「一般的な半導体は何が違うの?」と疑問に感じる方もいるでしょう。そこで、今回はAI半導体の概要や種類、注目される背景をわかりやすく解説します。
Contents
AI半導体とは
AI半導体とは、AIの処理に特化した半導体です。特徴は大量のデータを並列処理できることです。
その理由は、AIの構造にあります。AIの精度を高めるには機械学習をする必要があり、その手法の1つがニューラルネットワークです。ニューラルネットワークは、人間の脳の構造を入力層・中間層(隠れ層)・出力層の多層構造により模倣する手法です。そして、機械学習の際に大量のデータを読み込ませて、最適な経路で分析できるように調整します。
例えば、生成AIのChatGPTのGPT-3.5は、45TBという膨大なテキストデータを読み込ませ、1,750億個のパラメータ(変数)を調整することで高度な精度を実現しました。
このように、AIは大量のデータを同時に処理する必要があるため、AI半導体には高度な並行処理能力が求められます。また、AIの運用コストを削減するために、省電力化もAI半導体の重要な要素です。
AI半導体の種類
AI半導体は種類によって特徴が異なります。ここでは、4種類のAI半導体について解説します。
GPU(Graphics Processing Unit)
GPUは、画像や動画、3Dデータといった画像処理を目的に開発された半導体です。ディスプレイ表示するための処理に使われるため、一般的なパソコンやスマートフォンにも搭載されています。性能が高くなるほど、より大容量データをすばやく処理できます。
パソコンの演算処理を担うパーツのCPUとGPUの違いはコア数です。コアとは、データ処理を行う中核のことで、多くなるほど並行処理できる数が増えます。そして、CPUのコア数は数個から数十個に対して、GPUのコア数は数千個です。
このようにGPUは、大容量の画像データをすばやく処理する必要があるため、並行処理に特化しています。この特徴から、AI半導体としても適切であると判断され、現在のAI半導体の主流となっています。
FPGA(Field Programmable Gate Array)
FPGAとは、製造後に使用する現場で回路情報を変更できる半導体です。一般的な半導体は、製造後に設計の変更はできません。FPGAはこの特徴により、目的に応じた回路設計に変更可能で、並行処理に特化させることもできます。また、不要な回路を削除することで、省電力化を実現できるのも利点です。つまり、AI半導体に求められる「並行処理」かつ「低電力」に特化した半導体を実現できるのがFPGAです。
ASIC(Applibation Specific Integrated Circuit)
ASIC(エーシック)は、特定のアプリケーションや機器、用途のために最適化した半導体です。FPGAは使用する現場で回路情報を変更してカスタマイズするのに対して、ASICは顧客がカスタマイズした回路設計の半導体を製造します。ASICは製造後に回路設計を変更できませんが、目的の回路設計に最適化した半導体を量産できるため、製造コストや使用電力を低減できます。これらの利点から、FPGAでAI半導体の回路設計を調整した後、ASICで運用するといった方法が可能です。
SoC(System on a Chip)
SoCは、1つのシリコンチップにシステムの必要な機能を集約した半導体のことです。スマートフォンに搭載されているSoCが最も一般的です。スマートフォン用SoCはCPUやメモリ、GPUなどを1つの半導体に集約しています。システムをコンパクト化できるのが利点で、自動運転のAIを実現するための車載用AI半導体として注目されています。
AI半導体が注目される背景
AI半導体が注目される背景は、「市場規模の拡大」と「データセンターの需要拡大」です。これら2つの背景について解説します。
AI半導体の市場規模の拡大
AI半導体が注目される1つ目の背景は、市場規模の拡大が予想されることです。Gartnerの調査によると、2023年のAI半導体の売上高は536億ドルでした。2024年には712億ドルに達し、約33%も増加する見込みです。2025年の売上高の予測は919億ドルで、さらに市場規模が拡大するとしています。このことからも、AI半導体の需要が急速に拡大していることが伺えます。
参考:Gartner「Gartner Forecasts Worldwide AI Chips Revenue to Grow 33% in 2024」
AIの普及によるデータセンターの需要拡大
AI半導体が注目される2つ目の背景は、AIの普及によりデータセンターの需要が拡大していることです。データセンターとは、サーバーやネットワーク機能を設置するための施設のことです。総務省の「令和6年版 情報通信白書」によると、2023年の世界のデータセンターシステム市場規模は34.1兆円でした。2024年には36.7兆円に拡大する見込みです。
出典:総務省「データセンター市場及びクラウドサービス市場の動向」
2024年2月には、ChatGPTを運営するOpenAIのCEO(最高経営責任者)がAIデータセンターの補強のために、5兆から7兆ドルの資金を集めていると報道されました。日本の2023年の名目GDPが4兆2,106億ドルであることから、その規模の大きさは異次元と言えます。また、NVIDIAのCEOも、「データセンターには1兆ドルの好機」があるとのことです。
このような報道から、今後はさらにデータセンターの需要が高まると考えられます。
参考:NewsPicks「OpenAIのアルトマンCEO、AIや半導体関連で7兆ドル(約1000兆円)調達の計画」
参考:Bloomberg「エヌビディアCEO「データセンター1兆ドルの好機」-決算ポイント」
AI半導体分野の動向に注目しよう
AI半導体は、並行処理に強みを持つAIに特化した半導体です。AIの普及により、ますます需要が高まると期待されています。そのようなAI半導体の主要メーカーは、以下のとおりです。
- NVIDIA(エヌビディア)
- AMD(エーエムディー)
- Intel(インテル)
この中でも、NVIDIAは圧倒的な地位を確立しており、AI半導体市場の80%から90%のシェアを獲得していると言われています。
一方、NVIDIAの依存度を下げるために、MicrosoftやAmazon、Googleなどの大手企業は、AI半導体の独自開発を行っています。実際にGoogleは、2024年5月、従来モデルの4.7倍に性能アップした「TPU」の第6世代モデルを発表しました。
今後は、これらの企業がNVIDIAの競合企業になる可能性もあるため、AI半導体分野の動向に注目してみましょう。
参考:Reuters「グーグル、AIデータセンター向け新型半導体発表 処理性能4.7倍に」