NVIDIA GB300とVR200ラックが牽引するAI推論市場の再編とは
台湾の市場調査会社TrendForceは2026年5月20日、北米の主要クラウドサービスプロバイダー5社が2026年にAI推論計算能力を前年比約122%増加させるという予測を公表しました。
グーグル、アマゾン、マイクロソフト、メタ、オラクルの設備投資額は7,700億ドルを超え、NVIDIAのGBおよびVRシリーズサーバー需要の60%超を5社が占める想定です。生成AIの商用化が学習から推論へと需要の重心を移すなか、計算資源・電力・冷却インフラの制約が同時に顕在化しつつある状況です。日本企業にとっても、海外CSPへの依存度と国内AI基盤の構築方針を見直す局面に入っています。
今回は、北米CSPの調達戦略と推論シフト、自社ASIC台頭の力学、電力制約と日本企業の選択肢、そして、今後の展望について取り上げたいと思います。

北米CSP5社が主導するAI推論シフトの実態
TrendForceの予測によると、グーグル、アマゾン、マイクロソフト、メタ、オラクルの北米CSP5社は、2026年にNVIDIAのGBおよびVRシリーズサーバー需要の60%超を占めるとしています。これら5社の合計AI学習計算能力は前年比56%増、AI推論計算能力は約122%増となる見込みです。FP16/BF16ベースの学習計算能力は2025年に9 ExaFLOPSを超え、2026年にはさらに伸長します。一方、FP4/NVFP4で測定する推論能力は2025年で37 ExaFLOPSを超え、2026年には82 ExaFLOPS規模に達する想定です。
学習用途が市場全体の出荷の55%程度を維持する一方、推論能力の伸長率がそれを大きく上回る点に、需要構造の転換が表れています。中長期的には推論サーバーが学習サーバーを上回るとTrendForceは予想しており、商用化フェーズに入った生成AIサービスが、計算資源の配分を学習から推論へ傾けつつあるという理解が重要となります。

設備投資87%増の規模----CAPEX 7,700億ドルの内訳
TrendForceの推計によると、5社の2026年合計設備投資額は7,700億ドル超、前年比約87%増となる状況です。日本円換算では110兆円を超える規模となります。この投資額は半導体製造装置、データセンター用地、電力契約、冷却インフラなど複数の領域に分散される一方、その大半がAIアクセラレータと関連設備に向かう構造です。
NVIDIAのGBおよびVRシステムは学習に加え推論ワークロードに対応する設計が施されており、ハードウェアとソフトウェアの両面で推論性能の最適化が進められています。新世代のGB300およびVR200ラックスケールソリューションは、この方向性を体現する製品といえます。投資の集中は規模の経済を加速させる一方で、後発の事業者やリージョナルクラウドにとっては参入障壁を引き上げる結果となり、寡占的な構造の固定化が懸念される状況です。日本国内のクラウド事業者にとっても、価格競争力と技術キャッチアップの両面で対応が求められています。
自社ASICの台頭----GoogleのTPU v8とAmazonのTrainium
GPU依存からの脱却を狙う動きとして、CSP各社による自社ASIC開発が加速しています。Googleは独自TPUチップの需要が2026年に前年比約80%増と予想され、下半期にはv7からv8世代への移行が段階的に進む見込みです。Amazonも自社AIサーバー出荷のうちTrainiumシリーズが40%超を占める想定で、ASIC比率の高まりが顕著となっています。
自社ASICの利点は、特定ワークロードへの最適化によるTCO削減、調達リスクの分散、そして外部GPUベンダーへの依存度低下にあります。一方で、ソフトウェアエコシステムの構築、開発投資の継続性、汎用性の確保といった課題も残ります。NVIDIAのCUDAエコシステムが持つ蓄積に対抗するため、各社は推論用途を起点に自社ASICの適用領域を拡大する戦略を採っているといいます。マイクロソフトのMaiaやメタのMTIAなど、他社の自社シリコン開発も同様の文脈に位置づけられます。

液冷化と電力18GW増----インフラ制約の臨界点
新世代のサーバーラックは、NVIDIAおよびAMDのGPU、各CSPの自社ASICのいずれも液冷システムを採用しています。これにより1ラックあたりのアクセラレータ収容数を増やす設計が可能となりますが、個々のGPUおよびASICのTDP上昇により、システム全体の消費電力は構造的に増加する状況です。
TrendForceは、北米CSP5社のサーバー総消費電力が2026年に前年比18GW増、成長率116%に達すると予想しています。2023年の同増分が2.8GWであったことと比較すると、わずか3年で増加幅が6倍以上に拡大した計算となります。この規模の電力需要は、地域の送電網、再生可能エネルギー調達、原子力発電の活用議論にまで波及しつつあります。マイクロソフトやアマゾンが小型モジュール炉(SMR)への投資や原子力発電所との直接契約を進めているのも、この制約への対応策と考えられます。電力が立地選定とサービス展開の制約条件となる時代に入ったといえる状況です。
今後の展望
2026年のAIインフラ市場は、計算能力の量的拡大に加えて、推論ワークロードを軸とした質的な転換が同時に進む局面に入っています。学習用途で蓄積された計算能力が、商用AIサービスの提供を通じて推論へと振り向けられる過程は、需要構造そのものを再設計する動きでもあります。
NVIDIAの寡占的地位は当面続くと予想されますが、CSP各社の自社ASIC開発、AMDのGPU攻勢、そして電力制約という外部要因の組み合わせが、中長期的には市場の力学を変えていく可能性が考えられます。日本企業にとっては、海外CSPのインフラを利用する立場と、国内に計算基盤を構築する立場の双方で、戦略の再設計が必要となります。生成AIの社会実装が学習中心から推論中心へと重心を移すなか、計算資源・電力・冷却・人材という制約条件を踏まえた、現実的なAI基盤戦略の具体化が問われています。
