- 2025/11/27 掲載
Googleの“推論AI時代”のTPU「Ironwood」台頭。AI半導体の地殻変動なるか?
NVIDIA はXで「性能・多様性・互換性」の面で同社GPUの優位性を強調
ビジネス+IT
Googleは、2010年代からTPU(Tensor Processing Unit)を機械学習専用チップとして開発してきた。2025年4月に初めて披露されたIronwoodは、その最新かつ野心的なバージョンで、「推論に特化」した設計が特徴である。1チップあたりのピーク演算性能は4,614 TFLOPS(FP8 あるいは低精度フォーマット時)に達し、1チップあたり192 GBの高帯域メモリ(HBM)を搭載。さらにチップ間通信は9.6 Tbpsのインターコネクト(ICI)で接続され、最大9,216チップを束ねる「スーパーポッド(Superpod)」構成で、全体として最大約42.5エクサフロップス級の性能を発揮できる。
このような構成により、Ironwoodは単なるチップ単体の高速化に留まらず、「大規模な分散推論」「超大規模モデルの並列推論」「メモリ集約型モデルの高速推論」といった、従来のGPU中心のAIワークロードでは実現しづらかったクラスの処理を実現可能にする。特に近年増えている、巨大言語モデルやマルチモーダル生成モデル、さらには動的に計算経路が変わるMoE(Mixture of Experts)モデルなどに対して強みを発揮する設計である。
2025年11月、Ironwoodは一般提供を開始。クラウド利用者が同チップを使えるようになり、AIインフラの門戸が本格的に広がった。
また、AIスタートアップである Anthropic は、Ironwoodを含む巨大なTPU群の利用契約を締結。すでに「100万台以上のTPUを導入予定」と報道されており、Ironwoodは単なるGoogle内部用の研究インフラではなく、外部のAI企業にも提供される主要な選択肢となりつつある。
このような発展は、AIの「学習(training)」中心だったこれまでの時代から、「推論(inference)」中心の時代への大きな転換を示す。巨大モデルを訓練するコストや時間が減る一方で、「学習済みモデルを使った応答生成」「リアルタイム対話」「マルチモーダル生成」「エージェント型AI」などの応用が急速に広がっており、それらを支える基盤としてIronwoodは最適化されている。
一方、これまでAIアクセラレータ市場をほぼ独占してきたNVIDIAのGPU、特に大規模AIモデル用GPUとの関係も注目される。NVIDIAの強みは成熟したソフトウェアエコシステム(CUDA、トレーニング/推論用ライブラリ群)と、汎用計算能力の高さにある。対してIronwoodは、Googleのソフトウェアスタック(たとえば TensorFlow や JAX、およびそのコンパイラ XLA)と垂直統合された環境であり、ハードウェアとソフトウェアの両面で最適化されている。こうした垂直統合はGPUのような汎用環境と比べて、特定タスクにおいて大きな効率差を生む可能性がある。
ただし、FLOPS(演算性能)やメモリ帯域幅といったスペックが、必ずしもリアルな推論/応答生成性能をそのまま保証するわけではない。実際の性能は、モデル構造、メモリ利用パターン、通信オーバーヘッド、ソフトウェアの最適化状況などに左右される。また、現時点で公開されているのはあくまでピークスペックや設計上の理想値であり、商用運用でどこまで“理論値に近い性能”を引き出せるかは、今後多くの検証が必要である。加えて、高密度液体冷却システムの運用にはデータセンターの整備や消費電力の管理など、運用コストや設備要件の課題も伴う。
それでも、Ironwoodの登場はAIインフラの競争構造に大きな変化をもたらす可能性がある。特に、巨大学習済みモデルの推論をクラウドで提供するAIサービス企業や、リアルタイム応答や大規模並列処理を必要とする企業にとっては、NVIDIA GPUに代わる現実的かつ強力な選択肢になり得る。さらに、こうしたGPU以外の選択肢が増えることで、AIインフラの多様性と競争が促され、コスト低下や技術革新が進む可能性もある。
今後半年から数年先を見据えると、Ironwoodの本格運用が進むにつれて、AIサービスの高性能化やリアルタイム性の向上、多様なモデルの併用が加速するだろう。特にMoEモデルやマルチモーダルモデル、さらには複数のモデルを組み合わせた「AIエージェント」サービスなどにおいて、その恩恵は大きい。さらに、Googleが提供するクラウド環境を通じて、これまでハードルが高かった大規模AI開発がよりアクセス可能になることで、産業界や研究機関におけるAIの利活用が広がる可能性も高い。
他方で、運用コストやインフラ要件、そして実アプリケーションにおける性能安定性という実践面での検証がこれから続く。半年から1年の間に、Ironwoodを用いたベンチマークや実証実験、そしてNVIDIA GPUとの明確な比較データが多数出てくると考えられる。そこから初めて、Ironwoodが“GPU時代”をどこまで塗り替え得るか、本当の評価ができるだろう。
以上のように、Ironwoodは単なる新チップではなく、AIインフラとサービスのあり方を変える可能性を秘めた存在である。今後の実運用やエコシステムの広がりにこそ、真の価値が問われることになる。