2026/03/13 掲載

NVIDIAが1200億パラメータ規模のオープンソースAI「Nemotron 3 Super」を発表

複数のエージェントが連携するマルチエージェントモデル

ありがとうございます！
いいね！した記事一覧をみる

会員（無料）になると、いいね！でマイページに保存できます。

AI・生成AI

|

タグをもっとみる

米NVIDIAは、エージェントAIの構築に特化した大規模言語モデル「Nemotron 3 Super」をオープンソースとして発表した。総パラメータ数は1200億だが、推論時に稼働するのは120億パラメータに抑えられている。独自のハイブリッドアーキテクチャを採用し、最大100万トークンの文脈処理と推論速度の大幅な向上を実現した。

（Photo：jamesonwu1972/Shutterstock.com ）

　NVIDIAが発表した「Nemotron 3 Super」は、複数のAIエージェントが連携して複雑なタスクを処理する「マルチエージェントシステム」での利用を想定した大規模言語モデルだ。同社のオープンモデル「Nemotron 3」ファミリーにおける主力モデルとして位置付けられ、Hugging FaceやNVIDIA NIMなどのプラットフォームを通じて開発者向けに公開された。

【図版付き記事はこちら】NVIDIAがオープンソースAIエージェントモデル「Nemotoron 3 Super」発表

NVIDIAがオープンソースAIエージェントモデル「Nemotoron 3 Super」発表

（図版：ビジネス+IT）

　本モデルの最大の特徴は、計算リソースの最適化と推論効率の高さにある。総パラメータ数は1200億を備えるが、推論時に実際に活性化されるパラメータは120億に限定されている。これを実現するため、状態空間モデルであるMamba層とTransformer層を組み合わせたハイブリッド構造に加え、「Latent MoE（潜在的混合エキスパート）」と呼ばれる新たなアーキテクチャを採用した。トークンを小さな潜在次元に圧縮してから処理を行う仕組みにより、従来の同規模モデルと比較して推論スループットが最大5倍に向上している。

　マルチエージェント環境で必須となるコンテキスト処理能力も強化された。最大100万トークンの長大なコンテキスト長をサポートしており、長時間の会話履歴や複雑なシステム指示、ツールの実行結果などをメモリオーバーヘッドを抑えながら処理する。音声AIやリアルタイムエージェントの開発においても、最初のトークンが出力されるまでの時間（TTFT）を短縮し、自然な対話速度を維持する。エージェント向けの推論ベンチマークにおいて、他社の主要なモデルと同等以上の性能を記録した。

　開発工程では、NVIDIAの次世代アーキテクチャであるBlackwellでの動作を見据え、NVFP4精度を用いた事前学習が実施された。合計25兆トークンのデータを使用し、多分野のコーパスで多様な知識を学習させた後、強化学習を通じてエージェントとしての推論能力やツールの呼び出し精度を調整している。

　NVIDIAは本モデルを「NVIDIA Open Model License」の下で提供し、企業が自社のインフラストラクチャやクラウド環境で自社データを保持したままカスタマイズできる環境を整備した。データのプライバシーとセキュリティを重視するソブリンAIやエンタープライズの需要に直接対応する。計算コストの増加が課題となるエージェントAI領域において、高効率なオープンモデルの実用的な選択肢を提供する。