- 2026/03/13 掲載
NVIDIAが1200億パラメータ規模のオープンソースAI「Nemotron 3 Super」を発表
複数のエージェントが連携するマルチエージェントモデル
本モデルの最大の特徴は、計算リソースの最適化と推論効率の高さにある。総パラメータ数は1200億を備えるが、推論時に実際に活性化されるパラメータは120億に限定されている。これを実現するため、状態空間モデルであるMamba層とTransformer層を組み合わせたハイブリッド構造に加え、「Latent MoE(潜在的混合エキスパート)」と呼ばれる新たなアーキテクチャを採用した。トークンを小さな潜在次元に圧縮してから処理を行う仕組みにより、従来の同規模モデルと比較して推論スループットが最大5倍に向上している。
マルチエージェント環境で必須となるコンテキスト処理能力も強化された。最大100万トークンの長大なコンテキスト長をサポートしており、長時間の会話履歴や複雑なシステム指示、ツールの実行結果などをメモリオーバーヘッドを抑えながら処理する。音声AIやリアルタイムエージェントの開発においても、最初のトークンが出力されるまでの時間(TTFT)を短縮し、自然な対話速度を維持する。エージェント向けの推論ベンチマークにおいて、他社の主要なモデルと同等以上の性能を記録した。
開発工程では、NVIDIAの次世代アーキテクチャであるBlackwellでの動作を見据え、NVFP4精度を用いた事前学習が実施された。合計25兆トークンのデータを使用し、多分野のコーパスで多様な知識を学習させた後、強化学習を通じてエージェントとしての推論能力やツールの呼び出し精度を調整している。
NVIDIAは本モデルを「NVIDIA Open Model License」の下で提供し、企業が自社のインフラストラクチャやクラウド環境で自社データを保持したままカスタマイズできる環境を整備した。データのプライバシーとセキュリティを重視するソブリンAIやエンタープライズの需要に直接対応する。計算コストの増加が課題となるエージェントAI領域において、高効率なオープンモデルの実用的な選択肢を提供する。
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR