- 会員限定
- 2026/02/15 掲載
NVIDIA ロボット世界モデルAI「DreamDojo」発表、人間の動画からロボットが学習
44000時間の人間の作業動画からロボットが物理世界を学習
人間の44,000時間の動画からロボットが学習、物理法則や作業動作を理解
NVIDIAが率いる研究チームは、UC BerkeleyやStanford大学などと協力し、ロボットの自律制御を飛躍的に高める新たな基盤モデル「DreamDojo」を開発した。本モデルの最大の特徴は、ロボットの学習データとして従来一般的だった「ロボット自身による試行錯誤データ」ではなく、YouTubeなどに存在する「人間の行動動画」を大規模に活用した点にある。学習に使用された「DreamDojo-HVデータセット」は44,000時間の人間の一人称視点動画で構成されており、これは2024年に発表された他社の世界モデルが使用したデータ量の約49倍に相当する。DreamDojoは、この膨大な映像データから物理的な因果関係や物体の操作スキルを事前学習(Pre-training)し、その後、特定のロボットの身体に合わせて微調整(Post-training)を行う2段階のプロセスを採用している。これにより、異なるメーカーのロボットであっても、共通の物理的常識を適用することが可能となった。実際にFourier Intelligence社のGR-1やUnitree Robotics社のG1、AgiBot、YAMといった複数のヒューマノイドロボットにおいて、多様な環境下での物体操作や移動が確認されている。
また、実用面における処理速度の課題も克服しており、10 FPS(毎秒10フレーム)でのリアルタイム相互作用を実現した。これにより、ロボットは1分以上の長期間にわたる動作生成(ロングホライゾン・ロールアウト)を安定して行うことができ、コストのかかる実機テストを行う前に、高精度な仮想シミュレーション内での動作検証が可能となる。NVIDIAのジェンセン・フアンCEOは、AIロボティクスを「一世代に一度の機会」と位置づけており、産業界全体での資本支出が拡大する中、本技術はロボット開発の効率化に大きく寄与するとみられる。
ロボットや自動運転に応用、生成AIの進化系「世界モデル」とは何か?
DreamDojoの中核技術である「世界モデル(World Model)」とは、ロボットやAIが物理世界での行動結果を予測するために脳内に構築する「内部シミュレーター」と定義される。人間がコップを落とせば割れることを直感的に理解できるように、世界モデルを持つAIは、実際に物理的な行動を起こす前に「こう動けば世界はどう変化するか」という因果関係を仮想的に試行し、予測することができる。
今すぐビジネス+IT会員に
ご登録ください。
すべて無料!今日から使える、
仕事に役立つ情報満載!
-
ここでしか見られない
2万本超のオリジナル記事・動画・資料が見放題!
-
完全無料
登録料・月額料なし、完全無料で使い放題!
-
トレンドを聞いて学ぶ
年間1000本超の厳選セミナーに参加し放題!
-
興味関心のみ厳選
トピック(タグ)をフォローして自動収集!
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR