- 2025/05/01 掲載
転換期を迎えたロボット・フィジカルAI開発、AIとシミュレーションがもたらす変化
急変する「ロボット開発」の現在地
ロボット開発のあり方が変わりつつある。事前にプログラムされた動きを正確にこなす産業用ロボットの世界の話ではない。サービスロボットと言われるような分野の話だ。ある程度、環境の変化に柔軟に対応し、プログラミングではなくロボットが自律動作して作業をこなす。最近の言い方だと「AIロボット」だろうか。従来、主に計算機上で開発を行う「モデルベース開発」はもちろん行われていた。だが仮想環境で開発しても、実装すると諸問題が発生してうまく動かない……そういうことが多かった。しかし、それが変わり始めた。精度向上によって、他の産業同様に「デジタルファースト」へと急激に変わりつつあるのだ。
もう1つは「ロボット基盤モデル」の活用である。前回のコラムでも紹介したように、End-to-Endで、さまざまな動作データを使って学習させて汎化能力を持たせた大規模ニューラルネットワーク、いわゆる基盤モデルと事後学習をうまく使うことで、これまでは不可能だったレベルで外界の変化に対応できるロボットが少なくとも研究レベルでは実現しつつある。
ヒューマノイド開発が簡単に?
エヌビディアは3月に米国で行われた自社カンファレンス「GTC 2025」で、ヒューマノイド開発向けの基盤モデル「Isaac GR00T N1」のほか、ヒューマノイド開発において学習用データの生成を容易にするための一連のワークフロー(同社では「Blueprint」と呼ぶ)、ロボット学習に最適化されたオープンソースの物理エンジン「Newton」などをまとめて発表した。つまり、事前学習された基盤モデル、さらに追加で学習を行うための一連のツールがまとめて発表されたのである。彼らが発表したツール群を組み合わせて使うことで、多自由度ロボットであるヒューマノイド開発が容易になる。
物理エンジンの「Newton」は、ロボット開発で広く使われている物理エンジン、Google DeepMindの「MuJoCo(Multi-Joint dynamics with Contact)」などとも互換性がある。恐らく上位互換となっていくのかもしれない。
なお「Isaac GR00T」という名前だが、Isaacはアイザック・ニュートンに、GR00T(グルート)はマーベル映画「ガーディアンズ・オブ・ギャラクシー」にインスパイアされた名前だ。
その「Isaac GR00T N1」のアーキテクチャは、高速で反応するための「System 1」、じっくり考えるための「System 2」を組み合わせた「デュアルシステム」となっている。要するに反射的な動作や、とりあえず「あっちの方向に腕を出す」「だいたいこういう動き」といったところまでは「System 1」でプランニングし、そこから先の細かい動作については「System 2」で対応するという戦略のようだ。
「Isaac GR00T N1」の学習には、人による動作学習データと、エヌビディアのデジタルツイン用シミュレーションプラットフォーム「Omniverse」上で作られた合成データが使われている。NVIDIA Isaac GR00T Blueprintは「Omniverse」と、やはりエヌビディアが提供している世界モデル「Cosmos」上に構築されていて、大量の合成モーションデータを生成し、高速で学習サイクルを回すことができる。
このような各種ツールをエヌビディア自体が開発して、無償で提供している。ただし使うにはエヌビディアのGPUが必要になる。ちなみに他にも、機械学習を高速化させるツールなども発表されている。
エヌビディアとしては、彼らの製品ツール群からなるエコシステムを強化することで、ロボット開発サイクルを加速し、開発コミュニティをさらにがっちりと取り込みたいということなのだろう。エヌビディアと言えば、当然のことながらGPUの話がよく出るが、彼らの本当の強みは同社のGPUと不可分の開発ツール群全体に存在しているのである。
「エヌビディア×ディズニー」でわかる開発サイクル高速化
GTCでは、1X Technologiesのヒューマノイド「NEO gamma」や、ディズニーリサーチの小型ロボット「BDXドロイド」が登場した。ディズニーのロボットは、なんと早速、東京ディズニーランドにもお目見えした。4月7日から6月30日まで、スター・ツアーズ社の所有ロボットとして「トゥモローランド」エリアをトコトコと歩いて愛嬌を振りまいているとのことだ。
公式動画以外にも、多くの動画がネット上にアップロードされている。もともと強力な知財と「出口」を持つディズニーリサーチならではの強みだが、これも立派な実用化の1つと言える。
ロボット開発者たちの見立てでは「BDXドロイド」は中国製の4脚ロボットのパーツを分解・再利用して作られたものと見られている。それにしても開発からサービス投入までのサイクルが明らかに速くなっていることには驚くほかない。ディズニーリサーチでは、やはりエンタメ目的の等身大サイズのヒューマノイド開発も行っているようだ。
エヌビディアが注力【フィジカルAIとは】
いまAI業界では主体性と自律性を持って仕事をこなすソフトウェア「AIエージェント」がブームだが、それと並行してエヌビディアらは「フィジカルAI」に力を入れ始めている。「フィジカルAI」とは、要するに「広義のロボット」のことだ。情報世界では情報世界の情報が手に入る。同様に、物理世界ではセンサーを使うことで、物理情報が手に入る。その物理情報をリアルタイムに処理して、判断し、プランニングして動ける身体を持ったAI。つまりロボットがフィジカルAIである。
ヒューマノイドは「フィジカルAI」の象徴である。かたちは別に、何でもいい。むしろこれからのロボットには、特定の身体形状に寄らないプランニングや制御能力が求められるようになるだろう。使える身体リソースや環境リソースに合わせて、プランニングし直してタスクを実行する能力、そのような力を与えるのが「基盤モデル」の役割ということになる。
産業用ロボットはもちろん、自動運転車や検査機器も「フィジカルAI」である。GTCでも、オムロンがエヌビディアのGPUを搭載した半導体向けのX線検査機器を出展した。また、すでにCTなど多くの医療検査機器にはGPUが搭載され、画像再構成やマルチモーダルデータの処理などに使われている。推論実行を行う、いわゆるエッジAIである。
「推論」に加えて、エヌビディアでは「学習」、「シミュレーション」、合わせて「3つのコンピュータ」がロボット開発には重要だという言い方をしている。開発対象はどんなロボットでも同じだ。製造や物流、モビリティや医療など、あらゆる分野の機器にAIとロボット制御技術が組み込まれ、「フィジカルAI」になるというビジョンだ。
言い方やかたちはどうあれ、そうなるだろうと筆者も思っている。ただ、当たり前のようにAI機能が普及した時代にはわざわざ「フィジカルAI」とは言わないだろう。これまでの技術は、だいたいそういう流れをたどっている。 【次ページ】エヌビディアがやたら「フィジカルAI」を連呼するワケ
関連コンテンツ
PR
PR
PR