- 2025/06/26 掲載
グーグル提唱AIは「経験の時代」に突入、今後「自己進化」を続けたらどうなるのか?
バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作ソフト、3Dソフト、ゲームエンジンを活用した「リアルタイム・プロダクション」の実験的取り組みでVRコンテンツを制作、英語圏の視聴者向けに配信。YouTubeではVR動画単体で再生150万回以上を達成。最近購入したSony a7s3を活用した映像制作も実施中。
http://livit.media/

AIが実世界との相互作用を通じて自己改善を図る時代
著名なAI研究者であるデービッド・シルバー氏(グーグル・ディープマインド、UCL)とリチャード・サットン氏(アルバータ大学)が発表した新しい論文では、AIシステムが人間から提供されるデータへの依存度を低下させ、実世界との相互作用を通じて自己改善を図る時代の到来が近いことが示唆された。両氏は、AIの発展における重要な転換点として「経験の時代(Era of Experience)」という概念を提唱している。この新たな段階では、AIシステムは静的な人間提供データからの学習に頼るのではなく、環境との相互作用を通じて自らデータを生成し、継続的に改善していく仕組みへと移行する。
現在のAIの成功事例、たとえばChatGPTのようなチャットボットやレコメンドエンジンは、シルバー氏とサットン氏が「人間データの時代」と呼ぶ段階で構築されたものだ。これらのシステムは、人間が生成した膨大なコンテンツを学習することで、詩の執筆からコーディング、医療診断、法的文書の作成まで、多様なタスクを実行できるようになった。
しかし、人間のデータのみに依存するアプローチには根本的な限界が存在する。同論文が指摘するように、人間がすでに知っていることを学習するだけでは「多くの領域で超人的な知能を達成することはできない」。また、高度な数学、ソフトウェアコーディング、科学研究などの分野では、高品質な人間データは有限であり、急速に枯渇しつつある。
「経験の時代」では、AIエージェントは試行錯誤を通じて独自の訓練データを作成する。シルバー氏とサットン氏によれば、これは「経験が改善の主要な媒体となり、最終的には今日のAIで使用される人間データの規模を圧倒する」フィードバックループへの移行を意味するという。
この概念は単なる理論ではない。実際、ディープマインドのAlphaProofシステムは、国際数学オリンピックで初めてメダルを獲得したAIとして、 また人間の学習と大量の自己対戦を組み合わせた実例として注目を集めている。約10万件の人間が書いた証明を学習した後、AlphaProofの強化学習アルゴリズムは定理証明環境との継続的な相互作用を通じて、独自に1億件の追加証明を生成した。
さらに、2025年5月のGoogle I/Oでは、Gemini/ 2.5/ Proが「world model(世界モデル)」に進化する構想が発表された。これはAIが物理法則や状況を内部的にシミュレートし、計画・想像を行う能力を備える方向性であり、「経験の時代」を支える技術的土台として位置づけられている。

アクティブAIエージェントの重要性
AIが実世界との相互作用を通じて自己改善を図るには、アクティブAIエージェントが重要な存在となる。現在主流のAIシステムの多くは、質問に答えたり、要求された際に推奨事項を提供したりする受動的な役割にとどまっている。しかし「経験の時代」では、AIは自律的なエージェントとして能動的な役割を担うようになる。
既存のAIチャットボットとアクティブAIエージェントの最大の違いは、行動能力の有無にある。現在のAIシステムは、テキストインターフェースを通じた対話や、人間が実行すべき提案を行うという非常に限定的なチャネルでしか世界と相互作用できない。対照的に、「経験の時代」のAIは、いわば「手と目」を備えることになる。エージェントはデジタル環境で直接行動を起こし、その結果を観察できるようになり、人間の仲介者に頼る必要がなくなるのだ。
具体的にどのような形になるのか。メールの下書きだけでなく、カレンダーへのログイン、会議のスケジュール設定、プロジェクト管理システムへの更新投稿、取引の実行まで、許可さえあれば独自に実行できるAIがその例となる。
実際、OpenAIやAnthropicは、人間のユーザーと同様にコンピューターのユーザーインターフェースを操作するエージェントを開発している。ブラウザを開き、ボタンをクリックし、コードを記述して実行するなど、自然言語で与えられた目標を達成するための行動を取ることが可能なAIシステムだ。
さらに、グーグルは2025年5月のイベントで、Project AstraやProject Marinerを通じて、エージェントがビデオ認識、ブラウザ操作、複数タスクの自律的実行を行う様子を公開。これにより、AIがより人間に近い環境理解・行動力を備える段階に入ったことが示された。
重要なのは、これらの自律的な行動が「人間向け」と「機械向け」の両方の操作モードにまたがり、実行されている点だ。人間向けの行動とは、自然言語での説明生成、GUI使用、ダッシュボード表示など、人間がコミュニケーションを取ったりシステムを使用したりする方法に適合するものを指す。一方、機械向けの行動は、APIの呼び出し、データベースへのクエリ、コードの直接実行といった舞台裏での動作を意味する。
たとえば、AIカスタマーサービスエージェントは、顧客とチャットで問題を理解しながら、同時に企業データベースから顧客の注文履歴を取得し、返金プロセスを自動的に開始することができる。これらがすべて人間の介入なしに実行されるのだ。 【次ページ】既存のリワードシステムの限界
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR