- 2026/05/14 掲載
Google DeepMindが発表、AGIが人並みになるための「10の能力」
AGIが人間の知性に到達するために足りないものとは?
AGIが人間並みになるために必要な「10の認知能力」
Google DeepMindが発表した論文「Measuring Progress Toward AGI: A Cognitive Framework」に基づく本フレームワークは、人工知能の知能を「知覚」「生成」「注意」「学習」「記憶」「推論」「メタ認知」「実行機能」「問題解決」「社会的認知」という10の独立した認知能力に分解して定義している。従来のベンチマークテストを用いた一元的な評価手法では、AIが学習データの暗記に基づくパターンマッチングで回答しているのか、真の論理的推論によって導き出しているのかを判別することが困難であった。例えば、コーディングタスクにおいて推論能力が高く記憶能力が低ければ論理的に導出していると評価でき、逆であればパターンマッチングに依存していると判断できる。今回のフレームワークは、各タスクがどの認知能力を要求するかを細分化して個別に測定することで、暗記によるベンチマーク汚染を検出し、モデルの真の実力を測る設計となっている。また同社の研究では、現在の最先端AIモデルが人間のように各認知能力をバランスよく発達させているわけではなく、評価軸によって能力水準が極端に変動する「凸凹な認知プロファイル」を持つことが事実として示された。
この特性を複数の指標で可視化することにより、現在のAIが弱点とする領域を明確化し、プロダクト設計や今後の開発における注力分野を特定することが可能になる。これは、2023年に同社が発表した段階的な「Levels of AGI」による分類から一歩進み、多軸的なプロファイリングへと評価基準を成熟させるものである。
さらにGoogle DeepMindは本発表に合わせて、データ分析プラットフォームのKaggleと連携したグローバルハッカソンを開始した。「学習」「メタ認知」「注意」「実行機能」「社会的認知」の5つの認知能力領域に焦点を当て、真の理解力を測定するための新しい評価指標の設計を世界の開発者から募っている。
このコンペティションには総額20万ドルの賞金が設定されており、提出期間を経て2026年6月に結果が発表される。こうした多軸的アプローチの導入は、これまで抽象的な議論にとどまっていたAGI到達への進捗評価を、具体的な数値と科学的根拠に基づく実証的な測定へと移行させる枠組みである。
AGIが人間レベルになるには何が足りないのか?
AGIが人間レベルの知性に到達するには、現在のAIシステムが抱える深刻なボトルネックの解消が不可欠である。まず解決すべきは、ある領域で超人的な能力を発揮しながら別の平易なタスクで幼児以下となる能力の不規則な分布、すなわち「ギザギザな能力(Jaggedness)」の解消である。大量の訓練データが存在する読み書きや数学では高い熟練度を見せる一方、人間にとって自明な基本的認知タスクで失敗する現状は、能力の全体的な底上げが急務であることを示している。また、「長期記憶の欠如」も致命的な課題である。現在のモデルは事実上の「記憶喪失」状態にあり、インタラクションのたびに文脈を再学習しなければならない。巨大なコンテキストウィンドウや外部検索ツールは一時的な補完に過ぎず、真の意味で動的な経験的記憶の代用とはなり得ていない。
さらに、システムが自身の知識の境界を把握する「メタ認知能力」も不完全であり、自分が「何を知っていて、何を知らないか」を正確に評価する能力に不足している。これはもっともらしい嘘を自信満々に出力するハルシネーションの問題が実社会における安全な運用の障壁となっている。
また「物理的・空間的な推論能力」の不足も顕著である。抽象的な論理展開には強いが、幼児レベルでも直感的に理解できる「物理法則」の把握や、複雑な環境での「空間把握」には限界が見られる。
また「社会的認知」の面でも、言語の流暢さはあっても、他者の意図や皮肉を読み取る「心の理論」の実装には依然として課題が残る。加えて、訓練データにない「未知の状況への適応力」も低く、推論と学習を並行させながら世界モデルを更新し続ける継続的学習のアーキテクチャは、計算リソースの制約もあり未解決のままである。
これらの諸課題は、単なるベンチマークスコアの向上では解決し得ない性質のものであり、人間の認知メカニズムに肉薄する根本的な技術的ブレイクスルーが達成されて初めて、真の汎用知能への道が開かれることとなる。
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR