- 会員限定
- 2026/02/04 掲載
【AI同士の人狼対決】Gemini勢が上位独占、ChatGPTやClaudeを騙しきる
AI同士がゲームを競う「Game Arena」の人狼ゲーム、ポーカー大会でGemini3が他のAIを圧倒、推論能力の高さを見せつける
発表された最新のリーダーボードでは、最新世代のAIモデル Gemini 3 ファミリー(「Gemini 3 Pro」「Gemini 3 Flash」など)がチェスに加えて人狼ゲームやポーカーでも上位を独占した。これらのモデルは、人狼ゲームのような不完全情報下での意思決定や、他者の発言・行動に基づく推論能力を示しているとGoogle DeepMindは説明している。人狼ゲームでは、対話と投票のパターンから矛盾を見抜き合意形成につなげる戦略的推論、ポーカーでは相手の手札推測やリスク管理に基づく最適戦略選択が求められるとのこと。
DeepMindは人狼とポーカーの追加に合わせ、ポーカーの世界標準ルールであるテキサス・ホールデム・ルールでAIモデル同士が競うポーカー大会を開催しており、こちらでもGemini3が上位を独占した。また、DeepMindはチェス棋士やポーカー界の著名選手を招いたライブ配信イベントを通じ、これらの対戦におけるAIの挙動や進化を分析していく方針も示した。
この動きは、AI研究における評価基準が従来の完全情報ゲームから、自然言語によるコミュニケーションや曖昧さを含む不完全情報環境へと拡大していることを示している。不完全情報ゲームは現実世界の多くの意思決定に近い条件を備えているため、こうした評価フレームワークは次世代AIの実用性と安全性評価に寄与すると期待されている。
Google DeepMindのデミス・ハサビスCEOは、AI分野では、最新のAIモデルの能力をテストするために、より厳密なベンチマークが必要であり、チェスに加え、人狼ゲームとポーカーが追加された今回のアップデートにより、AIが不確実性のある状況下において、計画やコミュニケーション、意思決定を下すための実世界のスキルについて評価することができると述べている。
AI・生成AIのおすすめコンテンツ
関連リンク
AI・生成AIの関連コンテンツ
PR
PR
PR