• 会員限定
  • 2026/02/04 掲載

Google、「Gemini 3 Flash」に高精度な画像分析機能「Agentic Vision」を追加

人が画像を確認する際にズームインするように、AIが自律的に対象を検査することが可能に

1
会員(無料)になると、いいね!でマイページに保存できます。
Googleは2026年1月27日、生成AIモデル「Gemini 3 Flash」に新たな画像分析機能「Agentic Vision」を追加したと発表した。従来の一回限りの画像読み取りとは異なり、AIが自らPythonコードを実行して画像の拡大や注釈付けを行い、細部を能動的に再検査する仕組みを導入した。この「思考、実行、観察」のループにより、視覚ベンチマークにおいて品質が5~10%向上したとしている。
photo
(画像:Google)
 Googleは、同社の軽量AIモデル「Gemini 3 Flash」に対し、視覚推論とコード実行を組み合わせた新機能「Agentic Vision」を実装した 。従来のマルチモーダルモデルは、画像を静的な対象として一度だけスキャンして処理する手法が一般的であったため、例えば小さなシリアル番号や遠方の標識といった細部を見落とした場合、推測に頼らざるを得ないという課題があった。今回導入されたAgentic Visionは、画像理解を静的な処理から能動的な調査プロセスへと転換するものである。

画像
画像を自動でズームして細部を確認する(画像:Google)

 Agentic Visionでは画像を精査するため「Think(思考)、Act(実行)、Observe(観察)」というループ処理を行う 。AIモデルはまずユーザーの指示と画像を分析し(Think)、Pythonコードを生成・実行して画像の切り出し、回転、注釈付け、計算などを行う(Act) 。その結果得られた新しい画像の情報はAIモデルのコンテキストに追加され、より詳細な情報に基づいて最終的な画像についての回答が生成される(Observe)。このプロセスにより、人間が画像の詳細を確認するためにズームインするように、AIが自律的に対象を検査することが可能となった。

 具体的な活用例として、Googleは「視覚的なスクラッチパッド(メモ帳)」としての利用を挙げている 。例えば、画像内の物体の数を数えるタスクにおいて、AIは認識した対象一つひとつに境界線や番号を描画し、視覚的にマーキングを行うことで、数え間違いや重複を防止する。また、建築図面の検証などの高解像度画像を用いるケースでは、特定のセクションを切り出して反復的に検査することで、複雑な基準への適合性を確認できるとしている。さらに、高密度な表データを解析し、Python環境で決定論的な計算を行うことで、グラフ描画などの視覚化タスクにおけるハルシネーション(もっともらしい誤り)を低減させることも可能である。

 Googleによると、このコード実行機能の有効化により、主要な視覚ベンチマーク全体で一貫して5~10%の品質向上が確認された 。Agentic Visionは現在、Google AI StudioおよびVertex AIのGemini APIを通じて利用可能であり、Geminiアプリにおいても順次展開が開始されている。同社は今後、ウェブ検索や逆画像検索といったツールの統合や、Flash以外のモデルサイズへの機能拡大も計画している。

評価する

いいね!でぜひ著者を応援してください

  • 1

会員(無料)になると、いいね!でマイページに保存できます。

共有する

  • 0

  • 0

  • 0

  • 0

  • 1

  • 0

関連タグ タグをフォローすると最新情報が表示されます
あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

基本情報公開時のサンプル画像
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます

基本情報公開時のサンプル画像