- 2026/06/27 掲載
Google、Gemini 3.5 Flashに画面操作機能「Computer Use」を統合
Gemini APIなどを通じて自動化エージェントを構築
従来、同機能は「Gemini 2.5 Computer Use preview」という専用のスタンドアロンモデルで検証が進められていた。別個のAPI上で動作する実験的システムであったため、開発者は複数のモデルを組み合わせる必要があり、システム構造の複雑化や遅延の増大を招いていた。今回のアップデートで、Gemini 3.5 Flashの標準APIにおける組み込みツールとして宣言可能になったことで、単一モデルによるマルチツールコンポジションが実現する。
性能面では、コンピュータ操作のベンチマークである「OSWorld」において、Gemini 3.5 Flashは78.4のスコアを記録した。旧バージョンのGemini 3 Flashの65.1から向上しており、複雑なマルチステップの課題解決に対応する。
企業の業務プロセス自動化に向けた安全対策も導入した。プロンプトインジェクション攻撃を防ぐための敵対的学習を適用しているほか、機密性の高い操作や不可逆的なアクションを実行する前にユーザーの確認を要求するエンタープライズ向けの保護機能を提供する。
開発者や企業は、Gemini APIやGoogle Cloudの「Gemini Enterprise Agent Platform」を通じて同機能を利用し、ソフトウェアテストや定型業務の自動化など、多様な環境で機能するエージェントを構築する基盤を整えた。
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR