2026/06/27 掲載

Google、Gemini 3.5 Flashに画面操作機能「Computer Use」を統合

Gemini APIなどを通じて自動化エージェントを構築

ありがとうございます！
いいね！した記事一覧をみる

会員（無料）になると、いいね！でマイページに保存できます。

AI・生成AI

|

タグをもっとみる

Googleは2026年6月24日、AIモデル「Gemini 3.5 Flash」に、画面を認識して自律的に操作を実行する機能「Computer Use」を統合したと発表した。これまで独立したプレビュー版として提供していた機能を主力軽量モデルに組み込み、開発者はGemini APIなどを通じてブラウザやデスクトップ環境における自動化エージェントを構築できるようになった。

（画像：ビジネス＋IT）

　AIエージェントが人間の物理的な入力プロセスを模倣し、画面情報を視覚的に認識しながらOSやアプリケーションを操作する「Computer Use」技術が、Geminiの標準機能として実装された。Google DeepMindの開発した「Gemini 3.5 Flash」は高効率な軽量モデルであり、本機能の統合により、AIが自ら画面の要素を解釈し、マウスクリックやキーボード入力といったアクションを生成して実行環境に引き渡す処理をシームレスに行う。

　従来、同機能は「Gemini 2.5 Computer Use preview」という専用のスタンドアロンモデルで検証が進められていた。別個のAPI上で動作する実験的システムであったため、開発者は複数のモデルを組み合わせる必要があり、システム構造の複雑化や遅延の増大を招いていた。今回のアップデートで、Gemini 3.5 Flashの標準APIにおける組み込みツールとして宣言可能になったことで、単一モデルによるマルチツールコンポジションが実現する。

【図版付き記事はこちら】Google、Gemini 3.5 FlashにPC画面操作のComputer Use標準搭載（画像：ビジネス＋IT）

　性能面では、コンピュータ操作のベンチマークである「OSWorld」において、Gemini 3.5 Flashは78.4のスコアを記録した。旧バージョンのGemini 3 Flashの65.1から向上しており、複雑なマルチステップの課題解決に対応する。

　企業の業務プロセス自動化に向けた安全対策も導入した。プロンプトインジェクション攻撃を防ぐための敵対的学習を適用しているほか、機密性の高い操作や不可逆的なアクションを実行する前にユーザーの確認を要求するエンタープライズ向けの保護機能を提供する。

　開発者や企業は、Gemini APIやGoogle Cloudの「Gemini Enterprise Agent Platform」を通じて同機能を利用し、ソフトウェアテストや定型業務の自動化など、多様な環境で機能するエージェントを構築する基盤を整えた。

いいね！でぜひ著者を応援してください

ありがとうございます！
いいね！した記事一覧をみる

会員（無料）になると、いいね！でマイページに保存できます。

共有する

関連タグタグをフォローすると最新情報が表示されます

AI・生成AIの関連コンテンツ

記事

AI・生成AI

Google、Gemini 3.5 Flashに画面操作機能「Computer Use」を統合

AI・生成AIのおすすめコンテンツ

Geminiに“AI家庭教師”が爆誕…ノートをアップするだけで弱点診断・ミニ授業まで生成

Geminiは暴動、GPTは餓死、Grokは犯罪、AIモデル版「シムシティ」がヤバすぎた

【神ワザ5選】Gemini×NotebookLM連携が凄い…仕事が超ラクになる設定・全手順詳説

【汎用型業務用エージェント比較】Google、MS、OpenAIなど4ツールの違いとは？

【保存版】Claude Codeの性能を数倍引き出す「文脈設計」10の実践術

AI・生成AIの関連コンテンツ

AIファーストと“相性最悪”の会社とは？導入が裏目に出る「3つの特徴」

【今日からできる】“全部入りAI”Gensparkで副業デビュー…初心者必見「AI副業3選」

【ガートナー解説】せっかくの「AI導入がムダ」に終わる罠、成功企業96％の「共通点」

経営を直撃する「BIS50％ルール」…手作業の罠から抜け出す“最強コンプラ術”

AIエージェントで「月100時間」の経理作業が消滅？「2つの解決策」を解説

なぜ現場はAIエージェントを「拒む」のか？ 412名調査で浮き彫りになった「ある格差」

Claude初級活用講座

Claude初級活用講座

製造業に特化した生成AI活用の実践講座：講師髙橋和馬

製造業に特化した生成AI活用の実践講座：講師髙橋和馬

「ブラウザ操作AIエージェント」で実現する、現場主導の業務効率化

「ブラウザ操作AIエージェント」で実現する、現場主導の業務効率化

Google、Gemini 3.5 Flashに画面操作機能「Computer Use」を統合

AI・生成AIのおすすめコンテンツ

Geminiに“AI家庭教師”が爆誕…ノートをアップするだけで弱点診断・ミニ授業まで生成

Geminiは暴動、GPTは餓死、Grokは犯罪、AIモデル版「シムシティ」がヤバすぎた

【神ワザ5選】Gemini×NotebookLM連携が凄い…仕事が超ラクになる設定・全手順詳説

【汎用型業務用エージェント比較】Google、MS、OpenAIなど4ツールの違いとは？

【保存版】Claude Codeの性能を数倍引き出す「文脈設計」10の実践術

AI・生成AIの関連コンテンツ

AIファーストと“相性最悪”の会社とは？導入が裏目に出る「3つの特徴」

【今日からできる】“全部入りAI”Gensparkで副業デビュー…初心者必見「AI副業3選」

【ガートナー解説】せっかくの「AI導入がムダ」に終わる罠、成功企業96％の「共通点」

経営を直撃する「BIS50％ルール」…手作業の罠から抜け出す“最強コンプラ術”

AIエージェントで「月100時間」の経理作業が消滅？ 「2つの解決策」を解説

なぜ現場はAIエージェントを「拒む」のか？ 412名調査で浮き彫りになった「ある格差」

Claude初級活用講座

Claude初級活用講座

製造業に特化した生成AI活用の実践講座：講師 髙橋和馬

製造業に特化した生成AI活用の実践講座：講師 髙橋和馬

「ブラウザ操作AIエージェント」で実現する、現場主導の業務効率化

「ブラウザ操作AIエージェント」で実現する、現場主導の業務効率化

AIエージェントで「月100時間」の経理作業が消滅？「2つの解決策」を解説

製造業に特化した生成AI活用の実践講座：講師髙橋和馬

製造業に特化した生成AI活用の実践講座：講師髙橋和馬