2025/12/28 09:42 掲載

AI時代の新たな脅威「プロンプトインジェクション」ChatGPTが安全対策を強化

悪意のある行動をAIに実行させる手法、完全解決は困難との認識

ありがとうございます！
いいね！した記事一覧をみる

会員（無料）になると、いいね！でマイページに保存できます。

AI・生成AI

|

タグをもっとみる

OpenAIはAI統合型Webブラウザ「ChatGPT Atlas」におけるプロンプトインジェクション攻撃への対策を説明し、完全解決が困難であるとの認識を示した。高度化する攻撃に対して自動化されたレッドチーミングや強化学習を用いた防御サイクルを構築し、発見から対策実装までの高速対応を進めている。現実世界のリスク低減を目指すものの、プロンプトインジェクションはWeb上の詐欺やソーシャルエンジニアリングと同様に根絶が難しい長期的課題とされる。ユーザー向けには操作時の注意喚起も行っている。

AI時代の新たな脅威「プロンプトインジェクション」ChatGPTが安全対策を強化の画像

ChatGPT Atlasは2025年10月に一般公開されたAIブラウザで、ユーザーに代わってWebページの閲覧やフォーム操作などを行う「エージェントモード」を核心機能として持つ。この特性は便利さを提供する一方で、従来のブラウザとは異なる攻撃面を生むとOpenAIは説明している。エージェントが幅広い操作権限を持つため、プロンプトインジェクションの成功がユーザー操作の誤実行やデータ漏洩につながるリスクが高まると指摘されている。

OpenAIはプロンプトインジェクションの**「完全な解決は難しい」**との見解を示した。同社はこれを、Web上の詐欺やソーシャルエンジニアリングが巧妙化し続けるのと同様に根絶が困難な長期的課題と位置付けている。攻撃者がAIエージェントに意図しない命令を紛れ込ませる可能性は、構造的な性質として現状では完全に封じることはできないという。

こうした状況を踏まえ、OpenAIは自動化されたレッドチーミングを導入している。これは強化学習で訓練した「自動攻撃者」と呼ばれるAIシステムを用い、Atlasへの攻撃パターンを高速かつ大規模に探索し、そこから得られた脆弱性情報をもとに防御策を迅速に実装する仕組みである。自動攻撃者が生成した高度な攻撃シナリオに対して、敵対的訓練を施した新しいモデルチェックポイントや追加の防御策をユーザー環境に提供し、継続的な防御強化サイクルを形成している。

OpenAIはこうした高速対応ループ（迅速な対応サイクル）について、発見された攻撃手法を学習しモデル自体を改良することで現実世界のリスクを下げることを目標としていると説明した。対策の一環としてユーザー向けの注意事項も示している。具体的には、重要操作時にはログアウトモードでの利用を検討することや、確認プロンプトを慎重に確認すること、曖昧な広範な指示を避けることなどが推奨されている。

また、複数のセキュリティ報道では、AtlasのようなAIブラウザ全般において、プロンプトインジェクションのリスクが依然として消えないというOpenAIの発信が海外でも広く報じられている。OpenAIはプロンプトインジェクションを「AIブラウザが直面する深刻で継続的な脅威」と位置付け、その防御策を強化しながらも、完璧な安全性の保証には至っていないとの立場を示している。

このように、ChatGPT Atlasに対するセキュリティ対策は進展しているものの、プロンプトインジェクションのような深層的な攻撃パターンの排除は依然として困難であり、OpenAIは長期的な取り組みとして防御技術の強化と実装を続けている。

いいね！でぜひ著者を応援してください

ありがとうございます！
いいね！した記事一覧をみる

会員（無料）になると、いいね！でマイページに保存できます。

共有する

関連タグタグをフォローすると最新情報が表示されます

AI・生成AIの関連コンテンツ

記事

AI・生成AI

AI時代の新たな脅威「プロンプトインジェクション」ChatGPTが安全対策を強化

AI・生成AIのおすすめコンテンツ

米ServiceNow、AIセキュリティ企業Armisを77.5億ドルで買収

【特集】AIセキュリティ最前線

すべてのサイバー攻撃を完全に検知&保護、英国検査機関が認めたAIセキュリティの実力

物知りなだけで満足する人は、AI時代に評価されない…“知的メタボ”解消法

【GAFAM最新決算比較】マイクロソフト・AWS圧勝？市場が見抜く「AI投資」の決定差

AI・生成AIの関連コンテンツ

【最強入門】API課金なし…ローカルLLMは「無限に頼める作業員」、ハマる仕事の3条件

Claudeと「最強タッグ」の低価格LLMは？「高品質＆低コスト」併用法を60回のガチ検証

「これ何だっけ」が即解決する時代へ…ChatGPTが破壊した「情報アクセス格差」の正体

【注目】日清食品グループ「生成AI活用推進」、2年で「延べ受講者1万名」の教育の中身

幹部30名超に対面説得…JR西日本に生成AIを定着させた「社員の心の動かし方」

AIに選ばれない商品は見つけてもらえない！？博報堂が語る“新しい買い物体験”の衝撃

NiCE World Japan 2026 大阪

NiCE World Japan 2026 大阪

AIロープレの検討・導入で押さえるべき4つの観点

AIロープレの検討・導入で押さえるべき4つの観点

AI組織定着実践講座

AI組織定着実践講座

AI時代の新たな脅威「プロンプトインジェクション」ChatGPTが安全対策を強化

AI・生成AIのおすすめコンテンツ

米ServiceNow、AIセキュリティ企業Armisを77.5億ドルで買収

【特集】AIセキュリティ最前線

すべてのサイバー攻撃を完全に検知&保護、英国検査機関が認めたAIセキュリティの実力

物知りなだけで満足する人は、AI時代に評価されない…“知的メタボ”解消法

【GAFAM最新決算比較】マイクロソフト・AWS圧勝？市場が見抜く「AI投資」の決定差

AI・生成AIの関連コンテンツ

【最強入門】API課金なし…ローカルLLMは「無限に頼める作業員」、ハマる仕事の3条件

Claudeと「最強タッグ」の低価格LLMは？「高品質＆低コスト」併用法を60回のガチ検証

「これ何だっけ」が即解決する時代へ…ChatGPTが破壊した「情報アクセス格差」の正体

【注目】日清食品グループ「生成AI活用推進」、2年で「延べ受講者1万名」の教育の中身

幹部30名超に対面説得…JR西日本に生成AIを定着させた「社員の心の動かし方」

AIに選ばれない商品は見つけてもらえない！？博報堂が語る“新しい買い物体験”の衝撃

NiCE World Japan 2026 大阪

NiCE World Japan 2026 大阪

AIロープレの検討・導入で押さえるべき4つの観点

AIロープレの検討・導入で押さえるべき4つの観点

AI組織定着 実践講座

AI組織定着 実践講座

AI組織定着実践講座

AI組織定着実践講座