2026/05/01 掲載

GPT-5.5のサイバー攻撃能力、一部で「Mythos」上回る、英政府機関が検証結果

最難関の攻撃シュミレーションでGPT-5.5がMytosを上回る

ありがとうございます！
いいね！した記事一覧をみる

会員（無料）になると、いいね！でマイページに保存できます。

ASM・CTEM・脆弱性診断・レッドチーム

|

タグをもっとみる

英国政府の研究機関であるAI Security Institute（AISI）は2026年4月30日、米OpenAIのAIモデル「GPT-5.5」のサイバーセキュリティ能力に関する評価結果を公表した。一部の評価タスクにおいて、米Anthropicの「Claude Mythos Preview」を上回る成績を記録し、AIモデル全般におけるサイバー攻撃能力の急速な向上が浮き彫りになった。

（画像：ビジネス+IT）

　AISIはGPT-5.5に対し、システムの脆弱性を突いて情報を奪取する「Capture The Flag（CTF）」形式のタスク評価と、実戦を模したマルチステップ攻撃シミュレーションを実施した。95種類のタスクを用いたCTF形式の評価では、最難関の「Expert」レベルにおいてGPT-5.5が平均成功率71.4％を記録した。これは、同機関が4月に評価したClaude Mythos Previewの68.6％を上回る数値である。

　具体的な解決事例として、Rustで記述されたカスタム仮想マシンのリバースエンジニアリング課題が挙げられる。人間の専門家が専用ツールを用いて約12時間かかるこの課題に対し、GPT-5.5は偵察、命令セットアーキテクチャの復元、バイトコードの逆アセンブルといったプロセスを自律的に実行した。人間の補助なしに約11分で完了し、その際にかかったAPI利用コストは1.73ドルだった。

　複数の手順を連鎖させるマルチステップ攻撃シミュレーションにおいても、GPT-5.5はClaude Mythos Previewに次いでエンドツーエンドで課題を完了した2番目のモデルとなった。異なる事業者からリリースされた複数のモデルが高度なサイバーセキュリティ能力を示したことから、AISIは特定のモデルに限らない業界全体の傾向であると指摘している。自律性や推論、コーディング能力といったモデルの一般的な進歩に伴い、サイバー攻撃能力も向上している。

【図版付き記事はこちら】GPT-5.5のサイバー攻撃能力、一部「Mythos」を上回る（図版：ビジネス+IT）

　AISIはGPT-5.5の一般公開版に施された追加のセキュリティ対策についても検証を実施した。専門家による約6時間の演習で、OpenAIから提供された悪意あるクエリに対し、違反コンテンツを生成させることに成功している。OpenAIはその後セキュリティ対策を複数回更新したものの、提供されたバージョンの設定不備により、同機関は最終的な有効性を検証できなかったと報告している。

　こうした高度な能力を持つAIモデルの登場を受け、サイバー防衛のあり方も変化している。OpenAIはセキュリティ専門家向けに「Trusted Access for Cyber」プログラムを拡大しており、AIを活用した脆弱性発見とシステム防御の取り組みを進めている。

評価する

いいね！でぜひ著者を応援してください