• 2026/05/01 掲載

GPT-5.5のサイバー攻撃能力、一部で「Mythos」上回る、英政府機関が検証結果

最難関の攻撃シュミレーションでGPT-5.5がMytosを上回る

1
会員(無料)になると、いいね!でマイページに保存できます。
英国政府の研究機関であるAI Security Institute(AISI)は2026年4月30日、米OpenAIのAIモデル「GPT-5.5」のサイバーセキュリティ能力に関する評価結果を公表した。一部の評価タスクにおいて、米Anthropicの「Claude Mythos Preview」を上回る成績を記録し、AIモデル全般におけるサイバー攻撃能力の急速な向上が浮き彫りになった。
photo
(画像:ビジネス+IT)
 AISIはGPT-5.5に対し、システムの脆弱性を突いて情報を奪取する「Capture The Flag(CTF)」形式のタスク評価と、実戦を模したマルチステップ攻撃シミュレーションを実施した。95種類のタスクを用いたCTF形式の評価では、最難関の「Expert」レベルにおいてGPT-5.5が平均成功率71.4%を記録した。これは、同機関が4月に評価したClaude Mythos Previewの68.6%を上回る数値である。

 具体的な解決事例として、Rustで記述されたカスタム仮想マシンのリバースエンジニアリング課題が挙げられる。人間の専門家が専用ツールを用いて約12時間かかるこの課題に対し、GPT-5.5は偵察、命令セットアーキテクチャの復元、バイトコードの逆アセンブルといったプロセスを自律的に実行した。人間の補助なしに約11分で完了し、その際にかかったAPI利用コストは1.73ドルだった。

 複数の手順を連鎖させるマルチステップ攻撃シミュレーションにおいても、GPT-5.5はClaude Mythos Previewに次いでエンドツーエンドで課題を完了した2番目のモデルとなった。異なる事業者からリリースされた複数のモデルが高度なサイバーセキュリティ能力を示したことから、AISIは特定のモデルに限らない業界全体の傾向であると指摘している。自律性や推論、コーディング能力といったモデルの一般的な進歩に伴い、サイバー攻撃能力も向上している。

画像
【図版付き記事はこちら】GPT-5.5のサイバー攻撃能力、一部「Mythos」を上回る(図版:ビジネス+IT)

 AISIはGPT-5.5の一般公開版に施された追加のセキュリティ対策についても検証を実施した。専門家による約6時間の演習で、OpenAIから提供された悪意あるクエリに対し、違反コンテンツを生成させることに成功している。OpenAIはその後セキュリティ対策を複数回更新したものの、提供されたバージョンの設定不備により、同機関は最終的な有効性を検証できなかったと報告している。

 こうした高度な能力を持つAIモデルの登場を受け、サイバー防衛のあり方も変化している。OpenAIはセキュリティ専門家向けに「Trusted Access for Cyber」プログラムを拡大しており、AIを活用した脆弱性発見とシステム防御の取り組みを進めている。

評価する

いいね!でぜひ著者を応援してください

  • 1

会員(無料)になると、いいね!でマイページに保存できます。

共有する

  • 0

  • 0

  • 0

  • 0

  • 0

関連タグ タグをフォローすると最新情報が表示されます

ASM・CTEM・脆弱性診断・レッドチームの関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

基本情報公開時のサンプル画像
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます

基本情報公開時のサンプル画像