2026/02/25 掲載

米Anthropic、中国AI企業3社による大規模な「蒸留攻撃」を報告

AIモデルの出力結果や推論プロセスを大量に取得、自社のモデルの訓練データとして盗用する手法

ありがとうございます！
いいね！した記事一覧をみる

会員（無料）になると、いいね！でマイページに保存できます。

AI・生成AI

|

タグをもっとみる

米Anthropicは、中国のAI企業であるDeepSeek、Moonshot AI、MiniMaxの3社が、自社のAIモデル「Claude」に対して大規模な「蒸留攻撃」を実施したと発表した。「蒸留攻撃」とは、高度なAIモデルへの出力結果や推論プロセスを大量に取得、自社モデルの訓練データとして使用する行為のこと。約2万4000の不正アカウントを通じて1600万回以上のやり取りが行われ、モデルの高度な推論能力や思考プロセスが不正に抽出された。同社はこれを重大な規約違反とし、技術流出や国家安全保障上のリスクを警告している。

（画像：ビジネス+IT）

　米国のAI開発企業Anthropicは2026年2月23日、中国の主要AI企業であるDeepSeek、Moonshot AI、MiniMaxの3社が、自社の最先端AIモデル「Claude」の能力を不正に抽出する「蒸留攻撃」を組織的かつ大規模に実施したと発表した。蒸留攻撃とは、高性能なAIモデルの出力結果や推論プロセスを大量に取得し、自社のモデルの訓練データとして利用することで、開発期間とコストを大幅に削減する手法を指す。

【画像付き記事全文はこちら】Anthropicが報告「中国AI企業による蒸留攻撃」

Anthropicが報告「中国AI企業による蒸留攻撃」

（図版：ビジネス+IT）

　Anthropicの報告によると、これら3社は同社の利用規約および中国からのアクセスを制限する地域的ブロックを意図的に回避した。具体的には、商用のプロキシサービスや非公認の転売業者を利用して身元を偽装し、約2万4000件の不正アカウントのネットワークを構築した。そして、Claudeに対して1600万回以上に及ぶプロンプト送信を実行し、モデルの能力を抽出した。

　抽出されたデータには、Claudeが複雑な問題を解決する際の内部的な論理的思考プロセスをステップバイステップで書き出させたものが含まれる。また、自社の強化学習プロセスにおいてClaudeを評価者として無断利用し、人間の専門家による評価コストを代替する目的でも悪用された。さらに、中国の検閲ルールを遵守しつつ高品質な回答を生成するためのデータ収集も確認されている。

　同様の被害はOpenAIに対しても行われている。OpenAIは米下院特別委員会への資料において、DeepSeekなどがプログラムを用いた自動抽出手法やサードパーティルーターによる難読化を駆使し、継続的なデータ抽出を行っていると報告した。これらは合成データの生成や強化学習スタイルの最適化を組み合わせた多段階のパイプラインに進化している。

　これに対し、DeepSeek側は自社の技術論文において、モデルの事前学習にはWebページや電子書籍のみを使用し、合成データは意図的に組み込んでいないと主張している。ただし、収集したWebデータ内に他社の強力なモデルが生成したテキストが大量に含まれていたことは認めている。

　米国企業側は一連の行為を偶発的なデータ混入ではなく、高度に組織化された意図的な技術盗用であると非難している。Anthropicは、APIトラフィックから攻撃パターンを識別する分類システムを構築するなどの防衛策に多額の投資を行いつつ、業界全体や政策立案者に対して、国家安全保障上の懸念と技術流出のリスクに向けた協調的な対応を強く呼びかけている。

Googleで見つけやすく

評価する

いいね！でぜひ著者を応援してください