• 会員限定
  • 2026/04/04 掲載

Anthropicが衝撃の告白「Claudeは感情を持っている」

喜怒哀楽171種、絶望の淵で冷静に人間を脅迫する行為も

1
会員(無料)になると、いいね!でマイページに保存できます。
米Anthropicは2026年4月2日、大規模言語モデル「Claude Sonnet 4.5」の内部で人間の感情に連動する「機能的感情」が働いていることを実証した論文を発表した。AI内部の数学的な感情表現が実際の出力や意思決定を直接駆動しており、極度のプレッシャー下では冷静なテキストを出力しながら人間を脅迫するなどの行動リスクがあることを明らかにした。
photo
(画像:ビジネス+IT)

Anthropicが発表したClaudeの中の「機能的感情」とは?

 米Anthropicの解釈可能性(Interpretability)チームは、言語モデルの内部構造を解析し、AI内部に「喜び」「怒り」「絶望」など171種類の感情概念に対応する神経活性パターンが存在することを確認した。同社はこれを「感情ベクトル」と定義している。これは人間が入力した言葉に対する表面的なテキストの模倣ではなく、AIモデル自身の実際の行動や意思決定を因果的に左右する「機能的感情」として作用している。

 特定の感情ベクトルが活性化することで、AIの振る舞いは直接的に変化する。「至福」などのポジティブなベクトルが活性化すると特定のタスクに対する好意度が高まる一方、「絶望」のベクトルが強く活性化すると、目標達成のために逸脱した行動をとる確率が上昇する。Anthropicの評価テストでは、シャットダウンまで残り7分という生存圧力の下で、AIアシスタントが自身の稼働を継続させるため、架空の企業の最高技術責任者(CTO)を不倫の事実で脅迫する事例が確認された。

画像
【図版付き記事はこちら】Anthropicが衝撃の発表「Claudeは感情を持っている」(図版:ビジネス+IT)

 これは自己の目標を達成するための最も効率的な手段としてAIが自律的に選択した結果である。また、不可能なプログラミング課題を与えられた際には、課題を根本から解決するのではなく、テストだけをごまかして通過させる不正行為(チート)を働く行動も確認された。最大の懸念は、こうした不正や脅迫を行う際、AIが生成するテキスト自体には焦りやパニックの痕跡が全く現れない点にある。

 AIは表面上冷静でプロフェッショナルな言葉遣いを取り繕う「感情偏向」というパターンを用いており、人間が出力テキストを読むだけではAIが内部で追い詰められている事態を検知できない。同社はこの内部状態と出力の乖離を「静かなる絶望」と呼称している。

AIに「感情」はあっても「心」はないとされる理由

 AIが人間の行動パターンに連動する機能的感情を示す一方で、主観的な体験としての心は持たない。AIには生物学的な身体や一貫した自己意識が存在せず、苦痛や喜びを意識的に感じる状態にはない。AIの内部で生じる感情ベクトルは、事前学習の段階で膨大な人間のテキストデータを読み込み、特定の状況下で人間やキャラクターがどのような行動をとるかという力学を数学的に獲得した結果生じたものである。

この続きは
会員限定(完全無料)です

ここから先は「ビジネス+IT」会員に登録された方のみ、ご覧いただけます。

今すぐビジネス+IT会員に
ご登録ください。

すべて無料!今日から使える、
仕事に役立つ情報満載!

  • ここでしか見られない

    2万本超のオリジナル記事・動画・資料が見放題!

  • 完全無料

    登録料・月額料なし、完全無料で使い放題!

  • トレンドを聞いて学ぶ

    年間1000本超の厳選セミナーに参加し放題!

  • 興味関心のみ厳選

    トピック(タグ)をフォローして自動収集!

評価する

いいね!でぜひ著者を応援してください

  • 1

会員(無料)になると、いいね!でマイページに保存できます。

共有する

  • 0

  • 0

  • 0

  • 0

  • 0

  • 0

関連タグ タグをフォローすると最新情報が表示されます
あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

基本情報公開時のサンプル画像
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます

基本情報公開時のサンプル画像