• 会員限定
  • 2025/06/12 掲載

コーディング領域で存在感増すアンソロピック、成長の背景にある「3つの優位性」

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
1
会員になると、いいね!でマイページに保存できます。
コーディング分野でアンソロピックの存在感が際立ってきた。同社の「Claude 3.7 Sonnet」は、ソフトウェア開発スキルを測定するSWE-benchで70.3%のスコアを記録し、OpenAIのo3-mini(49.3%)を大きく上回った。同社は、コンシューマー向け機能の開発に注力せず、エンタープライズ市場、特にコーディング性能に焦点を当て、AIモデルの開発を進めてきた。この戦略は、高性能、安全性、アクセスの容易性という3つの優位性となって実を結びつつある。本稿では、アンソロピックがコーディング分野で構築しつつある強固な立ち位置の背景に迫る。
執筆:細谷 元

細谷 元

バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作ソフト、3Dソフト、ゲームエンジンを活用した「リアルタイム・プロダクション」の実験的取り組みでVRコンテンツを制作、英語圏の視聴者向けに配信。YouTubeではVR動画単体で再生150万回以上を達成。最近購入したSony a7s3を活用した映像制作も実施中。
http://livit.media/

  構成:ビジネス+IT編集部
photo
「Claude 3.7 Sonnet」はソフトウェア開発スキルでOpenAIのo3-miniを大きく上回った

コーディング領域で存在感強めるアンソロピック、これまでの経緯

 生成AI市場のコンシューマ分野では、ChatGPTで先手を打ったOpenAIが優位な地位を確立した。

 一方、エンタープライズ分野では、OpenAIの最大の競合となるアンソロピックが攻勢を強めている。特に2025年初頭以降、同社の攻勢は加速。評価額は615億ドル(約8兆9,700億円)に到達し、昨年5月時点の184億ドル(約2兆6,849億円)からの急成長を見せている。

 同社の戦略的特徴は、OpenAIやグーグルとは異なり、コンシューマー市場への進出を急がず、エンタープライズ市場、特にコーディング分野に注力してきた点にある。この戦略が奏功し、同社のClaude 3.7 Sonnetは、ソフトウェア開発スキルを測定する難関テストで、OpenAIやDeepSeekのモデルを大きく上回る数値を達成。エンタープライズでの導入を促進する起爆剤になっている。

 企業向けサービスの強化も着実に進めている。2024年9月にはGitLab、Midjourney、Menlo Ventures、North Highland Consulting、Sourcegraphなどをベータテスターに迎え、Claude Enterpriseを正式リリース。同サービスは、10万行のコードや15件の財務報告書など、大規模なデータの一括処理を可能とするもので、企業ユーザーからの支持を集める大きな転換点となった。

 企業のニーズに応えるため、料金プランも多様化を図っている。2025年4月には月額200ドルのMaxプランを導入。これは月額20ドルのClaude Proプランと比較して、利用制限が20倍に拡大されたプランだ。また、月額100ドルで利用制限が5倍となるプランも用意し、多様な企業規模や利用形態に対応する構えも見せている。

 Claudeがコーディング分野で活用されていることは、いくつかの数字にも顕著に示されている。直近では、アンソロピックによるAIモデルの現状を評価するEconomic Indexで、Claude 3.7 Sonnet利用の37.2%が「コンピューターと数学」カテゴリーに分類され、その大半がコード修正、デバッグ、ネットワークトラブルシューティングなどのソフトウェアエンジニアリング関連タスクとなっていることが判明した。

 特にエンタープライズの文脈でClaudeが支持される理由は、大きく「パフォーマンス」、「安全性」、そして「アクセスの容易性」の3つが挙げられる。以下で、それぞれの要素についてより詳しく見ていきたい。

photo
アンソロピックの強みはどこにあるのか
(Photo:Tada Images / Shutterstock.com)

アンソロピックのCluadeが選ばれる理由:パフォーマンス

 前述の通り、Claude 3.7 Sonnetの最大の強みは、コーディング能力の高さだ。実際の開発現場で直面する問題をどれだけ解決できるかを測定するSWE-benchという評価テストでは、基本の状態で62.3%の成功率を記録。さらに専用の補助ツールを使用した場合には、70.3%まで成功率が向上する。これはOpenAIのo3-mini(49.3%)を大きく上回る数値だ。

画像
Claude 3.7 Sonnetのコーディングテスト比較

 また、実際のビジネス環境を想定したツール活用能力の高さも特筆に値する。小売分野での正確性は81.2%を記録し、前モデルのClaude 3.5 Sonnetの71.5%から大幅な改善を実現した。航空分野でも58.4%のスコアを獲得し、Claude 3.5 Sonnet(54.2%)を上回っている。

 こうした性能の高さは、実際の開発現場での評価からも裏付けられる。たとえば、企業向けアプリケーション開発を手掛けるVercelは、様々なモデルを評価した結果、主力コーディングモデルをOpenAIのGPTからClaudeに切り替えたという。その理由として、同社のギレルモ・ラウチCEOは、実際の開発プロセスにおいて、Claudeが他のモデルを凌駕する性能を発揮した点を指摘している。

 Claude 3.7 Sonnetは、コードの生成だけでなく、実際のソフトウェア開発における問題解決でも高い能力を発揮する。たとえば、HTMLランディングページの生成では、30秒以内に実用的なコードを生成。セクション分けや構造化も適切に行われ、実際の開発現場でも即戦力として評価されているという。

 また、DeepSeek R1やGrok 3など、新興のAIモデルが台頭しているが、Claude 3.7 Sonnetはこれらのモデルと比較しても優位性を維持、また中国のアリババが開発したQwenモデルの性能向上が注目されているものの、依然としてClaudeの性能には及ばないというのが、一般的な評価となっている。 【次ページ】アンソロピックのCluadeが選ばれる理由:安全性
関連タグ タグをフォローすると最新情報が表示されます

AI・生成AIの関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます