会員限定
2025/07/13 掲載

グーグル・OpenAIが震え上がる、アップルのヤバすぎる新戦略

ありがとうございます！
いいね！した記事一覧をみる

会員になると、いいね！でマイページに保存できます。

AI・生成AI

|

タグをもっとみる

画像生成AI市場でOpenAIのDALL-E 3が1年で約80%ものシェアを失う中、GPT-4oは1億3000万人以上が利用する人気機能へと急成長を遂げた。グーグルも2025年5月にImagen 4を発表し最大10倍高速化を予告するなど、競争は激化の一途を辿っている。この状況下でアップルが独自開発するのが「STARFlow」だ。正規化フローと自己回帰トランスフォーマーを組み合わせた革新的手法により既存プレイヤーとはまったく異なるアプローチを採用している。アップルの「ズルすぎる」戦略を解説しよう。

執筆：細谷元

細谷元

バークリー音大提携校で2年間ジャズ／音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作ソフト、3Dソフト、ゲームエンジンを活用した「リアルタイム・プロダクション」の実験的取り組みでVRコンテンツを制作、英語圏の視聴者向けに配信。YouTubeではVR動画単体で再生150万回以上を達成。最近購入したSony a7s3を活用した映像制作も実施中。
http://livit.media/

　構成：ビジネス＋IT編集部

アップルのSTARFlowモデルによって生成された高解像度サンプル

（出典：アップル研究レポート）

アップルのAI取り組みの現在地、ChatGPT統合など

　アップルは2025年のWWDC（世界開発者会議）において、AI戦略の現在地を示す一連の発表を行った。

　今年のWWDCでは、前年度ほどAIへの強調は見られなかったものの、実用性を重視した機能拡張が目立った。注目すべきは「Visual Intelligence」の進化で、この画像解析技術はユーザーの周囲環境から情報を収集し、植物の識別やレストラン情報の取得、さらには着用している衣服の認識まで可能にしている。さらに、iPhone画面上の情報とも連携し、ソーシャルメディア投稿に関連する画像検索をグーグル検索やChatGPTを通じて実行する機能も追加された。

　一方で、Apple Intelligenceの中核を担うSiriの大幅なアップデートは予想に反して見送りとなった。ソフトウェアエンジニアリング担当上級副社長クレイグ・フェデリギ氏は「よりパーソナライズされたSiriの開発に関して、当社の高品質基準を満たすためにさらなる時間が必要」と説明。次世代Siriの登場は来年に持ち越された。

　Apple Intelligenceの特徴は、外部サーバへの依存を最小限に抑えたオンデバイス処理にある。同社は特定のタスク向けにカスタマイズされた小規模モデルを訓練し、メール作成などの処理をデバイス内で完結させる手法を採用する。一方、より複雑なクエリについては、Apple Siliconで動作する独自のクラウドサーバ「Private Cloud Compute」で処理を行う方針だ。

　もう1つ注目されるのが、Image PlaygroundにおけるChatGPTの統合だ。

　昨年発表されたImage Playgroundは、「6本指の手」が生成される問題や、「老人」「花」といった単純な説明でも画像生成に失敗するケースが多発し、ユーザーから厳しい評価を受けていた。

　こうした状況を受け同社は、Image PlaygroundにChatGPTを統合すると発表。この統合により、油絵、水彩画、ベクター、アニメ、プリントといった新たなスタイルが追加されるほか、「Any Style」オプションでより詳細な指定も可能になる。これらの新機能は「ChatGPTスタイル」として表示される。

　ただし、後述する同社の最新取り組みを鑑みれば、この統合は一時的なもので、最終的には、自社開発の画像生成システムに置き換えられる可能性が高い。以下でその画像生成をめぐる同社の最新動向を解説したい。