- 2025/05/24 掲載
「ジブリ風」で鬼バズ、ChatGPTの画像生成AIに“ある懸念”が広がる理由
バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作ソフト、3Dソフト、ゲームエンジンを活用した「リアルタイム・プロダクション」の実験的取り組みでVRコンテンツを制作、英語圏の視聴者向けに配信。YouTubeではVR動画単体で再生150万回以上を達成。最近購入したSony a7s3を活用した映像制作も実施中。
http://livit.media/
OpenAIの画像生成分野でのシェア推移と競合の動き
画像生成AI市場において、かつてOpenAIのDALL-E 3は市場を牽引する存在だったが、わずか1年で状況は大きく様変わりした。Poeの調査によると、2024年から2025年初頭にかけて、画像生成AI市場では、DALL-E 3とStable Diffusionが二強プレーヤー(またはMidjourneyを含めた三強)としてシェアの大半を有していた。しかし、その市場シェアは現在、約80%も減少し、苦戦を強いられている状況だ。
DALL-E 3とStable Diffusionがシェアの大半を獲得できたのは、プレーヤー数が限定的だったことが大きな理由として挙げられる。しかし現在、プレーヤー数は急増し、画像生成モデルの選択肢は数種類から約25にまで拡大している。

また競合プレーヤーが高精度の画像生成モデルをリリースしたこともDALL-E 3が苦戦を強いられている要因だ。たとえば、ドイツの新興企業Black Forest LabsのFluxモデル。同モデルは、市場に登場するや否や、約40%のシェアを獲得。画像品質の高さが評価され、設立からわずか数カ月という短期間で、市場のリーダー的存在になった。
一方、グーグルも画像生成分野で着実な成長を遂げている。2024年後半に投入したImagen3ファミリーは、プレミアムモデルのImagen3と最適化バージョンのImagen3-Fastを合わせて、約30%の市場シェアを確保。Black Forest Labsと合わせると、新興勢力だけで市場の7割を占める状況となる。
OpenAI、画像品質刷新による攻勢
画像生成分野で苦戦を強いられるOpenAIだが、画像生成機能を刷新したGPT-4oで巻き返しを図る。GPT-4oの画像生成精度は非常に高く、すでにコミュニティからは「生成画像技術における大きな飛躍」と評価され、また現時点で最高のAI画像モデルとの声も上がっているほどだ。実際、Artificial Analysisによる画像生成AIモデルのリーダーボードでは、執筆時点で1位を獲得している。

刷新版GPT-4oの最大の特徴は、画像生成機能をモデル内に直接組み込んだ点にある。従来のDALL-E 3が外部サービスとして画像生成を行っていたのに対し、GPT-4oではチャットボットのコアシステムから直接画像を生成する。これにより、ユーザーやAPI開発者は、別のモデルを呼び出すことなく画像生成が可能となった。
この取り組みは、すでに大きな成果を上げている。画像生成は瞬く間にChatGPTの最も人気のある機能の1つとなり、1週間で130万人以上のユーザーが試用。作成された画像は7億点に達したという。
さらにOpenAIは2025年4月、サードパーティ向けにGPT-4o画像モデル(API名は「gpt-image-1」)をリリース。企業/開発者は独自の製品に同等の画像生成機能を組み込むことが可能となった。これはビジネス顧客のニーズに応える動きでもあり、すでにCanva、GoDaddy、Airtableなどの企業が、コンテンツ作成やデザインのユースケースでGPT-4oの画像APIの実験を開始した。
興味深いことに、画像生成分野で競合となるアドビもOpenAIと協力関係を結び、自社製品内でGPT-4oの画像生成機能を提供する計画を進めている。さらに、マイクロソフトも、Microsoft 365 Copilotの「Create」機能にGPT-4oの画像生成を統合することを発表。PowerPointなどのアプリ内で、プロンプトから直接画像を生成できるようになるという。 【次ページ】技術的特徴:GPT-4oがもたらす4つの革新
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR