- 2025/12/17 掲載
OpenAI が最新画像生成モデル「GPT Image 1.5」発表。Google「Nano Banana」に対抗
従来の4倍の生成速度、指示への追従性や被写体の一貫性も大幅に向上
OpenAIによれば、GPT Image 1.5は従来モデルと比べて指示に対する追従性が向上しており、特に既存の画像に対してユーザーが細かい修正指示を出した際に、元の構図や特徴を維持しつつ編集する能力が強化されているという。また生成・編集速度も大幅に改善され、従来比で最大4倍の高速処理が可能だとしている。これにより、リアルな人物の服装や髪型の変更、スタイル変換など多様な画像操作が迅速に行えるとしている。
新機能として、ChatGPT内に専用の「Images」タブが追加された。このタブでは、利用者が簡単に画像生成や編集を開始できるように、プリセットのフィルターやトレンドのプロンプト案内が表示される。より直感的な操作が可能となり、専門的な知識がなくても創造的な画像生成・編集を行える体験設計が意図されている。GPT Image 1.5の主な改良点は以下の通り。
1.生成速度の大幅な高速化:従来モデルと比べて最大約4倍の速度で画像を生成できるようになった。
2.プロンプトへの追従性の向上:ユーザーのプロンプトや細かい編集指示に対して意図通りの変更を反映しやすくなった。
3.一貫性の保持:被写体の特徴や、光の条件やカメラアングル、構図など、重要な要素を保持しつつ生成・編集できるようになった。
4.テキスト描画性能の向上:日本語などの正確な描画、より細かい文字や複雑なレイアウトが正確に表現できるようになった。
5.新UI「Images」の採用:画像生成専用UIの採用プリセットスタイルやトレンドプロンプトによる簡易操作が可能になり、初心者でも創造的な画像生成がしやすくなった。
OpenAIはGPT Image 1.5をAPIとしても提供しており、開発者や企業は自社サービスやアプリケーションに高度な画像生成・編集機能を組み込むことができる。またAPIでの価格が従来モデル(GPT Image 1)と比較して20%引き下げられており、画像の生成コストについても改善を図っている。これにより、ビジュアルコンテンツ制作やプロダクト画像生成といった実務的な利用シーンへの対応が進むと見られている。
また「GPT Image 1.5」は、Googleの「Nano banana」など先行の画像生成モデルと比較して競争力のある性能を示している点も指摘されている。具体例として、写真のシーン生成やグラフィック・アニメーション対応など多様なスタイルでの出力が可能になったと報じられた。こうした点はAI画像生成分野の競争が激化する中での重要な改善点とされている。
OpenAIによる今回の機能強化は、生成AIの実用性を高めることを主眼に置いたものであり、プロフェッショナル用途を含む幅広い利用者に向けた性能向上が図られている。今後は新モデルを基盤としたさらに高度なビジュアルツールの展開や、他サービスとの連携強化も見込まれる。
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR