0
いいね!でマイページに保存して見返すことができます。
共有する
ChatGPTが登場して間もないころ、動画生成AIの初期モデルがリリースされて注目を集めたが、クオリティの低さに落胆の声が相次いだ。しかし、約1年が経過しようとしている現在、動画生成AIは目覚ましい進化を見せ、マーケティングやデザイン分野などで実際に利用できる水準にまでクオリティは高まっている。現在、動画生成AIはどのような実力を持つのか、その現状を探ってみた。
主要3社が先行する動画生成AI市場
ChatGPTで画像生成できるようになったことで、テキストやコード生成に加え、画像生成技術もより身近な存在になった。このビジュアル領域におけるフロンティアとなっているのが動画生成AIモデルの開発だ。
テキストから動画を生成するだけでなく、写真などの静止画を動画に変換したり、動画のスタイルを変更できる生成AIモデルの開発が加速、この1年ほどでアウトプットの精度は大きく改善している。
この分野で一足早く取り組みを始めていたのがニューヨーク拠点のスタートアップRunwayだ。2023年6月、シリーズCの延長ラウンドでグーグル、NVIDIA、セールスフォースなどから1億4,100万ドルを
調達 するなど、動画生成AIスタートアップの中では特に注目される存在となっており、比較的豊富な資金を持っている。
Runwayへの注目度が高まったのは、同社が動画生成AIモデル「Gen1」をリリースした2023年3月ごろ。当時、Stable DiffusionやMidjourneyなど、静止画向けの生成AIツールの人気が急騰していた中、動画生成の可能性を示すGen1が突如として登場したことで、多くの人々の関心を集めた。ただし精度は高いものとはいえず、動画マーケティングなどで実際に利用されたケースはほぼないと思われる。
大きな変化をもたらしたのが2023年6月にリリースされたGen1の後継モデル「Gen2」だ。リリース当初は、
厳しい評価 を受けていたが、何度かアップデートを重ねたことで、動画のクオリティは大きく改善、特に2023年11月のアップデートでは、多くの動画制作者らがXで
驚きの声 をあげている。
こうしたアップデートによる改善を受け、CanvaやGetty Imagesなどのクリエイティブ系の大型プラットフォームとの提携も進められており、今後利用者の増加が見込まれる。特にCanvaはグローバルで1億5000万人のユーザーを抱える巨大プラットフォーム。Canvaプラットフォームの動画機能である
Magic Media で、Gen2モデルによる動画生成が可能になる。
先行するRunwayを追うのが、米Pika Labsと英Stability AIの2社。Pika Labsはスタンフォード大学の研究者らが立ち上げたスタートアップ。2023年11月末にシリーズAで3,500万ドルを調達、半年ほど前に設立されたばかりの企業だが、累計調達額は5,500万ドルに達する。
Pika Labsの動画生成AIは同社が運営する
Pikaプラットフォーム で利用することが可能だ。テキストプロンプトから動画を生成するモードと静止画を動画に変換するモードが利用できる。サンプル動画には、ドローン空撮のような映像やシネマティックな映像が披露されており、いずれも1年ほど前のRunway・Gen1と比べるとクオリティが上がっているのは明白だ。
静止画生成の人気ツールの1つStable Diffusionで広く知られるStability AIも2023年11月に動画生成モデルをリリース。先行プレーヤーに匹敵するクオリティを実現しており、動画生成分野でも主力プレーヤーとして存在感を示している。
VIDEO
Stable Video Diffusionのデモ動画(出典:Stability AIのYouTubeアカウント)
【次ページ】筆者が試してわかったRunway Gen2、Pika Labsの実力
関連タグ