- 2026/01/03 掲載
OpenAI「スクリーンからの解放」を掲げ、2026年中に新たなAIデバイスを投入か?
元Appleのデザイナー、ジョナサン・アイブ氏と、音声による次世代インターフェースを構想中
OpenAIのCEOサム・アルトマン氏はこの新デバイスについて「iPhoneよりも静かで落ち着いた体験」を意図していると説明し、通知や情報過多に囚われない体験を提供したいとの考えを示している。
こうしたスクリーンレスデバイスの構想は、OpenAIが元Appleデザイナーのジョナサン・アイブと進めるハードウェア開発とも関連しているとみられる。OpenAIは2025年5月にアイブ氏のAIデバイス企業「ioプロダクツ」を65億ドルで株式取得し、アイブ氏を迎えいれている。
また一部の報道では、このデバイスが、従来のスマホやPCとともに日常使いできる、第三のデバイスと位置付けられる「ペン型ガジェット」になる可能性も報じられている。コードネームは「Gumdrop」で、ユーザーがポケットやデスクに置いて利用できる形状、アイブ氏のデザインスタジオ「LoveFrom」が主導しており、OpenAIはAI技術の統合を担当する形で協力しているという。
一方で、OpenAIはソフトウェア面でも音声AIの強化戦略を進めている。同社は従来のテキスト中心の対話体験から音声を主軸とする新たなモデル群の開発に注力しており、音声認識と音声生成機能の大幅な刷新を行っていると伝えられている。
また、OpenAIがさまざまなエンジニアリング・リサーチ部門を統合してオーディオ優先の個人向けデバイス発売に向けたオーディオモデルの再構築を進めているとの報道もある。これらのモデルは2026年初頭により自然で対話的な音声応答を実現することを目指しているという。
OpenAIはすでに、2025年3月に2種類の音声認識モデル「gpt-4o-transcribe」「gpt-4o-mini-transcribe」と、1種類の音声合成モデル「gpt-4o-mini-tts」を投入しており、従来の「Whisper」モデルを大きく上回る音声認識精度を実現している。
OpenAIの公式発表でも、これまでAPI経由で提供される音声AIモデルとして、音声認識(speech-to-text)および音声合成(text-to-speech)モデルの刷新が進んでいることが確認されている。これらは精度と自然さの向上を図るもので、多言語で高い認識精度を示し、より人間らしい応答や豊かな表現を可能にしたものとして開発者に提供されている。
こうした音声AI技術の進化は、スクリーンレスデバイス構想と結びつき、ユーザーがスマホやPCを見ずに対話だけで日常のタスクを完結できる体験の実現に寄与するとみられている。OpenAIや競合各社は、音声を中心としたインターフェースがテック業界全体の潮流であると位置付け、画面依存からの脱却を掲げる動きが強まっている。
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR