- 2025/06/09 掲載
「ささやき」も「怒り」も演じ分ける 感情もトーンも自在な「声で演じるAI」リリース
「Eleven v3(αlpha)」の提供を開始、日本語読み上げ精度も向上
音声AIの開発を手がけるイレブンラボ(米ニューヨーク州)は、2025年6月6日、次世代TTS(Text to Speech)モデル「Eleven v3 (alpha)」の提供を開始した。日本法人であるイレブンラボジャパンを通じ、日本語を含む70言語以上に対応するモデルとして展開する。v3では、従来の読み上げ機能に加え、「感情」「トーン」「対話」の表現が可能となった。これにより、単なる読み上げではなく、ストーリーの登場人物の切り替えや、セリフの途中での感情の変化など、演技に近い音声生成が実現できるとしている。
表現力強化や指示タグ対応など、多彩な進化点
Eleven v3の主な進化点として、以下の機能が挙げられている。対応言語の拡大:33言語から70言語以上へと拡張。
対話モード:会話中に話者を切り替える表現が可能。
音声タグサポート:「ささやき」「笑い声」「皮肉な声調」「群衆の歓声」などのトーンや効果音をテキストに指定可能。
感情とペースの調整:1文中でのトーン変化や感情の起伏にも対応。
AIが関西弁や実況調も再現、日本でも本格展開へ
「Eleven v3」は、日本語を含む70以上の言語に対応し、方言(例:関西弁)や実況調の演出にも対応できるとしている。これにより、AI音声の活用は、コールセンターでの音声対応や公共情報の多言語発信、視覚障害者向けの情報提供、日本語音声コンテンツの制作など、多様な分野に広がりつつある。また、イレブンラボは2025年4月に日本法人「イレブンラボジャパン」を設立。企業や行政機関との連携を視野に入れ、国内での展開を進めている。今後はリアルタイムでのストリーミング対応や、外部向けAPIの提供も予定されている。
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR