- 2026/03/30 掲載
グーグル、Gemini搭載の「ライブ翻訳」提供開始、70ヵ国語をスムーズに翻訳
ヘッドホンを通じて70ヵ国語以上の会話をリアルタイムで翻訳
ライブ翻訳は、スマートフォン本体に有線またはBluetoothで接続したヘッドホンを用いて、対面する相手との会話をリアルタイムで翻訳する機能だ。最大の特徴は、Geminiの音声生成AIモデルを利用し、元の話者の声のトーン、抑揚、話すリズムを維持したまま翻訳音声を生成する点にある。従来の機械的な合成音声から脱却し、本人の肉声に近い自然な音声を出力する。基盤となる技術には「Gemini 2.5 Flash Native Audio」などのモデルを採用した。対応言語は70言語以上に及び、翻訳音声の出力先はヘッドホンだけでなく、スマートフォン内蔵スピーカーや外部スピーカーへ変更することもできる。
アプリの画面上ではテキスト表示も併用できる。対面モードを起動するとスマートフォンの画面が上下に分割され、会話する双方がそれぞれの言語で文字起こしされた翻訳内容を同時に確認できる。音声を聞き逃した場合や騒音のある環境でも、文字による確認で意思疎通を図る仕組みを備えている。海外旅行先での日常的なやり取りから、ビジネスでの商談まで、対面でのコミュニケーションが求められる場面での利用を想定する。
マイクは話者の言語を自動検出する仕組みを取り入れた。自分と相手の発言が切り替わるたびに、アプリを手動で操作して言語を切り替える必要はない。自動再生機能を有効に設定すれば、相手が話を区切ったタイミングで翻訳音声が自動で再生され、人間同士の対話のテンポを維持する。Googleは音声認識からテキスト翻訳、音声合成までの処理プロセスをGeminiの単一モデルに統合した。言語間の処理遅延を短縮しつつ、文脈やニュアンスを反映した翻訳出力を実現している。
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR