AI製品
Google、AI「Gemini」の音声機能を強化 - より自然な会話やリアルタイム翻訳を実現
2025/12/12 0:00:00
•DeepMind Blog
当サイトではアフィリエイトプログラムを利用して商品を紹介しています。
Googleは、AIモデル「Gemini」の音声生成機能と音声認識機能を大幅にアップデートしました。 今回のアップデートにより、Gemini 2.5 ProおよびFlashのテキスト読み上げ(TTS)モデルは、より表現力豊かな音声生成が可能になりました。さらに、ライブ音声エージェント向けのGemini 2.5 Flash Native Audioも更新され、複雑な指示の理解や自然な会話の維持能力が向上しています。 これらの新機能は、Google AI Studio、Vertex AI、Gemini Live、そして検索機能(Search Live)にも導入されています。特にSearch Liveでは初めてネイティブ音声が利用可能となり、リアルタイムでのブレーンストーミングや検索アシスタント機能の強化が期待されます。 また、グローバルコミュニケーションを支援する新機能として、リアルタイムの音声翻訳(Speech-to-Speech Translation)が発表されました。これは、話者のイントネーションや声の調子を保ったまま、リアルタイムで音声を別の言語に翻訳する機能です。現在、Google翻訳アプリでベータ版として提供されており、将来的にはGemini APIなど、より多くのGoogle製品への展開が予定されています。


