Gemini 3.1 Flash TTS — 最富表现力且可引导的 TTS 模型
来源:X/Twitter
作者:@demishassabis (DeepMind)
链接:https://x.com/demishassabis/status/2044599020690010217
"Our most expressive and steerable TTS model yet! Designed to give builders granular control over AI-generated speech, Gemini 3.1 Flash TTS is really fun to play with!"
Available in preview today.
核心特点
最富表现力:Gemini 3.1 Flash TTS 实现了目前最具表现力的文本转语音能力,能够生成更自然、情感更丰富的语音。
细粒度可控:为开发者提供了对 AI 生成语音的细粒度控制能力,可以调节语速、语调、情感等参数。
即日起开放预览:目前已在预览版中可用,开发者可以开始体验。
评价
这是 DeepMind 在 TTS 领域的最新进展,提供了比以往更精细的语音合成控制能力,对构建语音交互应用的开发者来说是值得关注的新工具。