Our most expressive and steerable TTS model yet...

Gemini 3.1 Flash TTS — 最富表现力且可引导的 TTS 模型

来源：X/Twitter

作者：@demishassabis (DeepMind)

链接：https://x.com/demishassabis/status/2044599020690010217

"Our most expressive and steerable TTS model yet! Designed to give builders granular control over AI-generated speech, Gemini 3.1 Flash TTS is really fun to play with!"

Available in preview today.

核心特点

最富表现力：Gemini 3.1 Flash TTS 实现了目前最具表现力的文本转语音能力，能够生成更自然、情感更丰富的语音。

细粒度可控：为开发者提供了对 AI 生成语音的细粒度控制能力，可以调节语速、语调、情感等参数。

即日起开放预览：目前已在预览版中可用，开发者可以开始体验。

评价

这是 DeepMind 在 TTS 领域的最新进展，提供了比以往更精细的语音合成控制能力，对构建语音交互应用的开发者来说是值得关注的新工具。

Gemini 3.1 Flash TTS — 最富表现力且可引导的 TTS 模型

核心特点

评价

继续阅读