工具与项目 4.0 · 优秀 2026-04-17 · X

Our most expressive and steerable TTS model yet...

Our most expressive and ste...

打开原文回到归档

Gemini 3.1 Flash TTS — 最富表现力且可引导的 TTS 模型

来源:X/Twitter
作者:@demishassabis (DeepMind)
链接:https://x.com/demishassabis/status/2044599020690010217

"Our most expressive and steerable TTS model yet! Designed to give builders granular control over AI-generated speech, Gemini 3.1 Flash TTS is really fun to play with!"

Available in preview today.

核心特点

最富表现力:Gemini 3.1 Flash TTS 实现了目前最具表现力的文本转语音能力,能够生成更自然、情感更丰富的语音。

细粒度可控:为开发者提供了对 AI 生成语音的细粒度控制能力,可以调节语速、语调、情感等参数。

即日起开放预览:目前已在预览版中可用,开发者可以开始体验。

评价

这是 DeepMind 在 TTS 领域的最新进展,提供了比以往更精细的语音合成控制能力,对构建语音交互应用的开发者来说是值得关注的新工具。