字节更新语音模型,豆包·语音合成2.0与声音复刻2.0

火山引擎升级豆包语音合成模型2.0和声音复刻模型2.0,通过Query-Response能力实现情境理解与语气把控,可通过细节描述精准生成对应情感;语音合成2.0提供默认模式、语音指令和引入上文三种模式,可控制整段情绪基调、方言类型、语速音调等,模型能自动理解上下文情绪连贯生成;声音复刻2.0可精准复现米老鼠、小沈阳等动漫人物和真人音色语速情绪,对公式朗读测试准确率接近90%,在教育场景专项优化。

搜索