阿里巴巴通义实验室的CosyVoice语音生成大模型已升级至2.0版本,显著提升了语音生成的准确性、稳定性和自然体验。新版本通过双向流式语音合成技术,降低了合成延迟,并在发音准确性上取得了显著进展。CosyVoice2.0还增强了音质与情感匹配,支持多种方言和角色扮演功能。
GitHub地址:https://github.com/FunAudioLLM/CosyVoice
论文地址:https://funaudiollm.github.io/pdf/CosyVoice_2.pdf
扫码打开当前页
之前