网易有道开源 Confucius4-TTS，3 秒音频即可克隆音色

资讯
11小时前
編輯

admin

6 月 25 日消息，网易有道昨日宣布推出「子曰 4.0」TTS 语音合成引擎 Confucius4-TTS。官方称，这是业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。

网易有道开源 Confucius4-TTS，3 秒音频即可克隆音色

Confucius4-TTS 支持零样本语音克隆。用户提供 3 秒音频素材后，无需参考文本和前期训练，模型即可完成音色克隆；官方称克隆音色与原声相似度超过 85%，克隆任务准确度达 97%。

模型支持中文、英语、西班牙语、法语、德语、韩语、泰语、越南语等 14 种语言。官方称，其重点能力是跨语种发音：上传中文音频后，AI 可以用该音色生成日语、英语等外语语音。

💻 GitHub: github.com/netease-youdao/Confucius4-TTS

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

网易有道开源 Confucius4-TTS，3 秒音频即可克隆音色

OpenAI 与 Broadcom 发布首款 Jalapeño 推理芯片

Humanize：免费AI润色工具，将AI生成的文本转化为流畅、自然的文字规避AI检测

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

OpenAI 与 Broadcom 发布首款 Jalapeño 推理芯片

Humanize：免费AI润色工具，将AI生成的文本转化为流畅、自然的文字规避AI检测

网易有道“子曰 4”多模态模型、语音合成模型全量开源

国内首个：网易有道开源“子曰 3 数学模型”，单块消费级 GPU 即可运行

小米开源 OmniVoice 多语言语音克隆 TTS

腾讯混元视频生成工具 HunyuanCustom 宣布开源，融合文本、图像、音频、视频等多模态输入生视频的能力

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注