在刷B站的时候,突然想到一个问题:为什么现在的AI配音总是听起来很机械?我想要更自然的声音,想要控制情感和语调,但又不想每次都亲自录音。直到我发现了B站团队开发的IndexTTS2这个宝藏工具,简直把我惊到了!
到底有多强?
简单来说,IndexTTS2就是一个电影级别的AI配音师。它不是普通的文字转语音工具,而是B站团队打造的开创性零样本语音合成模型。关键是——完全没有限制!
我试过的功能简直逆天:
- 零样本声音克隆:只要一段几秒钟的音频,就能完美复制任何人的声音
- 情感随意控制:想要愤怒就愤怒,想要温柔就温柔,甚至可以直接用文字描述情感
- 精确时长控制:想要多长就多长,音画同步再也不是问题
本文介绍2种使用B站开源的声音工具indexTTS2。
使用方法:
方法1:云部署,无需电脑配置
推荐使用这种方法。
|
|
|
|---|---|
|
|
|
|
|
② 云电脑有时可能需要抢。最好上午和晚上用 |
第1步:租云电脑
打开网址:
https://www.xiangongyun.com/image/detail/7e84884a-b227-4f30-aead-c6624afd2edc
点击“立即部署”

① 选择最便宜的电脑:每小时1.59元钱的就行。
② 点击“确认部署”。 部署时间,大约需要30秒~2分钟。
③ 出现“运行中”时,点击右方的“仙宫云OS”

第2步:运行indexTTS 2
双击“打开应用”。 如果没有正常打开,需要等待两三分钟。

正常打开的页面是这样的。
先关闭这个页面

然后点击”打开webui”

出现这个界面,说明软件indexTTS2安装成功。

第3步:使用
① 上传要克隆的声音。
② 输入文本
③点击“生成语音”
④ 点击“下载”
方法2:本地部署
下载安装包:大小 27.5G。
|
|
|
|---|---|
|
|
|
|
|
|
安装包地址:
迅雷网盘: https://pan.xunlei.com/s/VO_QTuhJO-0l_WTkQqG9k3rNA1?pwd=dbks#
夸克网盘:https://pan.quark.cn/s/38e0cf78cd87
第1步:下载安装包
下载后解压

第2步:运行indexTTS2
解压安装包后,在最下面找到“运行.bat”, 双击它

会出现这个界面。
需要等待2~5分钟

出现这个地址的时候,说明工具安装成功。
http://127.0.0.1:7860

复制这个地址到浏览器里
① 上传要克隆的语音
② 输入文本
③ 点击“生成语音”

下载生成的结果。
说明:我的电脑是16G显存,5秒钟的音频,花了约5分钟才搞完。
所以,如果电脑配置不好的话,建议还是用第一种租电脑的方法。