港中大团队:开源AI音频工具包Amphion

香港中文大学(深圳)武执政副教授领导的团队与上海人工智能实验室等合作,开源了音频、音乐和语音生成工具包Amphion v0.1版本。除了文字转语音功能,Amphion还能够将一首歌的声音转换成另一个歌手的声音,支持声音转换、歌声合成、文本到音频、文本到音乐等功能。目前,歌声转换支持迈克尔·杰克逊、泰勒·斯威夫特、王菲、那英、李健等歌手的声音。该工具包支持多种模型和架构,如FastSpeech2、VITS、Vall-E、NaturalSpeech2等,用于不同的音频生成任务。

搜索