腾讯混元发布开源语音数字人模型HunyuanVideo-Avatar

腾讯混元开源发布语音数字人模型HunyuanVideo-Avatar,仅需一张图片和一段音频即可生成人物自然说话或唱歌的视频;该模型支持头肩、半身与全身景别,能理解图像环境和音频情感,自动生成自然表情、唇形同步及全身动作;技术已应用于腾讯音乐产品中,适用于短视频创作、电商广告等场景,支持多风格、多物种和双人互动场景。

搜索