快手可灵数字人 2.0 全量上线:三步做到能说会演,最长 5 分钟

12 月 5 日消息,据可灵官方公众号,全新一代可灵数字人 2.0 即日起全量上线,经过上传角色图 → 添加配音内容 → 描述角色表现三个步骤,即可生成“能说会演”的数字人。

快手可灵数字人 2.0 全量上线:三步做到能说会演,最长 5 分钟

根据介绍,本次更新针对旧版带来了三大突破性改变:表现力拉满、手部及口型精准控制、支持最长 5 分钟内容。其“精通”体态动作、手势、表情、镜头语言,可做到更生动的情绪传达。

据1AI了解,可灵 AI 于今年 9 月推出数字人功能。当时,通过一张角色图片加一段文字或音频,即可生成 1080p / 48FPS、最长 1 分钟的数字人视频。该数字人功能基于多模态理解与视频生成模型的深度结合,实现了口型精准同步以及情绪动作的精细控制。其采用的基于 Transformer 的 DiT 架构,在处理时序信息和细粒度控制方面具有独特优势,能够精准解析面部特征、理解音频语义,并根据语音内容推断合适的面部表情和微动作,从而确保生成的数字人在视频全程保持角色一致性。

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
资讯

出师未捷:奥尔特曼上诉失败,OpenAI 首款 AI 硬件恐因侵权被迫改名

2025-12-5 11:18:39

资讯

Google 搜索加码 AI 功能,开始测试「无缝切入」对话式 AI

2025-12-5 11:31:27

搜索