微软推出VASA-1 AI框架,使用一张真人照片和个人语音音频即可生成逼真对口型视频。该技术克服了以往面部生成技术的局限性,利用扩散Transformer模型训练,将面部动态和头部运动视为单一潜在变量,可即时生成高分辨率、高帧率的视频。微软还利用3D技术辅助标记面部特征,设计损失函数,有效捕捉和重现面部3D结构。(IT之家)
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!