虎牙推出基于DiT架构的实时多模态数字人模型VAM 1.0,仅需一张照片即可生成能聊天、唱跳、玩游戏的数字人,480×832分辨率、28帧实时流式输出,可连续运行24小时以上;原生覆盖静默、聆听、说话三态并支持全双工打断接话,通过三阶段训练攻克时间累积误差、交互、部署三堵技术墙;在8块H200集群达36.4帧每秒,首帧延迟约1.3秒,依托十年直播场景优势可落地带货、新闻播报、虚拟演唱会等。
❯
搜索
扫码打开当前页
返回顶部
幸运之星即将降临……
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠
-
¥優惠使用時效:无法使用使用時效:
之前
使用時效:预期有效优惠编号:×
没有优惠可用!
