通义开源发布「超写实 3D 数字人」大模型

4 月 7 日,通义大模型宣布,开源发布超写实 3D 数字人大模型(LAM),具体来看:单图秒级生成超写实 3D 数字人:得益于通义设计的 2D 图像与 3D 高斯点交互 Transformer,可以在海量视频数据上训练,获得可泛化的 3D 高斯先验模型,从而做到单张图即可 Feedforward 秒级生成可驱动 3D 人头模型;跨平台超实时驱动渲染:通义基于 WebGL 搭建了整个驱动和渲染框架,生成的 3D 人头模型可以基于 WebGL 在任意设备上超实时运行,在手机端都可以跑满 120FPS。;低延迟实时交互对话数字人 SDK:基于生成的 3D 数字人,我们搭建了完整的实时交互对话工程链路,包括 LLM、ASR、TTS 和数字人模块,即输入一张图片、即可与这张图片所生成的数字人化身进行低延迟的实时对话,应用于客服、教育、陪伴等场景。

搜索