生数科技和清华大学发布了中国首个Sora级别的视频大模型Vidu,具有长时长、高一致性和高动态性的特点。该模型采用了创新的U-ViT架构,融合了Diffusion和Transformer技术,能够一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu展示了强大的视频生成能力,支持模拟真实物理世界和丰富的想象力,提供了多镜头生成和高时空一致性的高级功能。这一技术创新标志着中国在视频生成技术领域的重要进展,是全球首个将Diffusion与Transformer融合的架构。
生数科技和清华大学发布了中国首个Sora级别的视频大模型Vidu,具有长时长、高一致性和高动态性的特点。该模型采用了创新的U-ViT架构,融合了Diffusion和Transformer技术,能够一键生成长达16秒、分辨率高达1080P的高清视频内容。Vidu展示了强大的视频生成能力,支持模拟真实物理世界和丰富的想象力,提供了多镜头生成和高时空一致性的高级功能。这一技术创新标志着中国在视频生成技术领域的重要进展,是全球首个将Diffusion与Transformer融合的架构。
扫码打开当前页
之前