新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了国产AI视频新飞跃

手机凤凰网 2024-04-28 18:58:48

A+ A-

4月27日，中关村论坛未来人工智能先锋论坛举行期间，生数科技携手清华大学宣布了一个重要成果：中国首个长时长、高一致性、高动态性视频大模型Vidu正式面世。该模型依托团队独创的U-ViT架构，结合Diffusion与Transformer技术，能够轻松生成16秒长度、1080P高清的视频内容，操作简便。

新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了

Vidu模型不仅在模拟现实世界的精准度上有所建树，还展现了强大的创意生成能力，比如创造虚拟场景和处理多镜头切换，同时确保视频的时空连贯性，达到国际先进水平，并持续优化升级。它与国际知名的Sora模型相比，在视频生成时长及质量上均有显著提升，特别是在细节还原、虚构场景构造、动态镜头运用及对中国文化元素的融入上，表现出色。Vidu通过“一镜到底”的技术手段，实现视频内容的无缝生成，凸显了其算法的高效与连贯性。

新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了国产AI视频新飞跃

技术背后，是团队在贝叶斯机器学习和多模态大模型领域的深厚积累。他们提出的U-ViT架构，作为全球首个将Diffusion与Transformer融合的创新设计，早于同类技术，展示了团队的前瞻性和自主研发实力。今年3月，团队进一步开源了基于U-ViT的多模态扩散大模型UniDiffuser，完成了融合架构大规模应用的可行性验证，模型参数接近10亿，实现了图文模态间的自由转换。

新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了国产AI视频新飞跃

基于U-ViT的深入探索和实践，生数科技仅用两个月便在长视频处理技术上取得突破，推出了Vidu。这一模型不仅提升了视频生成的连贯性和动态范围，还预示着向更广泛模态应用的迈进，展现出通用视觉模型的潜力。

新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了国产AI视频新飞跃

Vidu的发布，不仅是对U-ViT架构应用能力的有力证明，也是生数科技在多模态大模型领域创新能力的展现。公司强调，大模型的发展离不开技术和产业的紧密结合，为此，同步启动了“Vidu大模型合作伙伴计划”，旨在汇聚产业链伙伴，共同推动大模型技术的应用生态建设。

新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了国产AI视频新飞跃

责任编辑：张蕾

点击查看全文(剩余0%)

新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了国产AI视频新飞跃

热点新闻

精彩推荐

新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了 国产AI视频新飞跃

热点新闻

精彩推荐

新模型Vidu直逼Sora，生数科技：还说“中国sora”就太没想象力了国产AI视频新飞跃