新模型Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了 国产AI视频新飞跃

手机凤凰网 2024-04-28 18:58:48
A+ A-

4月27日,中关村论坛未来人工智能先锋论坛举行期间,生数科技携手清华大学宣布了一个重要成果:中国首个长时长、高一致性、高动态性视频大模型Vidu正式面世。该模型依托团队独创的U-ViT架构,结合Diffusion与Transformer技术,能够轻松生成16秒长度、1080P高清的视频内容,操作简便。

新模型Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了

Vidu模型不仅在模拟现实世界的精准度上有所建树,还展现了强大的创意生成能力,比如创造虚拟场景和处理多镜头切换,同时确保视频的时空连贯性,达到国际先进水平,并持续优化升级。它与国际知名的Sora模型相比,在视频生成时长及质量上均有显著提升,特别是在细节还原、虚构场景构造、动态镜头运用及对中国文化元素的融入上,表现出色。Vidu通过“一镜到底”的技术手段,实现视频内容的无缝生成,凸显了其算法的高效与连贯性。

新模型Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了 国产AI视频新飞跃

技术背后,是团队在贝叶斯机器学习和多模态大模型领域的深厚积累。他们提出的U-ViT架构,作为全球首个将Diffusion与Transformer融合的创新设计,早于同类技术,展示了团队的前瞻性和自主研发实力。今年3月,团队进一步开源了基于U-ViT的多模态扩散大模型UniDiffuser,完成了融合架构大规模应用的可行性验证,模型参数接近10亿,实现了图文模态间的自由转换。

新模型Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了 国产AI视频新飞跃

基于U-ViT的深入探索和实践,生数科技仅用两个月便在长视频处理技术上取得突破,推出了Vidu。这一模型不仅提升了视频生成的连贯性和动态范围,还预示着向更广泛模态应用的迈进,展现出通用视觉模型的潜力。

新模型Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了 国产AI视频新飞跃

Vidu的发布,不仅是对U-ViT架构应用能力的有力证明,也是生数科技在多模态大模型领域创新能力的展现。公司强调,大模型的发展离不开技术和产业的紧密结合,为此,同步启动了“Vidu大模型合作伙伴计划”,旨在汇聚产业链伙伴,共同推动大模型技术的应用生态建设。

新模型Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了 国产AI视频新飞跃

新模型Vidu直逼Sora,生数科技:还说“中国sora”就太没想象力了 国产AI视频新飞跃

责任编辑:张蕾
点击查看全文(剩余0%)

热点新闻

精彩推荐

加载更多……