阿里万相视频大模型宣布开源 全模态全尺寸模型开源

每日经济新闻 2025-02-26 11:13:00
A+ A-

2月25日晚间,阿里云官方公众号宣布,阿里云视频生成大模型万相2.1(Wan)正式开源。此次开源采用Apache2.0协议,包括14B和1.3B两个参数规格的全部推理代码和权重,支持文生视频和图生视频任务。全球开发者可以在Github、HuggingFace、魔搭社区下载体验。

阿里万相视频大模型宣布开源

14B版本的万相模型在指令遵循、复杂运动生成、物理建模、文字视频生成等方面表现出色,在权威评测集Vbench中以总分86.22%的成绩大幅超越Sora、Luma、Pika等国内外模型,稳居榜首。

阿里万相视频大模型宣布开源 全模态全尺寸模型开源

1.3B版本的万相模型不仅超过了更大尺寸的开源模型,甚至接近一些闭源模型的结果。它能在消费级显卡上运行,仅需8.2GB显存即可生成480P视频,适用于二次模型开发和学术研究。

自2023年起,阿里云坚定走大模型开源路线。从2023年8月开始,阿里云相继开源了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,涵盖0.5B到110B全尺寸,以及大语言、多模态、数学和代码等全模态。这些模型多次登上国内外权威榜单,成为全球开源社区的重要组成部分。阿里云千问(Qwen)衍生模型数量已超过10万个,是全球最大的AI模型家族。

随着万相的开源,阿里云实现了全模态、全尺寸大模型的开源。值得注意的是,自2025年1月DeepSeek火爆出圈以来,开源已成为众多大模型的“必选项”。今年2月,字节豆包、昆仑万维、百度文心、阿里通义千问等公司均推出了开源模型。

责任编辑:张小花 TT1000

热点新闻

精彩推荐

加载更多……