阿里新模型声称超越DeepSeek 展现领先性能

读创新闻 2025-01-30 13:16:20

A+ A-

阿里云通义千问超大规模的MoE模型Qwen2.5-Max于1月29日凌晨正式上线。该模型是阿里云通义团队对MoE模型的最新成果，预训练数据超过20万亿tokens。在知识、编程、综合能力以及人类偏好对齐等主流权威基准测试上，Qwen2.5-Max展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩甚至领先的性能。

阿里新模型声称超越DeepSeek

Qwen2.5-Max的发布标志着中国AI阵营在高性能、低成本技术路线上的又一重要突破。通义团队对Qwen2.5-Max的指令模型版本和基座模型版本进行了评估测试。指令模型在多项基准测试中几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。而在基座模型对比中，Qwen2.5-Max与目前领先的开源MoE模型DeepSeek V3和最大的开源稠密模型Llama-3.1-405B相比，在大多数基准测试中都展现出了显著优势。

阿里新模型声称超越DeepSeek 展现领先性能

市场人士认为，此前过度聚焦于DeepSeek，而忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体表示，如果Qwen-2.5-max的确性能超过V3，可以对其RL推理模型给予更大期待。农历除夕夜，阿里巴巴股价出现显著异动，收盘前从涨幅1%快速拉升至6.71%，总市值达到2284亿美元。

阿里新模型声称超越DeepSeek 展现领先性能

今年阿里云作为春晚云计算AI独家合作伙伴，首次亮相中央广播电视总台蛇年春晚，为春晚直播提供了全球云基础设施和通义大模型AI技术支持。春晚主舞台采用了阿里云通义大模型AI技术来呈现科幻电影中的“子弹时间”经典画面。通过云上多视角拍摄，观众能够体验到“空中环绕、时空凝结”的创新观看效果。此外，阿里云通义AIGC技术成果也在节目画面中得到应用，为舞台设计提供风格迁移、参考图生成、风格化处理等技术支持。

阿里新模型声称超越DeepSeek 展现领先性能

责任编辑：张蕾

阿里新模型声称超越DeepSeek 展现领先性能

热点新闻

精彩推荐