DeepSeek-V3-0324已发布编程能力显著提升

参考消息 2025-03-26 07:48:42

A+ A-

DeepSeek-V3-0324已发布编程能力显著提升。中国初创公司深度求索（DeepSeek）发布了V3模型的更新版本V3-0324，加强了模型的编程能力，显示这家公司希望在人工智能领域的激烈竞争中保持领先优势。该版本于24日深夜在AI开源平台低调上线，延续了公司的低调风格。

初代DeepSeek-V3发布于2024年12月26日，这款模型自上线后便以高性价比迅速走红。根据官方技术论文披露，DeepSeek-V3模型的总训练成本约为557.6万美元，而OpenAI的GPT-4等模型的训练成本约为1亿美元。更新后的DeepSeek-V3模型大小为641GB，模型参数为6850亿，采用混合专家架构，并允许自由商用。

此次更新的最大亮点是编程能力的优化。有网民使用V3-0324模型编写了800多行代码，全程没有出现任何故障。有AI研究者在社交平台X上发布评测指出，V3-0324模型在所有基准测试中都取得了巨大进步，可能已超越美国Anthropic公司的Claude 3.5 Sonnet，成为最强大的非推理模型之一。Claude 3.5 Sonnet是当前最受认可的商业AI模型之一。

此外，V3-0324模型可以直接在消费级硬件上运行，如搭载苹果M3 Ultra芯片的Mac Studio，而不需要动辄千瓦级别功耗的数据中心。M3 Ultra芯片在进行推理时的功耗不到200瓦，这意味着V3-0324模型的部署和运营门槛大大降低。

“风险投资节奏”网站报道认为，DeepSeek-V3-0324模型的发布可能预示着DeepSeek-R2即将到来。DeepSeek一贯先推出基础模型，再推出专门优化推理能力的版本，如V3后不久发布的R1。路透社今年2月引述消息称，DeepSeek正加快推出R1模型的后续产品R2。据悉，DeepSeek-R2原计划在5月初发布，但公司现在希望尽早推出。“风险投资节奏”网站认为，DeepSeek-R2的发布可能成为直接挑战GPT-5的竞品。

责任编辑：卢其龙 CN070

DeepSeek-V3-0324已发布编程能力显著提升

热点新闻

精彩推荐

DeepSeek-V3-0324已发布 编程能力显著提升

热点新闻

精彩推荐

DeepSeek-V3-0324已发布编程能力显著提升