DeepSeek新模型“火”到海外引发硅谷恐慌

每日经济新闻 2025-01-26 15:51:02

A+ A-

短短一个月内，中国AI初创公司深度求索（DeepSeek）发布了两款大模型：DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉，性能与OpenAI相当，引发了硅谷的震惊，甚至导致Meta内部出现恐慌情绪，工程师们开始连夜尝试复制DeepSeek的成果。

DeepSeek新模型“火”到海外

Scale AI创始人Alexander Wang在接受采访时表示，DeepSeek在他们的测试中表现最佳，与中国科技界的快速发展有关。他认为，当美国休息时，中国科技界在以更低的成本、更快的速度和更强的实力追赶上来。

DeepSeek新模型“火”到海外引发硅谷恐慌

中国AI的进展引起了国外媒体的广泛关注，被视为对硅谷敲响了警钟。尤其在5000亿美元的“星际之门”计划公布之际，DeepSeek以极低的价格建立了一个突破性的AI模型，且未使用尖端芯片，这引发了人们对巨额资本投入有效性的质疑。

DeepSeek新模型“火”到海外引发硅谷恐慌

一名匿名的Meta员工透露，DeepSeek-V3在基准测试中超越了Llama 4，让Meta进入恐慌模式。工程师们正在争分夺秒地分析DeepSeek的技术，试图复制其成果。管理层也为GenAI研发部门的巨额投入感到担忧，因为一个高管的薪资就超过了训练整个DeepSeek V3的成本。

DeepSeek新模型“火”到海外引发硅谷恐慌

去年12月27日，DeepSeek推出了开源模型DeepSeek-V3，在聊天机器人竞技场排名第七，在开源模型中排名第一，并且是全球前十中性价比最高的模型。不到一个月后，DeepSeek正式开源了R1推理模型，允许所有人在遵循MIT License的情况下蒸馏R1训练其他模型。1月24日，DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三，与顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域，DeepSeek-R1表现出色，位列第一。

DeepSeek新模型“火”到海外引发硅谷恐慌

著名投资公司A16z的创始人马克·安德森称，Deepseek-R1是他见过最令人印象深刻的突破之一，而且还是开源的，是一份给世界的礼物。诺奖得主、“AI教父”杰弗里·辛顿表示，中国的STEM教育比美国更好，拥有更多受过良好教育的人才，为AI的发展提供了坚实基础。

DeepSeek新模型“火”到海外引发硅谷恐慌

斯坦福大学和Epoch AI的研究人员研究表明，到2027年，最大型模型的训练成本将超过10亿美元。然而，DeepSeek的训练成本并不昂贵，Noah's Arc资本管理公司认为，DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。

DeepSeek新模型“火”到海外引发硅谷恐慌

DeepSeek的发布引发了投资者和财经记者的关注。有观点认为，如果击败OpenAI只需要5500万美元，那么AI行业的商业化进程可能会比预期更快。英伟达股价也因DeepSeek的发布而下跌。

DeepSeek新模型“火”到海外引发硅谷恐慌

国外媒体纷纷报道DeepSeek的新进展，一致认为这为硅谷敲响了警钟。Business Insider、CNBC和英国《金融时报》等媒体均对此进行了深入报道，讨论了资源更丰富的美国AI公司能否捍卫自己的技术优势。加州大学伯克利分校AI政策研究员Ritwik Gupta指出，中国的系统工程师人才库更大，懂得如何充分利用计算资源来更便宜地训练和运行模型。

DeepSeek新模型“火”到海外引发硅谷恐慌

责任编辑：张小花 TT1000

DeepSeek新模型“火”到海外引发硅谷恐慌

热点新闻

精彩推荐

DeepSeek新模型“火”到海外 引发硅谷恐慌

热点新闻

精彩推荐

DeepSeek新模型“火”到海外引发硅谷恐慌