DeepSeek新模型“火”到海外 引发硅谷恐慌

每日经济新闻 2025-01-26 15:51:02
A+ A-

短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能与OpenAI相当,引发了硅谷的震惊,甚至导致Meta内部出现恐慌情绪,工程师们开始连夜尝试复制DeepSeek的成果。

DeepSeek新模型“火”到海外

Scale AI创始人Alexander Wang在接受采访时表示,DeepSeek在他们的测试中表现最佳,与中国科技界的快速发展有关。他认为,当美国休息时,中国科技界在以更低的成本、更快的速度和更强的实力追赶上来。

DeepSeek新模型“火”到海外 引发硅谷恐慌

中国AI的进展引起了国外媒体的广泛关注,被视为对硅谷敲响了警钟。尤其在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的价格建立了一个突破性的AI模型,且未使用尖端芯片,这引发了人们对巨额资本投入有效性的质疑。

DeepSeek新模型“火”到海外 引发硅谷恐慌

一名匿名的Meta员工透露,DeepSeek-V3在基准测试中超越了Llama 4,让Meta进入恐慌模式。工程师们正在争分夺秒地分析DeepSeek的技术,试图复制其成果。管理层也为GenAI研发部门的巨额投入感到担忧,因为一个高管的薪资就超过了训练整个DeepSeek V3的成本。

DeepSeek新模型“火”到海外 引发硅谷恐慌

去年12月27日,DeepSeek推出了开源模型DeepSeek-V3,在聊天机器人竞技场排名第七,在开源模型中排名第一,并且是全球前十中性价比最高的模型。不到一个月后,DeepSeek正式开源了R1推理模型,允许所有人在遵循MIT License的情况下蒸馏R1训练其他模型。1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域,DeepSeek-R1表现出色,位列第一。

DeepSeek新模型“火”到海外 引发硅谷恐慌

著名投资公司A16z的创始人马克·安德森称,Deepseek-R1是他见过最令人印象深刻的突破之一,而且还是开源的,是一份给世界的礼物。诺奖得主、“AI教父”杰弗里·辛顿表示,中国的STEM教育比美国更好,拥有更多受过良好教育的人才,为AI的发展提供了坚实基础。

DeepSeek新模型“火”到海外 引发硅谷恐慌

斯坦福大学和Epoch AI的研究人员研究表明,到2027年,最大型模型的训练成本将超过10亿美元。然而,DeepSeek的训练成本并不昂贵,Noah's Arc资本管理公司认为,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。

DeepSeek新模型“火”到海外 引发硅谷恐慌

DeepSeek的发布引发了投资者和财经记者的关注。有观点认为,如果击败OpenAI只需要5500万美元,那么AI行业的商业化进程可能会比预期更快。英伟达股价也因DeepSeek的发布而下跌。

DeepSeek新模型“火”到海外 引发硅谷恐慌

国外媒体纷纷报道DeepSeek的新进展,一致认为这为硅谷敲响了警钟。Business Insider、CNBC和英国《金融时报》等媒体均对此进行了深入报道,讨论了资源更丰富的美国AI公司能否捍卫自己的技术优势。加州大学伯克利分校AI政策研究员Ritwik Gupta指出,中国的系统工程师人才库更大,懂得如何充分利用计算资源来更便宜地训练和运行模型。

DeepSeek新模型“火”到海外 引发硅谷恐慌

DeepSeek新模型“火”到海外 引发硅谷恐慌

责任编辑:张小花 TT1000

热点新闻

精彩推荐

加载更多……