百度前首席科学家解读DeepSeek AI新突破引发争议

鞭牛士 2025-01-31 16:00:03
A+ A-

中国人工智能公司DeepSeek最近声称其新的人工智能模型性能优于OpenAI,但构建成本仅为后者的一小部分。这一声明震惊了市场,尤其是提到其大型语言模型的训练成本仅为560万美元,引发了对科技巨头在高级AI工作负载上巨额投入的关注。由于投资者担心DeepSeek的影响,英伟达的市值在周一蒸发近6000亿美元。

然而,并非所有人都相信DeepSeek的说法。上周,DeepSeek发布了新的推理模型R1,宣称可以与OpenAI的o1相媲美。这种模型旨在以类似人类的方式处理复杂问题。DeepSeek由专注于人工智能的量化对冲基金High-Flyer联合创始人梁文锋于2023年创立,专注于大型语言模型和实现通用人工智能(AGI)。

R1背后的技术并不新鲜,但值得注意的是,DeepSeek是首个将其部署到高性能AI模型中的公司。据称,其功耗要求大大降低。欧亚集团地缘技术业务总监陆晓萌认为,这表明发展这一行业的可能性很大,而高端芯片/资本密集型方式只是其中一种技术路径。

DeepSeek有两个主要系统:V3和R1,都是开源的,意味着底层代码免费且公开。V3共有6710亿个参数,相比之下,专家估计OpenAI最新模型至少有1万亿个参数。DeepSeek表示,R1在多个基准测试中实现了与o1相当的性能。此外,V3的训练成本仅为560万美元,远低于西方竞争对手。

不过,这些说法也受到了质疑。The Futurum Group首席执行官丹尼尔·纽曼表示,虽然这是一个巨大突破,但他对具体数字持怀疑态度。DGA Group中国区高级副总裁Paul Triolio指出,很难直接比较DeepSeek的成本和美国主要开发商的成本,因为560万美元仅是一次训练运行的成本,总体研发成本可能更高。

DeepSeek和OpenAI都在网站上披露了模型计算的定价。DeepSeek每100万个输入标记的成本为55美分,输出标记为2.19美元;而OpenAI的o1则分别为15美元和60美元。对于GPT-4o mini,OpenAI每100万个输入令牌收取15美分。

DeepSeek的声明还引发了对其使用芯片真实性的争论。该公司声称使用的是符合出口要求的Nvidia H800和A100芯片,但一些人对此表示怀疑。Scale AI首席执行官Alexandr Wang认为DeepSeek可能使用了被禁芯片,不过Nvidia否认了这一说法。

业内专家普遍认为DeepSeek取得的成就令人印象深刻,但也有一些人对其说法表示怀疑。Oculus和Anduril的创始人帕尔默·卢基认为500万美元这个数字不实,而亿万富翁投资者维诺德·科斯拉则暗示DeepSeek可能盗用了技术。OpenAI也在审查有关DeepSeek可能不当使用其模型数据的报告。

无论围绕DeepSeek的争议如何,人工智能科学家普遍认为这是行业的一大进步。Meta首席人工智能科学家Yann LeCun表示,这标志着开源AI模型的胜利,而不是中国战胜美国。他认为DeepSeek受益于开放研究和开源,这将使整个行业受益。

责任编辑:张蕾

热点新闻

精彩推荐

加载更多……