百度前首席科学家解读DeepSeek AI新突破引发争议_中华网

百度前首席科学家解读DeepSeek AI新突破引发争议

鞭牛士 2025-01-31 16:00:03

A+ A-

中国人工智能公司DeepSeek最近声称其新的人工智能模型性能优于OpenAI，但构建成本仅为后者的一小部分。这一声明震惊了市场，尤其是提到其大型语言模型的训练成本仅为560万美元，引发了对科技巨头在高级AI工作负载上巨额投入的关注。由于投资者担心DeepSeek的影响，英伟达的市值在周一蒸发近6000亿美元。

然而，并非所有人都相信DeepSeek的说法。上周，DeepSeek发布了新的推理模型R1，宣称可以与OpenAI的o1相媲美。这种模型旨在以类似人类的方式处理复杂问题。DeepSeek由专注于人工智能的量化对冲基金High-Flyer联合创始人梁文锋于2023年创立，专注于大型语言模型和实现通用人工智能（AGI）。

R1背后的技术并不新鲜，但值得注意的是，DeepSeek是首个将其部署到高性能AI模型中的公司。据称，其功耗要求大大降低。欧亚集团地缘技术业务总监陆晓萌认为，这表明发展这一行业的可能性很大，而高端芯片/资本密集型方式只是其中一种技术路径。

DeepSeek有两个主要系统：V3和R1，都是开源的，意味着底层代码免费且公开。V3共有6710亿个参数，相比之下，专家估计OpenAI最新模型至少有1万亿个参数。DeepSeek表示，R1在多个基准测试中实现了与o1相当的性能。此外，V3的训练成本仅为560万美元，远低于西方竞争对手。

不过，这些说法也受到了质疑。The Futurum Group首席执行官丹尼尔·纽曼表示，虽然这是一个巨大突破，但他对具体数字持怀疑态度。DGA Group中国区高级副总裁Paul Triolio指出，很难直接比较DeepSeek的成本和美国主要开发商的成本，因为560万美元仅是一次训练运行的成本，总体研发成本可能更高。

DeepSeek和OpenAI都在网站上披露了模型计算的定价。DeepSeek每100万个输入标记的成本为55美分，输出标记为2.19美元；而OpenAI的o1则分别为15美元和60美元。对于GPT-4o mini，OpenAI每100万个输入令牌收取15美分。

DeepSeek的声明还引发了对其使用芯片真实性的争论。该公司声称使用的是符合出口要求的Nvidia H800和A100芯片，但一些人对此表示怀疑。Scale AI首席执行官Alexandr Wang认为DeepSeek可能使用了被禁芯片，不过Nvidia否认了这一说法。

业内专家普遍认为DeepSeek取得的成就令人印象深刻，但也有一些人对其说法表示怀疑。Oculus和Anduril的创始人帕尔默·卢基认为500万美元这个数字不实，而亿万富翁投资者维诺德·科斯拉则暗示DeepSeek可能盗用了技术。OpenAI也在审查有关DeepSeek可能不当使用其模型数据的报告。

无论围绕DeepSeek的争议如何，人工智能科学家普遍认为这是行业的一大进步。Meta首席人工智能科学家Yann LeCun表示，这标志着开源AI模型的胜利，而不是中国战胜美国。他认为DeepSeek受益于开放研究和开源，这将使整个行业受益。

责任编辑：张蕾

热点新闻

精彩推荐

加载更多……