一支来自中国的神秘力量在硅谷和华尔街引起了轰动,通过算法打破了算力神话,重构了AI叙事。1月27日,美股芯片板块大幅调整,英伟达股价暴跌16.86%,创下市值最大蒸发纪录;博通大跌逾17%,甲骨文下跌近14%,纳斯达克指数下挫3.07%。
许多投资者将这次调整归因于DeepSeek的崛起。这家位于杭州的人工智能公司最近推出了最新开源大模型R1,其性能直追OpenAI的大模型o1。去年12月,该公司推出的大模型DeepSeek-V3在多项测试中表现出色,甚至在某些项目上超越了Anthropic的Claude-3.5和OpenAI的闭源模型GPT-4o。1月28日,DeepSeek发布了一款多模态大模型Janus-Pro,在图像生成基准测试中超过了OpenAI的DALL-E3。
令人震惊的是,DeepSeek的开源大模型在更低成本、更短时间、更少算力的基础上实现了卓越性能。V3和R1的训练成本均只有550万美元左右,不及Anthropic和OpenAI同类模型成本的十分之一。1月27日,DeepSeek登顶苹果中国地区和美国地区应用商店免费App下载排行榜,超越了ChatGPT。
美国总统特朗普在当地时间27日表示,中国人工智能初创公司DeepSeek的崛起应当为美国企业敲响“警钟”,并建议美国企业投入更少资源以达到同样效果。微软首席执行官萨蒂亚·纳德拉在世界经济论坛上也提到,DeepSeek的新模型令人印象深刻,不仅高效运行且计算效率出色,必须认真对待中国的AI进步。
Perplexity首席执行官Aravind Srinivas认为,由于硬件资源受限,中国企业不得不寻找变通方案,最终以更高效、更低成本的方式开发了类似技术,这确实让人感到压力。虽然DeepSeek取得了显著成就,但也需对世界人工智能的发展保持理性认识。
关于DeepSeek现象,国内专家和相关从业人员、投资者有以下共识:首先,V3和R1的重大突破并不能证明算力不重要。美国人工智能发展依赖更强的算力、更大的参数和更高的成本,而中国企业则在特定领域探索高效率、低成本的实用主义路径。其次,英伟达等芯片股的调整主要是市场风险释放的结果,与DeepSeek的重大突破之间没有必然联系。最后,中国企业的创新能力在增强,DeepSeek展示了低成本、高效率开发产品的可能性,但目前还不具备全面挑战OpenAI、Anthropic这些巨头的实力。人工智能的竞争才刚刚开始,未来充满无限可能。