外媒:中国AI模型震惊硅谷 小公司挑战巨头

环球网 2025-01-26 14:31:00
A+ A-

中国一家人工智能实验室最近发布了一款尖端模型的技术细节,此举不仅震惊了世界,也让其低调的负责人梁文锋成为民族英雄。1月20日,由对冲基金经理梁文锋创立的公司深度求索正式发布了R1模型,并在一篇论文中详细解释了如何利用有限的自筹预算构建一个大语言模型,该模型可在没有人工监督的情况下自动学习和自我改善。

包括OpenAI和谷歌DeepMind在内的美国企业率先开发出推理模型,这是一个相对较新的人工智能研究领域,旨在使模型具有与人类相匹配的认知能力。上个月,OpenAI发布了o1模型的完整版本,但对其创建方法保密。深度求索R1模型的发布在硅谷引发了一场激烈辩论,讨论资源更雄厚的美国人工智能企业能否守住技术优势。与此同时,梁文锋也成为提升中国国内民族自豪感的焦点人物。本周,在中国总理召开的一次座谈会中,梁文锋是唯一的人工智能企业负责人。

2023年,梁文锋创建了深度求索公司。另一家大语言模型公司的创始人表示,他建立了一个出色的基础设施团队,真正了解芯片的工作原理。在美国禁止英伟达向中国出口功能最强大的芯片后,中国本土人工智能企业被迫寻找创新方法,以最大限度地利用现有芯片的计算能力。深度求索的工程师已经知道如何解决这一问题,能够释放这些图形处理器(GPU)的潜力,即使它们不是最先进的。

业内人士认为,深度求索对研究的专注使其成为一个可畏的竞争对手,因为该公司愿意分享取得的突破,而非为获取商业利益保护它们。深度求索没有从外部基金筹集资金,也没有采取重大举措将其模型货币化。北京的一名人工智能行业投资者表示,深度求索的运作方式就像早期的DeepMind,专注于研究和工程。

深度求索仅用2048颗英伟达H800 GPU和560万美元就训练出了6710亿参数的开源大模型,这只是OpenAI和谷歌训练同等类型模型花费的一小部分。加州大学伯克利分校的人工智能政策研究员里特维克·古普塔表示,深度求索最近发布的模型表明,没有阻碍人们获取人工智能能力的障碍。他说,训练模型的第一人必须花费大量资源才能实现目的,但跟进者可以用更少的费用且更快的速度实现目标。他还指出,中国拥有比美国更多的系统工程师人才库,他们知道如何最好地利用计算资源,以更便宜的方式训练和运行模型。

尽管如此,美国的竞争对手也没有停滞不前。它们正在构建由英伟达新一代Blackwell芯片组成的超大型“集群”,从而创造出强大的计算能力,有可能再次拉开与中国竞争对手的性能差距。

就在硅谷审视与中国企业深度求索有关的新闻之际,Meta的首席执行官扎克伯格宣布计划在2025年大幅增加对人工智能的投资。他表示,今年将对该领域增加600亿至650亿美元的投资,同时大幅扩大人工智能研发团队。人工智能和中国的发展态势成为本周在瑞士达沃斯举行的世界经济论坛2025年年会的主要话题。微软高管也表示,应非常认真地对待来自中国的发展态势。

责任编辑:张小花 TT1000

热点新闻

精彩推荐

加载更多……