一夜之间,中国的AI公司DeepSeek在海外引起广泛关注。其最新发布的R1模型让从美股巨头到普通用户都感到震撼。27日,DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜,超越了ChatGPT。Meta、Open AI等科技巨头员工表示公司内部已进入“恐慌模式”,紧急制定对策。德国经济学家豪尔格·查皮兹认为,DeepSeek将成为“美国股市的最大威胁”。同一天,阿斯麦、英伟达、博通盘前跌超10%,台积电跌超9%。
DeepSeek创始人梁文锋出生于广东省湛江市吴川市,团队成员多为95后和90后。梁文锋曾表示,公司员工主要来自顶尖高校的应届毕业生、实习生以及年轻的专业人士。公司内部氛围宽松,推崇扁平化管理,每个成员可以调用的资源没有上限。
去年12月,DeepSeek发布的V3模型以较低成本获得了比肩世界顶级性能的大模型。今年1月,DeepSeek再次发布R1模型。美国加州的Scale AI公司创始人亚历山大·王表示,DeepSeek在多项指标上达到了美国最先进模型的水平。除了性能优异,DeepSeek作为一个开源模型对终端用户始终免费开放,开发者调用API的收费仅为Open AI的百分之一。R1模型训练成本仅为558万美元,不到其他顶级大模型一次训练成本的十分之一。
这种高性价比让美国科技股感到压力。豪尔格·查皮兹指出,DeepSeek以低成本打造出震动世界的模型,对美股泡沫构成最大威胁。美国经济学家亚德尼也表示,DeepSeek的成功可能给美股财报季带来压力。英伟达股价在当地时间26日下跌3.12%,27日盘前重挫超10%,带动纳指期货下跌4%。A股市场的一些“算力概念股”也受到影响,但与DeepSeek关联较深的浙江东方、每日互动等个股出现一字涨停。
梁文锋从小数学天赋突出,本科和硕士均就读于浙江大学。2008年研究生毕业后,他并未走上传统的职业道路,而是投身量化投资。2010年,沪深股指期货推出,梁文锋的自营资金盘迅速增长至5亿元。2015年,他与校友共同创立幻方量化,在A股市场进行系统性量化交易。2021年,幻方量化的资产管理规模达到千亿,成为国内四大顶级量化私募之一。2023年7月,梁文锋创立了DeepSeek。
DeepSeek的员工规模不到140人,团队成员平均年龄约为28岁,90后占比超过75%,95后占比超过50%。大多数员工毕业于国内顶尖院校,也有少数毕业于海外知名高校。与大型互联网公司的选人标准不同,DeepSeek更偏爱高潜力的年轻人。梁文锋表示,留住年轻人才的方法主要是高薪和充足的算力支持。公司内部推行扁平化管理,鼓励创新,并减少内耗。R1模型的技术思路就是一名年轻员工提出的点子,经过几个月的努力最终成功实现。这种用人思路为中国AI界带来了划时代的创新发展。