上周,DeepSeek R1发布,在全球引发巨大关注。1月27日,该应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,因过于火爆其官网一度在当天上午再次“宕机”。DeepSeek的出现被视为中国AI的“里程碑”时刻。由于DeepSeek以极低成本打造出堪比OpenAI o1的开源AI模型,这让投资者对AI的获利能力和尖端芯片的需求感到担忧。27日晚间,美股三大股指集体走低,英伟达、博通等科技股开盘暴跌,其中英伟达跌幅约17%,单日市值蒸发5890亿美元,创下历史上最大单日个股蒸发规模。
1月28日,DeepSeek官网的服务状态页面显示:近期线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录。此外,1月28日凌晨,DeepSeek团队正式发布了两款多模态框架——Janus-Pro和JanusFlow。
自上周末以来,全球掀起了一轮DeepSeek热潮。1月27日,DeepSeek应用在美区下载榜上超越了ChatGPT,成为一款现象级产品。人们已经用它玩出了各种创意,比如在家通过多台mac运行DeepSeek实现AGI,或在消费级硬件上实现开源o1,还有人通过提取DeepSeek的推理能力让其他模型更聪明。
受DeepSeek冲击,27日晚间美股科技股普遍下跌。英伟达跌近17%,博通大跌17.4%,美光科技大跌11.67%,台积电大跌13.23%,超威半导体公司跌6.37%,微软跌2.14%。高盛报告称,随着中国人工智能(AI)大模型DeepSeek的崛起,对冲基金开始观望美国本土培育的AI模式是否能持续,并撤离对科技股的押注。Erlen Capital Management董事总经理Bruno Schneller表示,DeepSeek这样的全球竞争者的出现,引发了人们对美国在这一领域主导地位可持续性的质疑。
Wedbush分析师丹尼尔·艾夫斯认为此次抛售是“另一个黄金买入机会”,而非人工智能革命的真正威胁。他认为真正的人工智能军备竞赛在于人工通用智能、机器人和自主技术,这是DeepSeek无法竞争的领域。重仓英伟达的东方港湾董事长但斌则表示,市场情绪太极端,算法创新和算力投入不是非此即彼的关系。DeepSeek直接影响的是市场的推理成本大幅下降,有利于应用推广,这才是未来算力需求的核心矛盾。
近年来,各大科技巨头之间的大模型比拼都是算力战,动辄上百亿美元的芯片资本支出,最顶级的芯片不仅供不应求还限制出口,这让拥有雄厚财力的硅谷科技巨头占尽优势。然而,DeepSeek以极低成本芯片训练出突破性模型,让这一切开始动摇。据新智元报道,UC伯克利博士生潘家怡和另两位研究人员在CountDown游戏中复现了DeepSeek R1-Zero,通过强化学习RL,3B的基础语言模型也能够自我验证和搜索,成本不到30美元,结果相当出色。港科大助理教授何俊贤的团队仅用8K个样本就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练,模型在复杂的数学推理上取得了强劲结果。全球最大开源平台HuggingFace团队也宣布复刻DeepSeek R1所有pipeline,完成后所有训练数据和脚本将全部开源。
展望未来,DeepSeek R1的问世通过“极致压缩+高效强化训练+AI推理算力大幅简化”的低成本新模式,宣告属于AI ASIC的时代已经到来。ASIC凭借其算力、能效和定制化优势,正成为AI基础设施的“新基建”,推动大模型、自动驾驶、智能终端等领域的突破。未来,随着Chiplet、先进封装等技术的成熟,ASIC将进一步降低成本,成为AI普惠化的核心引擎。