5月19日,英伟达CEO黄仁勋宣布,全球最小的AI超级计算机DGX Spark已全面投产,数周内即可就绪。这款被称为“桌面级AI超算”的设备由英伟达超级芯片驱动,将数据中心级别的算力压缩至150×150×50.5mm的台式机形态机身中。它支持开发者在本地完成大模型的训练、微调和推理,并实现与云端算力的无缝迁移。这意味着AI开发正式进入了个人时代。
DGX Spark的核心是英伟达专为台式机优化的GB10 Grace Blackwell超级芯片,采用第五代Tensor Core架构,支持FP4精度计算,每秒运算能力高达1,000万亿次,专为生成式AI和物理AI模型设计。通过NVLink-C2C互连技术,CPU与GPU之间的数据带宽提升至第五代PCIe的五倍,解决了传统架构中内存密集型任务效率低下的问题。
DGX Spark能够本地运行2000亿参数的AI大模型,双机互联时可扩展至4050亿参数,远超普通AI工作站。此外,该设备预装了NVIDIA全栈AI平台,用户可以直接调用Cosmos-Reason世界基础模型和GR00T N1机器人模型,大幅降低了开发门槛。
DGX Spark的研发始于英伟达2022年启动的Project DIGITS项目。今年1月,该项目以“全球最小AI超算”身份亮相CES展,引发行业关注。经过三个月的优化,英伟达于3月19日正式发布DGX Spark,并同步开放预订。华硕、戴尔、惠普和联想等头部厂商共同完成了DGX Spark的量产,预计年内覆盖全球数百万开发者。
黄仁勋表示,DGX Spark的推出不仅是硬件突破,更是“AI原生计算机”这一新品类诞生的标志,未来将推动边缘计算与生成式AI的深度融合。DGX Spark的投产正值AI行业从云端垄断向端云协同转型的关键期。随着生成式AI应用爆发,开发者对本地化算力的需求激增。据广发证券测算,到2025年,全球AI推理算力需求将是训练算力的三倍以上。而传统云端部署面临数据隐私、延迟和成本压力。DGX Spark的出现使中小型企业和个人开发者能够以消费级成本获得超算级算力,显著降低了AI创新门槛。