近日,国产开源大模型DeepSeek在全球AI领域引起广泛关注。该模型凭借其出色的性价比成为全球增速最快的AI应用之一。DeepSeek采用自强化学习优化算法(GRPO)和极致的工程优化能力,显著降低了AI模型的部署和运营成本,为企业智能化转型提供了强有力的支持。因此,中国电信、中国移动、中国联通等国内主要运营商以及其他众多企业纷纷宣布全面接入DeepSeek,积极布局AI赛道。
在此次合作中,三大运营商各展所长。中国电信天翼云自主研发的“息壤”智算平台率先完成与DeepSeek-R1/V3系列大模型的深度适配优化,成为首个实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。通过这一平台,科研工作者能够利用基于DeepSeek构建的WebUI应用服务提高学术资源检索和文献阅读分析效率;同时,天翼AI云电脑也接入了DeepSeek,提供智能会话服务,在办公、教育和生活等多个领域得到广泛应用。此外,中国电信还通过多种算力资源支持DeepSeek的部署、推理及微调工作,进一步提升了模型开发和应用的整体效率,降低了技术门槛和成本。
中国移动移动云则选择深度集成DeepSeek模型,并搭载自研的COCA算力原生平台,实现了便捷的“开箱即用”体验。移动云为DeepSeek-R1模型定制了高性价比的算力方案,面向互联网企业和高校科研机构提供支持。整个过程深入扎根于国产昇腾生态,实现了超过13%的推理成本降低,并构建了灵活可扩展的全网算力布局。
中国联通基于“星罗”平台完成了对多规格DeepSeek-R1模型的适配,既支持私有化也支持公有化场景的应用。联通云不仅构建了自主可控的“昇腾”智算底座,还简化了DeepSeek-R1模型的调用流程,增强了推理能力。此外,联通云桌面、编程助手等多种产品场景也已全面接入DeepSeek-R1模型,使其能在不同业务场景下发挥更大作用。
DeepSeek的技术架构创新带来了明显的成本优势和应用效能提升。它针对中文进行了大量风格调整,使得模型在数学、代码、自然语言推理等方面表现出色,接近OpenAI GPT-01正式版水平。这不仅提高了各行业应用中的语言理解和分析能力,还特别适用于如智能客服、网络优化等领域,帮助快速处理用户咨询和网络数据,从而提高服务质量与网络性能。
随着DeepSeek的应用日益广泛,对算力的需求也在不断增加,推动了上游算力芯片等相关产业的发展。下游方面,则出现了更多创新应用和商业模式,促进了整个AI产业生态的繁荣。DeepSeek的出现缩小了中美科技间的差距,有望重塑全球AI市场格局,增强中国企业在国际上的竞争力。