DeepSeek-R1模型的开源发布再次引发了全球对大语言模型(LLM)人工智能的关注。DeepSeek以远低于OpenAI的成本训练出了效果接近甚至部分优于OpenAI-o1的模型,并通过“蒸馏”技术提供了一系列参数规模相对较小、效果劣化不严重且有一定实用价值的衍生模型,例如国家超算互联网平台SCNet部署并免费向公众开放的Qwen-7B和Qwen-32B等。
根据实验和估算,部署运行DeepSeek-R1 671B模型用于内部研究实验,每小时成本在300元以上或每月十几万元;如果采用有监督微调方法进行训练,成本还会增加几倍。尽管这个成本仍然超出大部分个人和小微企业的承受能力,但对于大型企业和国家来说已经完全可以接受。
这意味着大语言模型被DeepSeek高度“民主化”了:任何国家都能训练并部署一个很大程度上自主可控、体现本国价值观且能结合本国实际情况的大模型AI。几个月前,这几乎只有美国和中国能做到。
一些国家政府已经意识到这一转变的重要性。印度政府计划投入计算基础设施、数据和资本支持,在农业和气候变化等领域构建与人工智能相关的应用,据说其大模型将在DeepSeek-R1的基础上构建。韩国宣布加快国家级人工智能计算基础设施建设,目标是成为“全球第三大AI强国”,显然认识到各国都有可能在短期内建成自己的“主权AI”,而DeepSeek的开源大大加速了这一进程。
巴西UFABC大学教授Sergio Amadeu指出,DeepSeek的开源使那些在技术上依赖美国发展的国家能够制定有利于自身发展的战略,但开源并不能解决建设对地方和国家发展至关重要的主权基础设施的问题。数字主权是一个系统工程,仅靠一两项立法或“杀手应用”的突破无法实现全面提升。
目前各国在讨论数字主权时经常聚焦于数据所有权问题,即国家有权使用和管理本国生成的数据,并防止数据被别国滥用。相应方案包括立法约束数据本地存储和跨境传输。另一些研究者则从传播学角度关注美国互联网大公司对信息的垄断及其对政治和国家安全的影响,倡导独立于美国大公司的替代性互联网平台,强调开源和去中心化。
然而,数据所有权只是数字主权的一部分,且更多是成果而非原因。欧盟实施GDPR几年后发现,尽管对数据所有权做了严格规定,但芯片、服务器、操作系统、云平台等数字基础设施仍掌握在美国大公司手中。因此,欧盟开始发展与AWS竞争的云计算平台Gaia-X。
笔者提出的数字主权指数框架认为,数据所有权的独立自主是国家整体数字主权的集中体现。若国家没有对数字基础设施的独立自主,数据所有权的限制实际上无法落地。数字基础设施和数字治理的独立自主依赖于从事数字化产业的科研机构、企业和人才的能力。数据所有权、数字基础设施、数字治理和数字化能力共同构成了数字主权体系。
正因为数字主权是一个庞大体系,单纯通过立法约束数据所有权或建设一两个“杀手应用”难以从美国数字霸权手中夺回数字主权。数字基础设施、数字治理和数字化能力的建设超出了个人或社群的能力范围,只有主权国家或超级大企业才能进行这些基础工作。
具体到大语言模型AI领域,DeepSeek的开源让众多全球南方国家开始考虑数字主权问题。如果全球南方国家不自主训练并运营自己的主权AI,国民将依赖OpenAI或其他美国大公司的AI产品,导致持续付费、数据流向美国且无法应对意识形态偏见。
正如Amadeu所指出的,一旦全球南方国家尝试建设自己的主权AI,其他方面的挑战将接踵而至。大多数全球南方国家如果想基于DeepSeek的开源模型训练和部署自己的主权AI,大概率只能选择AWS或Azure的云服务。一旦美国禁止美国企业提供相关服务,这些国家的主权AI计划将受阻。
对于大部分全球南方国家而言,在现有基础上构建相对独立自主的数字基础设施和数字化能力体系已相当困难。即便是大国巴西,其数字基础设施也高度依赖美国。自20世纪90年代以来的政策转向破坏了数字化产业持续发展的根基,这是该国目前数字主权水平较低的主要原因。其他全球南方国家的情况更糟。
全球南方国家如何摆脱美国数字霸权、获得相对独立的数字主权?与中国的合作是否可能助力这一进程?这些都是摆在各国面前的现实挑战。今年巴西担任金砖国家主席国,提出的六项优先工作议题中包括“鼓励包容性和负责任的人工智能治理促进发展”。现在,DeepSeek-R1的开源发布及其周边项目的活跃,使得巴西等金砖国家看待人工智能治理的视角需要根本性转变,从依赖美国企业提供的AI转向主权AI和多边主义AI治理的可能性。金砖峰会将在巴西举行,主权AI和数字主权是否会成为明确诉求值得关注。
鉴于DeepSeek带来的大语言模型人工智能民主化趋势,建议全球南方国家立即采取行动,逐步形成自己的主权AI乃至数字主权战略:组织力量研究DeepSeek,了解如何增强或修正大模型在特定领域的表现,制定切实可行的计划,实施部署自主可控的主权AI;识别本国数字空间产生的所有数据的重要性,落实数据所有权;加强与华为等中国ICT企业的交流协作,降低对美国科技巨头的依赖;在金砖国家平台上与中国共同倡导多边主义的AI治理国际秩序,促进平等互助、互利共赢的多边协商与合作。