沈逸:缩小数字鸿沟,需要更多DeepSeek
10 小时前 / 阅读约5分钟
来源:凤凰网

OpenAI2月6日宣布向所有用户开放ChatGPT搜索功能,无需注册。不少分析认为,这是受到深度求索(DeepSeek)开源的压力。的确,DeepSeek将相关模型置于开源社区向全球开放的做法,不仅给技术生态和人工智能大模型发展生态带来全新冲击,而且正在以一种鲶鱼效应推动人工智能领域的领先企业走向良性竞争,有效促进人工智能普惠包容发展,为全球数字化转型注入新的动能。

性能与成本优势,成为DeepSeek大模型最受关注的焦点。自发布以来,全球AI业界均承认该大模型在技术架构、训练算法及硬件资源利用方面实现了显著突破,也具有明显的训练以及部署成本优势。这实际上给出了一个至关重要的信息:在人工智能发展突飞猛进,日趋成为国家竞争焦点的当下,人们高度关注人工智能的普惠以及包容发展;更直白地说,就是希望人工智能的发展,能够让经济上处于相对弱势的国家与非国家行为体,也能够享受人工智能带来的优势。

虽然英伟达CEO黄仁勋提出了“主权人工智能”的概念,但是在DeepSeek问世之前,人们看到的,更多是类似美国推出的“星际之门”项目,不仅初期投入动辄达到千亿美元的量级,它的运维成本、供应链安全、可持续部署成本等均显著超出大多数“全球南方”国家可以承担的水平。联合国在《全球数字契约》中提出了包容发展、数据主权、技术透明与责任治理等一系列原则,倡导建立公平、普惠、包容的全球数字生态。然而,在DeepSeek问世之前,如何在人工智能大模型发展的实践中践行这些原则,仍然是一个极具挑战性的难题。特别是如何避免人工智能被个别发达国家及其核心盟友垄断,如何保障算力芯片等关键元器件的供应链安全,都是亟待解决的问题。

在此背景下,就能够意识到DeepSeek作出的更大贡献:通过采用高效分布式训练策略、梯度累积技术以及动态调整学习率机制,使得训练过程中的能耗和部署成本大幅降低,降到了“全球南方”国家可以承受的程度。可以说,DeepSeek的推出有效回击了2023年OpenAI的CEO奥尔特曼访问印度时的表态。他当时对印度团队想用1000万美元进行基础模型训练表示怀疑:“与我们(指OpenAI)竞争完全没有希望”。

DeepSeek大模型发布后不久,百度智能云、华为云、阿里云、腾讯云、360数字安全、云轴科技等多个平台宣布上线DeepSeek大模型;在全球范围,微软Azure、亚马逊AWS、英伟达等,均以嵌入服务等方式,实现了对DeepSeek开源模型的支撑。作为一个纯市场化运营的科研团队提供的DeepSeek开源模型,已经迅速为全球人工智能治理的良性变革注入了巨大的动能,为推动国际社会共同构建普惠包容的数字未来提供了重要的实践支撑。

当然,整个过程不会是一帆风顺的。无论是针对DeepSeek的网络攻击,又或者是来自一些国家政治上抹黑、技术上贬低、使用上限制,甚至直接打压等,都说明个别国家的某些行为体,在谋求人工智能霸权、炒作相关议题等方面,投入了近似“输不起”的沉没成本。“一旦有适当的利润,资本就胆大起来。……为了100%的利润,它就敢践踏一切法律;有300%的利润,它就敢犯任何罪行,甚至不惜冒绞首的危险。”(《资本论》脚注)这样的判断,同样适用于对未来全球人工智能治理领域发展的研判与展望。

因此,可以想见的是,全球需要负责任的国家充当强有力的引领者,能够为人工智能的良性发展提供有效支撑。从实践看,中国在共建“一带一路”倡议框架下倡导的“数字丝绸之路”,与DeepSeek的开源大模型之间,存在某种天然的契合点。DeepSeek的开源大模型,具有可以被精细化定制的公共产品的属性;“数字丝绸之路”倡导的原则,无论是对互联互通、共商共建共享的倡导与实践,还是对普惠包容发展的尊崇,从治理规范和原则上都提供了坚实的保障。中国相关企业的技术能力,从大模型到算力芯片,再到相应的云服务,以及支撑的数字底座,可以提供更具安全感和可信度的供应链产业链保障。

有理由相信,在各方共同努力下,DeepSeek已经开源的大模型,有助于推进以更快的速度,实现联合国《全球数字契约》中人人享受数字红利的美好愿望,为缩小全球数字鸿沟、在数字革命的背景下实现社会公平,注入强大的动力与确定性。全球各主要行为体应以此为契机,加强务实合作、推动政策创新,共同打造一个更加美好的数字未来。(作者是复旦大学网络空间国际治理研究基地主任)