近期,外媒纷纷将聚光灯投向中国初创企业深度求索公司,其自主研发的人工智能(AI)大语言模型“深度求索”(DeepSeek)凭借“好用、开源、免费”三大特点,在全球范围内引发热烈反响。这一创新成果不仅在中国本土大放异彩,更是在大洋彼岸的美国乃至全球科技界激起了广泛讨论并受到高度评价,被视为挑战现有AI巨头垄断地位的“一股清流”。
多家外媒接连不断的报道,让DeepSeek这一出人意料的、高效而强大的AI模型席卷了科技行业,这种“改变游戏规则”的大型语言模型,有望快速重塑AI格局。
1月最后一周,中国开发的DeepSeek应用程序在苹果应用商店的下载次数远超美国Open AI 开发的ChatGPT。
低成本兼具高性能
西班牙《国家报》、澳大利亚《对话》杂志、美国《纽约时报》等多家外媒均关注到,DeepSeek的技术具有强大创新力,是因为它能在降低计算成本的同时实现尖端性能。
AI公司通常使用装有1.6万枚或更多专用芯片的超级计算机来训练聊天机器人,但深度求索公司表示,他们只用了大约2000枚芯片。同时,他们仅花了不到600万美元就训练了新模型,成功在两方面把构建AI的价格“打了下来”。
首先,DeepSeek模型使用数据蒸馏技术生成高质量数据,提升了训练效率;其次,DeepSeek采用了一种称为“混合专家”的方法。当用户提出一个问题时,模型会决定是否激活其医疗专家、翻译、律师或物理学家。传统模型会同时激活所有专家,这会浪费能源和计算能力。而DeepSeek则将这些小型“专家”系统与一个“通才”系统相结合,实现了相同的功能。通才系统对每个主题都有相当的了解,可帮助协调专家之间的互动。
开源策略打破技术垄断
Deepseek的独特之处还在于,其采取了开源策略。这犹如在美国及少数几个长期主导AI技术领域的巨头中投了一枚震撼弹,打破了既有格局。
如今,这项技术已向全世界敞开大门。鉴于DeepSeek模型免费可得,其他公司或将不得不调整价格策略,以保持市场地位。当能够以零成本获得类似技术时,没有人愿意支付额外费用。
《对话》杂志报道称,与专有AI模型占主导地位的美国不同,中国AI新创企业拥抱开源生态系统,以更快地扩大创新规模,并融入全球AI合作。
得益于人才培养与政策支持
在近日的法国人工智能峰会上,多名国际科技界高管均认为,DeepSeek 的出现表明,在AI领域,中国企业的进步不容小觑。
《自然》杂志报道,2017年,中国政府宣布,计划到2030年将中国打造成为全球AI领域的领头羊。政府要求相关行业在2025年前实现AI领域的重大突破,“使相关技术和应用达到世界领先水平”。
据美国乔治城大学安全与新兴技术中心的一份报告,截至2022年,中国教育部已批准440所大学开设AI专业本科学位。美国智库MacroPolo数据显示,同年,在全球顶尖AI研究人员中,华人几乎占据了“半壁江山”,而美国人仅占18%。
澳大利亚悉尼科技大学科技政策研究员马丽娜·张专注于中国的创新研究。她表示,DeepSeek公司的成功得益于政府对AI教育和人才培养的投资,这些投资包括众多奖学金、研究经费以及学术界与产业界的合作。
创新重塑全球AI格局
美国趣味工程网AI专栏作家塞贾尔·夏尔马发表评论称,如此强大的模型出自中国,让美国感到“坐立不安”。英国广播公司则直接在标题中称,“中国的DeepSeek AI震撼行业,削弱美国霸权”。
美国总统特朗普当地时间1月27日在佛罗里达州迈阿密发表讲话时,称DeepSeek的出现“给美国科技产业敲响了警钟”。
美国《麻省理工技术评论》网站在报道中表示,考虑到中国AI企业面临美国对尖端芯片出口管制日益收紧的制约,DeepSeek的成功“更显非凡”。种种迹象表明,美国的制裁并未削弱中国的AI实力,反而似乎正驱使深度求索等初创企业以效率、资源整合和协作为优先方向进行创新。《国家报》报道也认为,美国制裁加速了中国AI创新。
美国消费者新闻与商业频道网站援引专家观点表示,美国自认为处于世界科技领袖的地位已不再被普遍接受。
中国人工智能发展的破局与担当
(记者 张佳欣)
【责任编辑:朱家齐】