忽如一夜春风来,DeepSeek的风,一下子吹开了政务大模型的市场。
“2月16日那一周,感觉全中国的政府企业都在上Deepseek,甚至很多单位原来一张卡都没有,突然就有了DeepSeek满血版。”金山办公Office产研事业部副总经理刘丹说道,“那段时间我认识的大部分领导也都在问,‘你们到底什么时候接,怎么样的节奏’,整个行业都特别火热。”
可以说,DeepSeek的爆火,开启了政务大模型落地的春天。
而在DeepSeek落地政务场景中,最直接受用的场景之一,就是AI办公赛道,如公文写作、校错纠对、一键排版、PPT制作、智能搜索、智能问答、智能运维等。
“典型的重复性工作,特别适合用AI来替代。”金山办公数字政务事业部副总经理王少康说道。
事实上,早在2017年左右,AI就已经开始与政务服务进行融合,早期的应用也主要集中在智能客服、智能问答和文件处理等方面。
而此次DeepSeek的爆发,则让政务协同办公的智能化转型从“单点突破”迈向“全域赋能”。
但,DeepSeek或一个通用大模型的部署,只是大模型在AI办公中落地的万里长征的第一步,真正地深入应用,往往会遇到更多问题。
如私有化知识获取、专业化场景适配、模型微调、数据质量保障、保护权限安全等,“这些都是通用大模型无法解决的问题。”王少康说道。
那么,在政务办公赛道中,大模型究竟该如何实现更好的落地应用?同时,相比其他赛道,政务业务对数据的安全要求更高,又该如何保障大模型落地过程中的数据隐私安全问题?
“最大的影响,还是解决了成本问题。”当谈及为什么DeepSeek来了之后,政务大模型行业突然爆发的原因时,金山办公副总裁史高峰如此说道。
金山办公副总裁史高峰
一方面,DeepSeek将大模型进行了开源,各个政企单位不需要再单独为大模型进行付费;另一方面,DeepSeek也带来技术上变化和升级,在推理和问答能力上,相比去年都有很大提升。
而DeepSeek开源带来的最大好处,是可快速、本地化部署,这也与政务应用有很强的共性。
因此,自2025年2月起,DeepSeek在政务领域的应用呈现出爆发式增长态势。据统计显示,仅2月,全国已有超过150个政务机构完成本地化部署,覆盖多种政务服务场景。
一夕之间,掀起全国各地政府部门接入DeepSeek狂潮。而在其中,基于DeepSeek尝试做AI办公的探索,也成为众多政府单位在部署DeepSeek后率先落地场景之一。
如在深圳龙岗,公文写作助手能进行政策解读、文件起草和智能校对,以往人工校验1000字文章至少需四五分钟,还易出错,现在借助DeepSeek能秒级完成,公文处理效率大幅提高。
海南省三亚市天涯区政府,将DeepSeek本地化部署试点首阶段聚焦在了公文处理场景,借助DeepSeek,原本需要耗费数小时查阅资料、构思框架、组织语言才能完成的公文初稿撰写工作,短短几秒即可生成初步文本,审核效率相较于以往手工审核也大幅提升90%。
因此,对于专注于办公赛道的玩家来说,“今年去推动党政业务的AI落地,我觉得是一个特别好的契机。”刘丹说道,“毕竟DeepSeek已经出圈,每一个党政领导都知道DeepSeek,甚至很多已经部署DeepSeek。”
早在2021年前后的GPT-2时代,金山办公就已经利用相关技术与工信部对公文写作等相关业务场景进行探索,但受限于技术水平等问题,却始终停留在科研层面。
到2023年,金山办公正式发布了WPSAI1.0。去年7月发布WPSAI 2.0并首次公开了13B级别的政务自研模型——金山政务办公模型1.0,同年12月,金山办公发布了首款自研政务大模型。今年4月中旬,正式发布了政务大模型增强版,引入深度推理能力。
在金山办公政企业务赛道的布局中,是以WPS 365一站式AI办公平台为基础应用,实现对党政智能化办公能力的全覆盖。
从目前整个市场来看,国内面向企业和个人办公赛道的玩家中,飞书和钉钉更聚焦在企业赛道,而金山办公则原本在政企市场中扎根就是最深入的。
不过,史高峰也对光锥智能坦言:“对党政来讲,产品的提升才刚刚开始,因为前两年政府在做系统的替换,在大模型和AI办公的投入和部署会滞后一些。”
DeepSeek的通用能力很强,但在党政单位,仅仅部署DeepSeek,却并不能一劳永逸。
一方面,DeepSeek是通用基础大模型,其数据语料更多来源于互联网,缺乏专业的语料训练,这也就使得,其存在大模型幻觉问题。
据权威机构调研和评测,Deepseek大模型的幻觉率达到14.3%,远超于同类大模型的水平。
在很多评测中也有显示,部分党政AI助手,由于缺乏足够的数据,往往会“一本正经地胡说八道”,即为了迎合提问者生成看似合理但实际上存在虚假内容的回答。
因此,不难看出,尽管DeepSeek能够在文学创作或哲学思辨领域,给予用户非常好的回答,但党政办公领域,往往需要更严谨的表达和更详实的数据,而不是诗意的创作。
这种情况下,以Deepseek为代表的通用大模型的部署,仅仅是政务大模型落地的第一步,通用大模型+行业大模型+专业大模型的协同作战,才是政务+AI的最优解。
用通俗比喻来说,军队打仗需要武器,这个武器不能仅有核武器,还要有迫击炮、冲锋枪,甚至需要手枪、狼牙棒,可能都会有用武之地。
“只有高低搭配,因地制宜,才能使这个军队更有战斗力。”王少康说道。
在金山办公政务大模型增强版的中间能力层上,就包含两个基础大模型,一个是以Deepseek为代表的通用大模型,一个就是金山办公的政务大模型。
其中,以Deepseek为代表的通用大模型综合能力足够强,但在政务专业能力上偏弱,其资源消耗比较高,运行效率比较低。
金山办公政务大模型是基于亿级政务语料训练而成,适合私有化部署,支持信创,面向政府垂类的13B政务大模型,升级版政务大模型从13B扩大到32B,并引入思维链强化学习技术,增强深度推理能力。
据介绍,此次金山办公政务大模型升级后,公文写作质量提升71.58%,意图理解能力提升34.87%,公文排版能力提升12%,“在公文写作上,我们大概能释放公务员30%-40%的工作精力。”史高峰说道,“我们也希望能够通过提升34%的效率,真正能够给公务进行减负。”
除大模型之外,中间能力层还包含专业小模型,其在综合能力和政务能力上都会偏弱,但其在特定任务的能力方面比较强,比如排版、元数据抽取等特定任务,“小模型完成效果会比大模型更好,且资源消耗特别低,运行效率也更高效。”王少康说道。
无疑,特定的行业,有特定的需求,甚至不同的部门都有不同的使用需求。
就拿公文写作来说,其是一种特殊文体,有特定的文风要求,如行政公文、带红头的文件、事务公文等多达数十种,想要清晰地知道具体区别,不是党政机关的资深人员,都很难弄懂。
针对不同类型的公文,金山办公研发了多种智能写作算法,对于事务性、程序性、高度模式化的公文,如通知、请示、函件等,开发了模板化写作功能,能够让文件撰写的一气呵成。
另外,党政单位在对公文的校对纠错上要求也非常高。
当前,众多同类型产品都具备校对和审核功能,但金山办公政务大模型增强版不仅能够识别文稿中的基础性错误,如政治性、知识性、拼写性错误,还支持对校对内容进行个性化维护。
此外,还能够精准识别文稿中的引用错误,并实现一对多的逐句校对、修改和提示。
例如,在公务人员撰写公文时,常会引用重要讲话,金山办公政务大模型增强版将帮助确认引用的权威性和准确性,确保无缺字漏字现象,避免因一字之差导致意义的大幅偏差。
金山办公政务大模型增强版还可以构建一个智能化与安全性并重的知识问答平台,即确保知识来源的可靠性,实施严格权限管理,排除算法偏差,确保内容真实可追溯。
而能够如此精准满足党政单位机关需求的背后,不仅仅是大模型能力的升级迭代,更重要的,是能够盘活整个政府侧数据资源,形成完整的政府资源库,才能够让大模型更懂政务办公体系。
想要打仗,光有武器也不够,还需充足的弹药。政务大模型的“弹药”,就是政务数据资源库。
“我们光有大脑的算力,是不具备思维能力的,所以还需知识和记忆。”王少康说道。
所谓的知识和记忆,就是金山办公通过公开和权威渠道收集的三大类数据资源:
一是通过权威渠道,收集整理政务办公领域通用知识,如领导重要讲话、二十大工作报告、政府工作报告、党建信息库、政策文件、综合政务信息库、法律法规和市政要素等。
二是写作素材库,包括模板、范文、文采、素材等,金山办公会内置资源,用户也可以自行维护自己的模版,毕竟在不同的单位可能有不同的模板,和不同的范围和协作的要求。
三是私域数据库,这部分信息存储在用户OA系统、档案系统中。私有数据库非常重要,这才是用户真正的灵魂记忆所在,“我们也通过接口在线数据更新机制或离线数据更新机制,将其纳入到我们政务资源库中。”王少康说道。
通过把这三类主题数据资源集合到一起,就形成了政务大模型落地的“弹药库”。
“这么多年,党政机关其实已积累了很多非常有价值的权威数据资源,包括公共数据资源、机关内部数据资源,及部门内数据资源等,以前很难真正发挥这些数据的价值。”王少康说道,“而现在有了AI大模型技术的加持,完全可以激活这些资源,更好的服务党政机关和全社会用户。”
盘活这些数据资源,是推动政务+AI落地的关键一环。
在党政智能办公赛道的落地应用中,金山办公聚焦在六大应用能力上,包括三个标准应用:公文写作、政务资源库,政策的查重对比,三个共创应用:智能分鉴,知识专题和政策一致性分级。
“目前三个标准应用已经在多家用户单位长期落地,并已经具备了大规模推广的能力。”王少康说道,“共创能力虽然已经在部分单位实现落地,并取得一定应用成效,但我们认为锤炼的还不够,仍需进一步成熟。”
事实上,在面向政府单位的上层应用,WPS AI可以说是一个通用的办公软件工具。比如在某省大数据局的AI多维表项目中,可以基于WPS AI的多维表做零代码搭建。
在一张网项目中,需要建立一个贯穿全国的非结构化数据的汇聚、管理、应用平台,要把这个行业里面最核心的文档,一网打尽,全部汇入文档中心,“目前已经面向6个省接入文档处理服务的接口,每个月的调用量大概是200万调用量。”刘丹说道。
从传统办公到智能办公,在AI+在线协作的加持下,数据收集的效率也得到大大提升。之前需要1~2个月自下而上收集的数据,现在几天就能快速完成。
“对团队整体提效,是对政企客户来说更具有吸引力的点。”史高峰说道,大模型对党政机关办公智能化升级,并不是颠覆现有工作流,而是基于现有工作流的辅助,实现效能提升。
除了现有效率的提升,更重要的是,智能办公文档就天然形成了政务部门自己的专属知识库,从而能反向促进业务效率的进一步提升。
无疑,尽管当前各地政务部门对DeepSeek的本地化部署如春笋般蓬勃生长,但生机下仍存在“应用深度”“地域差异”“使用体验”等方面的不足。
在智能化办公升级赛道,仅凭DeepSeek,也很难满足各部门的差异化需求。而在大模型落地应用过程中,也存在包括对数据的应用、大模型微调、数据安全隐私保证等问题。
这些坎但凡有一个迈不过去,整个办公智能化的路线,就会受阻。
通用大模型+行业大模型+专业大模型的协同作战,盘活数据的“弹药库”,兼具对AI工具应用的个性化需求,或许才能让“AI升级党政智能化办公”迎来真正的春天。