《中国信通院:2023政务大模型建设路径及评价体系研究报告(49页).pdf》由会员分享,可在线阅读,更多相关《中国信通院:2023政务大模型建设路径及评价体系研究报告(49页).pdf(49页珍藏版)》请在三个皮匠报告上搜索。
1、政务大模型建设路径及评价体系研究报告政务大模型建设路径及评价体系研究报告 参与单位北京百度网讯科技有限公司中国信息通信研究院云计算与大数据研究所政务大模型建设路径及评价体系研究报告目 录一、政务大模型建设势在必行.1(一)新形势:中央部署加快人工智能在各领域发展与创新.1(二)新方向:大模型“横空出世”为数字政府发展注入新活力.1(三)新机遇:国内外积极探索政务大模型应用场景落地.3(四)新思考:政务大模型建设机遇与挑战并存.3二、政务大模型建设架构及关键技术.4(一)拓展政务服务版图:大模型技术发展要求架构变革.4(二)创新政务治理风潮:绘就政务大模型建设架构的壮丽蓝图.51.训练生产,夯实
2、平台基础底座.62.运营支撑,引领工程化新纪元.63.共性服务,融合政务优化升级.74.深化应用,催化政务创新演进.8三、政务大模型典型应用场景.9(一)大模型推动服务能力从“能办”到“好办”转变以一网通办为例.91.服务能力典型场景:一网通办业务概述.92.重塑服务边界:政府服务一网通办的变革与破局之路.93.大模型赋能政务服务一网通办场景分析.104.创新颠覆,智慧引领:一网通办大模型助力政务服务提质增效.12(二)大模型赋能城市治理精准化、智能化以一网统管为例.131.治理能力典型场景:一网统管业务概述.132.塑造城市新貌:城市治理一网统管的挑战与变革之途.133.大模型赋能城市治理一
3、网统管场景分析.134.创新治理,智慧绘城:一网统管大模型赋能城市治理敏捷高效.16(三)大模型提升政府协同办公效能以一网协同为例.171.协同能力典型场景一网协同业务概述.172.赋能高效协同:政府办公一网协同的挑战与破局羽翼.173.大模型赋能政府办公一网协同场景分析.184.创新交织,共铸卓越:一网协同大模型推动政府办公效率提升.20政务大模型建设路径及评价体系研究报告(四)大模型提升管理决策水平提升以水务管理决策为例.201.管理决策典型场景水务管理业务概述.202.强化决策流转:水务管理决策挑战与关键障碍.203.大模型赋能水务管理决策场景分析.204.创新共享,发展驱动:水务管理决
4、策大模型推动行业高效发展.22(五)大模型助力媒体与内容生成创新发展以智能媒体创作为例.221.内容生成典型场景智能媒体创作业务概述.222.重构内容生产:媒体智能化转型的危与机.233.大模型赋能媒体智能创作场景分析.244.创新生成,智领未来:大模型推动媒体创作智能化的引领范式.28四、政务大模型典型场景评价体系.29(一)建设政务大模型平台及典型场景评价体系的必要性.29(二)政务大模型平台关键评价指标.291.政务场景下的大模型平台建设.292.政务大模型平台的评价指标.30(三)“一网通办”典型场景-智能政务服务大模型关键评价指标.301.效果指标.312.功能指标.33(四)“一网
5、统管”典型场景-智能问数大模型关键评价指标.341.效果指标.352.功能指标.36(五)“一网协同”典型场景-智能公文写作大模型关键评价指标.381.效果指标.382.功能指标.40五、政务大模型未来发展趋势和建议.42(一)注重大模型自研芯片技术发展,助力大模型算力提升“硬”实力.42(二)不断迭代大模型结构升级,推动数字政府可持续演进.43(三)探索丰富政务应用场景,激发政府创新发展澎湃动能.43(四)完善政务大模型监管体系,赋能数字政府健康发展.44(五)推动政务大模型标准指标和评估体系建设,赋能数字政府健康发展.45政务大模型建设路径及评价体系研究报告1一、政务大模型建设势在必行(一
6、)新形势:中央部署加快人工智能在各领域发展与创新近年来,我国人工智能行业受到各级政府的高度重视和国家产业政策的重点支持。国家陆续出台了多项政策,鼓励人工智能行业发展与创新。中华人民共和国国民经济和社会发展第十四个五年规划和 2035 年远景目标纲要提出“培育壮大人工智能、大数据、区块链、云计算、网络安全等新兴数字产业”;数字中国建设整体布局规划提出“推进数字技术与经济、政治、文化、社会、生态文明建设五位一体深度融合”。同时,关于支持建设新一代人工智能示范应用场景的通知、关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见 等产业政策的发布也为我国人工智能产业发展提供了长期保障。根据
7、中国信通院测算,2022 年我国人工智能核心产业规模达 5080 亿元,同比增长 18%。人工智能持续赋能千行百业,政务领域成为其典型落地场景之一。2023 年,中共中央、国务院印发数字中国建设整体布局规划,旨在全面提升数字中国建设的整体性、系统性、协同性,促进数字经济和实体经济深度融合,以数字化驱动生产生活和治理方式变革,为以中国式现代化全面推进中华民族伟大复兴注入强大动力。当前,数字经济蓬勃发展,加强数字政府建设是适应新一轮科技革命和产业变革趋势、引领驱动数字经济发展和数字社会建设、营造良好数字生态、加快数字化发展的必然要求,是建设网络强国、数字中国的基础性和先导性工程。党中央、国务院高度
8、重视运用数字技术创新行政方式、提高行政效能。2021 年“十四五”规划纲要提出,将数字技术广泛应用于政府管理服务,推动政府治理流程再造和模式优化,不断提高决策科学性和服务效率。规划中瞄准人工智能等前沿领域,实施一批具有前瞻性、战略性的国家重大科技项目。人工智能等数字技术已经在数字政府相关“一网通办”、“一网统管”、“一网协同”等典型场景,以及智慧交通、水利水务、广电传媒等政务领域的创新实践中取得了积极成果,成为推动我国政府智慧化发展的重要推动力。(二)新方向:大模型“横空出世”为数字政府发展注入新活力人工智能是引领新一轮科技革命和产业变革的重要驱动力量,而大模型的发展对于推动产业优化升级、生产
9、力整体跃升具有关键性作用。2023 年初,OpenAI 公司打造的ChatGPT 火遍全球互联网,一跃成为人工智能 AI 领域的现象级应用,掀起了国内外对大政务大模型建设路径及评价体系研究报告2模型的探索热情。国内大厂纷纷推出自己的 AI 大模型,例如,百度推出“文心一言”、阿里推出“通义千问”、华为推出“盘古大模型”、科大讯飞推出“讯飞星火认知大模型”。国内三大运营商也推出面向行业的大模型应用,助力自身业务或客户业务的高质量发展,以清华大学、复旦大学为代表的高校也推出了自己的大模型。整体看来,大模型市场竞争格局呈现百舸争流之势。根据 IDC 数据,预计基于大模型的人工智能市场规模在 2023
10、 年将超过 147 亿美元,到 2026 年这一规模将超过 263 亿美元。政务大模型应用前景广阔,开启数字政府创新发展的全新范式。政务大模型是指应用于政务领域的综合大模型,包括语言大模型、视觉大模型和多模态大模型等。它通常具备强大的语义分析能力和深层次的理解能力。对外,它能够帮助政府机构提升信息处理效率和服务质量,实现业务办理的智能化。对内,政务大模型能够全面监测、分析和预测政务运行状况、决策影响因素和政策效果,为政府管理和服务等提供智能化支持。政务大模型凭借其更强的语言理解能力、更高的预测准确率等优势,在广泛的应用领域中发挥着重要作用,包含城市治理“一网统管”、政府服务“一网通办”、政府办
11、公“一网协同”,以及应用在多样化的泛政务场景。以城市治理“一网统管”为例,政务大模型在城市治理方面的应用能在诸多方面促进城市跨越式发展,通过打造城市通用智能问答大模型构建“城市对话入口”,在城市态势、基层治理、应急协同等多领域,打破固定服务管理模式,根据不同时机、地点、个人和情境做出明智决策。泛政务领域以政府部门与社会公众之间的信息共享和服务交互为基础,旨在提高政务效率、优化公共服务和加强社会治理。其中,泛政务应用场景涵盖了社会救助、就业服务、医疗卫生、教育、交通、水利等社会服务管理领域以及政务信息公开等。政务大模型同样在泛政务场景中崭露头角,提供协助和改善。在水利水务领域,将政务大模型等 A
12、I 技术与水务业务场景深度融合,打造涵盖供水、排水、污水、水环境、水利全业务链条的智慧决策体系,全方位支撑业务应用和业务决策,实现水循环系统的真正智慧化运行;在广电传媒场景中,政务大模型的应用将在基础能力、客户服务、业务运营和企业协同中涌现出众多创新场景,涵盖新闻报道、广告营销、影视创作、文学创作等多个领域,为主流媒体提供全新的业务开展范式。在新闻报道中,政务大模型可以通过分析海量的信息快速生成准确、客观的新闻内容,提供即时的新闻报道;在广告营销中,大模型能够根据用户的兴趣和行为数据生成个性化的广告内容,提高广告的精准度和效果;在影视创作和文学创作中,大模型能够帮助创作者快速生成创意灵感、完善
13、新闻,政务大模型建设路径及评价体系研究报告3拓展创作边界。(三)新机遇:国内外积极探索政务大模型应用场景落地从国际进展看,部分国家已经开展政务大模型应用的探索和研究。新加坡政府在2023 年 2 月开发出一套被称为“Pair”的系统,此系统类似于 ChatGPT,能协助政府办公人员总结参考资料、搜索相关信息并完善写作表达。2023 年 5 月 Meta 宣布人工智能培训和推理芯片项目,旨在提高新闻提要中提供广告和其他内容的推荐模型的运行效率。2023 年 6 月 7 日,OpenAI 为联邦机构、州和地方政府及其合作伙伴推出了新的 AzureOpenAI 服务,为现有的 Azure 政府公共部
14、门客户提供以前只能通过其商业云获得的生成人工智能功能。通过这项服务,公共部门客户将能够安全访问 GPT-3、GPT-4 和Embeddings,并通过 Azure 政府云环境大规模访问人工智能模型和算法。2023 年 6 月23 日,英国政府已承诺投入 2100 万英镑,在英国国民健康服务体系(NHS)部署基于人工智能(AI)的技术,以帮助诊断癌症、中风和心脏病等疾病。从国内推进看,政策引导方面,各地加强大模型产业顶层设计和布局,北京市率先出台针对性政策,上海深圳等地也积极探索大模型产业。2023 年 5 月 19 日,北京市经济和信息化局发布北京市通用人工智能产业创新伙伴计划提出实施大模型应
15、用创新标杆试点工程,逐步开展政务行业专有模型训练,探索政务服务大模型服务模式。2023年 5 月 23 日,北京市人民政府办公厅发布北京市促进通用人工智能创新发展的若干通知提出利用人工智能能力优势,实现大模型技术赋能,以及率先在城市大脑建设中应用大模型技术,为城市治理决策提供更加综合全面的支撑。北京市政务服务大模型的探索建设在推动大模型赋能行业发展、加快推进大模型落地实践方面具有示范带动作用,能促进各地政府探索发展大模型技术,并为政务大模型建设提供政策指引。上海、深圳等地也鼓励开展大模型的研发和产业化,给予政策支持,推动人工智能大模型创新发展,助力大模型多场景深度应用。(四)新思考:政务大模型
16、建设机遇与挑战并存随着大模型技术的不断发展,政府和相关企业积极创新,逐步探索大模型在社会服务管理、政务信息公开等政务场景的落地实践,推动大模型技术在政务领域深化赋能。尽管政务大模型的发展已经取得了一些进展,但在其落地应用的过程中仍然面临一些问题。政务大模型建设处于机遇与挑战并存的局面,需要进一步加强研究和实践,以推动政务大模型建设路径及评价体系研究报告4政务大模型的不断完善和应用。从使用者角度看,政务大模型需要考虑其所服务的企业、民众的需求和利益,以确保模型的有效运用和满足使用者的期望。同时也需要考虑对政府部门人员使用时所面临的困惑,即政府部门的人员和泛政务领域的人员可能需要接受相关培训和教育
17、,以更好地理解和利用政务大模型的功能和特点。此外,政务大模型在数据安全和隐私方面也需要引起重视,政府及相关单位应该采取必要的措施,确保用户数据的安全存储和传输,并维护用户的隐私权益。从建设者角度看,政务大模型的建设需要明确服务提供方对场景的精确理解。政府部门、泛政务领域相应单位和相关开发团队需要深入了解具体的需求和问题,以确保模型的设计和功能能够满足实际的应用场景并提供有用的解决方案。此外,政务大模型的建设还需要明确衡量投入产出比等相关因素。政府部门和泛政务领域单位需要对建设和运维成本、资源配置以及潜在的社会和经济收益进行综合评估,并确保在使用政务大模型时能够实现最大程度的效益。从监督者角度看
18、,充分考虑社会和法律层面的因素,以确保模型的合规性和公共利益,对政务大模型的使用进行监督和评估,确保其不会滥用权力或侵犯公民权益。同时,监督者应推动政务大模型的发展与标准化,以共同解决全球范围内的合规和伦理等问题。从运营者角度看,应具备较高的顶层设计能力与驱动能力。顶层设计的能力是对整个系统的把控和远见,而驱动能力则是推动政务大模型快速发展所必需的势能。通过有针对性的顶层设计,将大模型与政务目标有机结合,使其能够为政务决策和服务提供高效支持。其次,应具备建设转运营的能力。运营者需要深谙政务领域的内外在需求,并具备灵活的应变能力,以确保政务大模型能够持续创造价值和效益。此外,运营者应充分注重培养
19、与引进理解大模型专业化人,以支撑大模型产业有效发展。二、政务大模型建设架构及关键技术(一)拓展政务服务版图:大模型技术发展要求架构变革大模型技术跨越式的发展必然推动数字政府的建设和变革,当今 IT 架构已经逐渐演变成为适配 AI 技术发展的架构,从底层芯片到框架、模型和应用,这四层架构的变革将深刻影响云计算产业。云计算主流的商业模式也将从 IaaS(Infrastructure as aService,基础架构即服务)逐渐变成了 MaaS(Model as a Service,模型即服务)。政务大模型建设路径及评价体系研究报告5过去数字政府建设主要关注计算、存储、网络等基础云服务,现阶段乃至未
20、来将越来越关注模型质量、框架的优劣,以及芯片、模型、框架和应用这四层架构之间协同效率。大模型技术快速发展对数字政府智慧化升级的范式产生了根本性的改变,主要体现在四个方面。首先,在政务智能化应用升级中,过去的 AI 建模针对单个场景进行了定制化设计。然而,随着大模型技术的出现,建模更加通用化,跨任务、跨语言的建模不再成为难题。其次,人和应用的交互方式发生了根本性的演变。传统上,人对机器的互动是人类向机器学习适应的过程,然而如今,机器正朝着更人性化的方向发展,人们只需采用最自然的方式与机器互动,即可获得智能化的能力。这一新形态使得人机交互更加有效,操作更为便捷。再次,在很多应用场景中,典型的开发模
21、式是通过软件编程方式来去设计应用。随着大模型能力的展现和编程门槛的降低,如今的开发趋势出现了根本性的变革。在许多情况下,开发应用不再需要叠堆繁多的代码,而是被数据驱动的方式取代。这种变革代表了整个研发范式的演变,从过去依赖程序来开发应用,转变为以数据驱动的方式进行应用开发。最后,大模型具备分解和处理复杂问题的能力。通过调用外部插件实现思考到执行的无缝连接,进一步拓宽了大模型应用的空间。这些范式的变革意味着政务业务应用开发效率的提高,应用效果更好,用户体验更优。同时,随着大模型降低应用开发门槛的巨大效应,政务创新速度预计将获得显著提升。(二)创新政务治理风潮:绘就政务大模型建设架构的壮丽蓝图政务
22、大模型的建设架构应当充分考虑到不同层级的功能和需求,以实现高效的运作和优质的服务。政务大模型建设路径及评价体系研究报告6如上图,政务大模型的架构需要体现出生产平台、运营支撑平台、共性服务能力及创新业务应用四个层级,每个层级都有其特定的意义和必要性,通过各层级的协同作用,可以构建出高效、稳定、智能的政务大模型,提供更好的政务服务,推动社会进步。1.训练生产,夯实平台基础底座生产平台是政务大模型的核心层,主要包括数据采集处理、模型训练精调、部署推理、用户反馈等环节,政府及相关大模型应用方通过该平台持续开发和训练各种模型,用于预测、决策支持等任务,为将大模型包装为各类服务和应用提供配套基础设施解决方
23、案。在这个层级中,数据采集处理是平台的关键环节,平台能够支持海量大规模数据的处理和管理,对于高质量精标数据能够具备高效的标注能力,帮助构建高质量数据,进而驱动模型具有更好的效果;模型训练精调是平台的核心,平台能够融合多方大模型能力,提供“训练、精调、评估、强化学习”训练能力,从而训练出满足政务需求的大模型;同时,平台应集成一系列的大模型生产工具和算法,包括模型评估、模型转换、压缩优化、部署、用户反馈等全流程工具,让大模型的训练和生产变得更加高效和简单。2.运营支撑,引领工程化新纪元运营支撑平台是政务大模型的中枢层,是让政务大模型走向工程化应用的重要一环,政务大模型建设路径及评价体系研究报告7主
24、要包括综合数据管理、生成式应用组件、融合知识、运营管理等方面。其中:政务综合数据是对政策、经济、民生、城市治理、水利水务、广电媒体等政务领域数据的治理和融合,形成政务融合知识图谱数据源以及政务业务应用的基础数据;生成式应用组件包含意图组件、会话组件、检索组件、提示组件、安全组件。意图组件主要包含意图识别、意图澄清、语义识别(词槽填充、标签抽取,实体抽取),用于任务类问答;会话组件管理会话(对话)记录,又提供了因大模型 token 限制所需要的会话上下文精简策略;检索组件提供文档(DBschema、FAQ)导入、文档检索的基础组件;提示组件针对模型输入的提示文本(prompt)进行设计、优化和管
25、理的过程,具备引导模型生成特定内容、控制输出风格和方向、优化生成结果;安全组件提供业务安全审核,强调业务领域和意图过滤,重视业务精细化的安全配置。融合知识是将政务不同领域的信息进行整合、融合,不限于政策服务、产业图谱、事件图谱等,通过整合多领域的知识,模型能够更好地理解问题、提供更全面的解决方案,为政府决策和公共服务提供更有价值的支持;运营管理对政务大模型的日常运行、监控、维护和升级等活动的管理和控制,应具备业务评测、运行监控、服务授权、服务计费、多租户管理、风控管理等能力,以确保政务服务的稳定性和可靠性、提高服务的效率和质量。3.共性服务,融合政务优化升级政务大模型作为面向政务业务应用的工具
26、,应当具备交互式问答、生成式 BI、文案生成、政策解读、事件感知等多种共性服务能力,可以避免重复开发,降低开发成本,同时能促进政务服务标准化和规范化,提高政务服务的管理水平。交互式问答支持让用户通过自然语言方式提出问题和要求,由政务大模型快速、准确地回答问题,提供相应的政务服务。该能力可以提高政务服务的便捷性和效率,为居民提供更好的服务体验。例如,用户可以提问:“如何办理户口迁移?”政务大模型可以迅速回答并提供相应的办理流程和材料清单。生成式 BI 可将政务数据进行数据分析和数据挖掘,为政府决策提供数据支持。该能力可以提高政府决策的准确性和科学性,推动政府管理的智能化和精细化。例如,通过对城市
27、交通数据进行挖掘和分析,可以生成有关城市交通状况的报告和图表,帮助政府制定更有效的交通管理政策。政务大模型建设路径及评价体系研究报告8文案生成可根据政务服务的需求自动生成政务文本,如政策文件、通知公告、合同文本等。这种能力可以大大提高政务服务的效率和质量,减少人为错误和疏漏。例如,根据政策要求,可以自动生成租房合同,减少人工编制的时间和成本,提高政务服务效率和质量;未来此能力还能广泛加载到各种专业领域的文本与媒体生成。政策解读提供对政策文件进行深入解读,为用户提供详细的政策解读和解读报告。这种能力可以提高政务服务的透明度和公信力,增强用户对政务服务的信任和认可。例如,针对某项税收政策,可以生成
28、详细的政策解读报告,帮助用户理解和掌握政策内容;事件感知提供对政务领域的事件进行实时监测和分析,及时发现和处理问题。这种能力可以提高政府的应急反应能力和社会管理能力,减少社会不稳定因素。例如,通过监测社交媒体和新闻网站,可以及时发现和应对公共突发事件和社会热点问题。4.深化应用,催化政务创新演进政务业务创新应用层是政务大模型发挥实际价值的关键所在。在这个层级中,政府可以将训练好的模型及能力与业务相结合。通过模型的预测和决策支持,政府可以优化政策制定、资源分配,提升公共服务质量,还可以支持自动化流程、智能助手等功能,使政务管理更加高效和便捷。可以看出,生产平台、运营支撑平台、共性服务能力和创新应
29、用四个层级在政务大模型架构中各自扮演着不可或缺的角色。这些层级之间的协调和协作,可以实现政务大模型的全面发展和优化。同时,这种层级结构也有助于提高模型开发的效率、确保模型的稳定性,以及促进政府智能化管理水平的提升。总之,随着政务大模型建设架构和关键技术的不断成熟,大模型在各类泛政务场景中的应用未来将更加广泛和深入,将为政务工作的智能化和高效化带来更加广阔的发展空间。政务大模型建设路径及评价体系研究报告9三、政务大模型典型应用场景政务大模型应用场景覆盖多个层面,包括洞察、治理、兴业、惠民等。其中洞察、治理更倾向于服务数字政府自身能力建设与提升;兴业、惠民更倾向于服务数字经济开拓与数字社会发展。同
30、时,在数字生态、数字文化等领域,政务大模型也不断与各场景结合,形成有序的大模型赋能全场景,服务于数字中国全面发展要求。一方面,数字政府、数字经济与数字社会发展相对成熟有序,易于通过通用数字化能力如服务、治理、协同进行大模型重构,成为当前政务大模型落地的典型应用;另一方面,数字生态、数字文化等也不断通过产业数字化、数字产业化产生“双向融合、共同奔赴”的良好势头。因此,本章节选取服务、治理、协同、决策、创作等应用场景作为政务大模型典型场景。(一)大模型推动服务能力从“能办”到“好办”转变以一网通办为例1.服务能力典型场景:一网通办业务概述“一网通办”旨在推进数字政府战略,提高政府服务效率。通过整体
31、化、集约化的建设,实现了线上服务与线下服务融合共通。通过这种方式,政府可以提供更便捷的在线政务服务,减少繁琐的手续和流程,让群众更快速地办理各种事务,提高行政服务效率,改善群众的生活质量。因此,“一网通办”是数字政府战略的重要组成部分,也是助力群众美好生活实现的有效手段。2.重塑服务边界:政府服务一网通办的变革与破局之路一网通办的便捷化、智慧化是发展趋势,核心手段是智能化提升。当前阶段,群众、企业在事项办理过程中仍面临找不到、读不懂、办事难的问题。面对企业、群众愈发多样化的需求,政务咨询问答无法提供精准、个性化的信息和服务,大语言模型技术的出现,成为解决这些问题的关键。目前存在的问题包括:意图
32、理解难,服务找不到。政务咨询过程中,传统咨询问答机器人缺乏对人类意图的精确理解,仅通过预置问答方式,难以实现对群众、企业的诉求进行针对解答。事项办理难,服务效率低。事项办理过程中,对事项情形不理解、申请表填不好、证明材料不知道如何提交的情况,难以获得有效的服务支撑,导致群众、企业依赖线下政务大模型建设路径及评价体系研究报告10窗口办理。政策文件多,海量知识难掌握。在面对海量政策知识场景中,工作人员在政策制定、政策解读过程中,需要较高的知识储备和业务素养,工作难度较高,缺乏有效的业务辅助能力。当前阶段,大语言模型在某种程度上具备了对人类意图的理解能力,其回答的准确性、逻辑性、流畅性都逐渐接近人类
33、水平,可以从海量数据中学习、吸收和理解了海量知识,在此基础上,就可以按照用户的需求去回答问题、完成总结分析。借助大语言模型语义理解、海量知识学习能力,可进一步提高政务智能化水平,优化政策规范管理和精准服务,转变服务提供的方式,从被动式响应服务转为主动式的贴身服务,从而进一步提升群众、企业获得服务的便利度。3.大模型赋能政务服务一网通办场景分析加强民众咨询过程的意图识别和术语理解,公众找不到、读不懂成为历史原有模式下,咨询问答技术方案主要依赖于预置问答对的梳理,对用户不同的提问方式无法应答,同时覆盖的知识内容有限。如用户咨询“生二胎”相关内容,和政务服务的专有术语“生育登记”、“生育津贴”等有一
34、定的距离,群众、企业的口语化的诉求难以解答。也难以通过配置来覆盖群众、企业的不同提问方法,从而导致群众、企业找不到、读不懂、问不准。大语言模型能够有效弥补统问答技术的缺点,提供稳定、高效、运行流畅的解决方政务大模型建设路径及评价体系研究报告11案。通过大语言模型技术很好的实现了用户意图识别,如群众咨询“生二胎”相关内容,大模型能够基于语义的理解,明白是咨询生育相关服务内容,关联到政务服务的事项“生育登记”、“生育津贴”,实现对口语化的各类问题的意图理解,从而给予准确的解答,解决口语对话和政务术语之间鸿沟的问题,带来实质性效果的提升。提供事项办理过程中的边问边办的引导办理,提高公众服务效率和质量
35、原有群众、企业在事项办理过程中,常因在事项办理过程中,面临一些情形选择、表单填写、或者材料提交环节的问题,导致无法线上自助办理,需要专业的帮办人员给与解答。同时由于政务服务事项多、事项情形杂,也给帮办人员带来了很高的业务能力要求。大语言模型赋能政务服务事项办理过程,可以在事项办理过程中,针对企业、群众问题提供针对性解答,如“申请表单中的地址需要我填居住地址还是户籍地址?”,“提交了租房合同证明材料还需要同时提供房屋产权证明么?”等办理环节中的问题,实时指导企业、群众进行事项办理。同时借助大语言模型的生成能力,也可以结合申办人的具体情况,通过交互问答的方式获取申办人信息,自动生成事项申请表单,自
36、动申报办理,提升面向群众、企业的公共服务效率。政策法规设计辅助及政策解读生成,让海量政策知识发挥应有的价值政务大模型建设路径及评价体系研究报告12政府提供政策服务中,需要政府的工作人员对相关政策内容非常熟悉,才能开展政策制定、政策解读的相关工作,同时政策内容在触达企业时,企业也面临政策匹配难、政策读不懂的一些问题。大语言模型对海量知识的学习能力,让大语言模型成为行业专家成为可能。政策服务场景中,可以通过咨询大语言模型,提供历史政策情况,如“最近 5 年内和第三产业激励相关政策有哪些”;提供政策设计服务,如“制定一份服务业的激励政策,你建议从哪些角度考虑”;也可以通过大语言模型对发布政策进行人性
37、化解读,如“帮我解读一下政策,生成一份图文并茂的政策解读文件”。政策兑付场景中,从企业视角可以直接咨询“和我相关的扶持政策有哪些”如上问题都可以通过大语言模型提供精准化的服务能力和人性化的贴身服务效果,进一步提升对企服务过程中的服务效率和服务质量,优化当前政府与企业信息提供的交互模式,更好地帮助群众、企业找到匹配企业条件的补助和激励政策,让政策服务更加贴近企业现状,更能有效满足企业的需求。4.创新颠覆,智慧引领:一网通办大模型助力政务服务提质增效大语言模型赋能一网通办场景,可以提供全天候、全渠道的服务,减少人工服务的时间和人力成本,降低政务服务成本,提高政务服务效率和质量,进而提高群众和企业的
38、满意度。同时可以提升政务服务水平和形象,让群众和企业更加便捷地获取政务服务,提高政府形象和公信力。此外,大语言模型赋能一网通办场景还能够提供更加精准、个性化的信息和服务,以满足群众和企业多样化的需求。政务大模型建设路径及评价体系研究报告13(二)大模型赋能城市治理精准化智能化以一网统管为例1.治理能力典型场景:一网统管业务概述“一网统管”是从城市治理的突出问题出发,以跨部门联动应用场景为抓手,坚持“观管防结合、平急特一体”的原则,打造横向到边、纵向到底的城市运行管理体系,实现“一屏观全城、一网管全城”。通过“一屏观”,从数据融合的角度,利用互联网数据服务结合本地数据融合进行场景赋能,促进决策重
39、塑。通过“一网管”,从业务协同的角度,基于城市网格“多格合一、一员多用”,以场景化的形式进行多跨事件融合联动,促进管理重塑。整体推动城市管理手段、管理模式、管理理念创新,让城市更聪明、更智慧,让群众更有获得感、幸福感和安全感。2.塑造城市新貌:城市治理一网统管的挑战与变革之途“一网统管”在传统日常管理和应急指挥调度场景下,领导驾驶舱运行支撑方式较为固化,无法进行灵活实时感知分析,资源调度范围小,无法进行关联调度。基于生成式大语言模型技术围绕一网统管场景应用进行技术赋能成为必然趋势。驾驶舱指标固定模板,随机提问难以应答。以往指挥中心指标设计固定不变,无法按需调整。工作人员现场提问随机性、综合性较
40、强,数据展示效果与预期差距极大,且大部分情况以人工统计为主,难以满足动态需求。热点舆情后知后觉,研判质量难以保障。以往热点舆情发生且达到一定热度才会被发现,负面效应通常已经形成,工作人员相对比较被动。大模型赋能后可以根据海量信息自动研判,快速完成脉络梳理、观点总结、影响分析,主动发现事件并进行提醒。资源调度灵活性、实时性不足。通常情况下预置的方案或资源都是有限的,无法穷举所有情况,无法满足多样和实时资源调度的要求。大模型赋能后可以根据实时变化情况对资源给予灵活地按需调度,并实现与事件的实时关联。基层执行靠经验,事件处置参差不齐。以往基层事件处置人员针对各类事件处置完全凭借个人经验,通常不全面且
41、事件处置效率不高。大模型赋能后可以提供解决与解释的处置建议,从而提高处置效率和群众满意率。3.大模型赋能城市治理一网统管场景分析政务大模型在“一网统管”领域,面向决策分析等“一屏观”场景或协同联动处置等“一网管”场景,可以结合大模型广泛的数据预训练学习,利用在自然语义理解、内政务大模型建设路径及评价体系研究报告14容创作、数理逻辑推算、多模态生成等特性能力,颠覆现有一网统管的交互、分析、调度模式,实现数据洞察从静态到动态,城市事件分析随需生成;城市资源调度从有限到无限,实现资源调度泛化管理。将各类数据打通激活,发现问题的根本原因,从以前只能快速解决几个固定高频场景的问题,到现在可以同时解决所有
42、成千上万场景的问题。一屏观:监测分析研判动态化,让固化的驾驶舱变得可灵活洞察、动态生成原有模式下,以经济运行分析场景为例,相关数据在没有融合预制的情况下,工作人员掌握区域经济运行情况需要进行搜集、整理和分析等过程,费时费力。现在,大模型赋能后,工作人员可以按提问要求进行语义理解,并拆解出具体的查询命令,进行数据组合分析;同时按需叠加相关联的临时数据,得到结果后通过大模型进行解读并进行总结提炼,生成可视化的图表并辅以专业的解读报告。同时,还可以按需进行下钻分析,如“实时查看本月开发区新增的企业有多少?新增企业规模如何?用工情况如何?”等都可以随意问、实时答。这种模式下的随机问与图表生成由原来的几
43、天变成现在的几秒,查询的数据反馈时间也由原来的几小时到几天变成了秒级反馈,类似场景的大模型应用将颠覆传统城市运行中心固化的驾驶舱应用模式,给城市进一步智能化、精细治理带来可能。一屏观:热点事件溯源精准化,快速还原城市热点原貌,分钟级生成城市治理“锦囊”原有模式下,城市热点事件的信息整理、分析并形成有效的处置方案需要花费较长政务大模型建设路径及评价体系研究报告15时间,时效性较差。如相关单位拿到其中某图片,要求工作人员把事件的来龙去脉了解清楚。这过程中往往互联网络的信息比较分散,事件脉络不成体系,无法第一时间形成方案向单位汇报。大模型赋能后,可以实现多模态落查事件,通过对视频、图片、文字等信息进
44、行多模态分析,从而定位事件。通过多模态分析和舆情事件分析能力,梳理出事件的关键要素并还原事件全过程,秒级还原事件真相。通过大模型训练学习以往类似案件,提升预案和处置建议推荐能力,分钟级推荐处置建议。运用大模型总结分析能力,针对事件脉络、关键要素等进行总结自动生成热点事件全景报告,实现了时效性的提高,从而促进城市热点事件影响变小。一网管:应急指挥反馈全面化,三预协同实现预测更准、预警更快、预案更实原有模式下,城市运行指挥中心调取摄像头等资源,技术手段上是通过人工按编号点选或通过语音按编号调取,调取范围较小、反馈时效性无法满足要求。如在指挥场景下,需要看到一个区域或一个相关范围的事件相关视频。工作
45、人员在得到批示后,通常都无法第一时间给予反馈,需要通过一系列筛选查找,时间上由几分钟到十几分钟不等,不能满足指挥的实时需求。政务大模型赋能后,资源的交互与调取将出现颠覆式变革,由原来的单点调取,变成按自然语言理解的“相关”范围调取。这个“相关”范围将随着大模型学习训练,不断精准调取期望的多个点位供查阅,并把关联度大的资源重点呈现,同时给出判断解释政务大模型建设路径及评价体系研究报告16或分析结论,解决人工调取实效性不足的问题。原有的应急预案或处置方案通常是预置好有限的几个或几十个方案,无法穷举所有情况。政务大模型赋能后,在事件现场发生意外或预置方案无法覆盖的情况下,提供了根据现场情况实时、自动
46、生成部署方案的可能性,为应急指挥提供了更多的参考建议和实施方案,从而满足应急场景下实时、多变的处置要求。一网管:协同联动处置辅助化,让派单从复杂变成简单,基层解决与解释都有助手原有模式下,城市事件派单效率不高,且难以解决的问题需给出解释,通常情况下依赖基层人员的经验积累,没有统一标准化的处置助手,难以做到既往知识有效利用。大模型赋能后,城市事件处置能够把全网络及城市历史处置经验进行归类、整理并形成知识助手,事件智能研判调度并给出解决或解释建议和依据。如针对小区电动车充电及停放问题多人投诉,涉及的处置部门较多,如何进一步解决?依据是什么?大模型助手可以提供帮助,针对住建局处置人员可有效解决的情况
47、,给出处置建议参考:如针对物业监督业主入户充电行为不利,可约谈小区物业管理公司,提供物业管理指导;针对该公司不作为行为,调降其行业评价等级等。大模型有效利用广泛的互联网信息和历史经验,为基层工作人员提供辅助化处置建议,避免了经验不足、问题处置不当的情况发生。4.创新治理,智慧绘城:一网统管大模型赋能城市治理敏捷高效政务大模型建设路径及评价体系研究报告17政务大模型赋能一网统管,面向监测预警、决策分析、应急指挥、协同联动等场景下,可以得到全新的交互式体验,打破当前只能预置分析模板和视图的模式,提供交互式生成式分析能力。赋能“一屏观全城”,让驾驶舱由静态变成动态,决策分析数据实时随需获取,解决指挥
48、决策的动态需求,关联能力强并支持跨类目的数据分析,打通激活城市各类数据,实现成千上万场景的智能问数、热点洞察,让发现和解决问题的时间从几小时缩减到几分钟。赋能“一网管全城”,让资源调度由有限变成无限,实施部署方案实时随需而变,资源调度的方式从单“点”向事件相关联的“面”转变,范围和精度都将大幅度提升,有效调度反馈时间从几分钟或十几分钟变成实时反馈,预置方案从几个或十几个变成实时动态生成。极大的扩展了指挥调度的调度范围,为实现智能化、精细化治理提供了技术保障。(三)大模型提升政府协同办公效能以一网协同为例1.协同能力典型场景:一网协同业务概述“一网协同”作为数字政府三个核心组成之一,主要面向政务
49、运行和内部管理,服务于政府内部工作人员。利用人工智能、大数据等数智技术手段,构建跨部门、跨层级、跨地域、跨系统、跨业务的协同工作平台,推动集约建设、资源共享、业务协同。围绕办文、办会、办事,通过不断提升内部办公、机关事务管理等方面共性办公应用水平,推动机关内部服务事项线上集成化办理,形成各级机关核心业务全覆盖、横向纵向全贯通的全方位数字化协同工作体系,持续提高机关运行效能。2.赋能高效协同:政府办公一网协同的挑战与破局羽翼随着国内外以预训练大模型为代表的通用人工智能技术取得重大突破,大模型赋能智能办公是重要应用方向。政府内部协同办公的智能化提升也成为各地协同公办平台升级方向。实际操作中,我们也
50、看到许多问题,阻碍办公的高效性,亟需新技术赋能。公文处理效率不高:公文种类繁多,内容涉及领域广。目前无论是公文的写作、审核、还是处置、查询均依靠人工与经验,效率不高且容易出错。大模型赋能后,借助大模型语义理解、文本生成等能力,可以为公文的拟订撰写、审核校验、搜索查询提供智能助手,大幅提高办文效率。政务大模型建设路径及评价体系研究报告18会议安排手段落后:部门多,人员多,各部门之间的信息传递和相互协作难以协调,会议申办、安排、记录、会后工作安排耗费较多人力与时间。借助大模型自然语言交互能力、推理能力、任务调度能力,可以全面提升办会效率,以及会后事项的跟踪落实。办事执行过程繁杂:政府专项工作协同推
51、进、督查督办,以及内部事项办理等工作均需要大量的信息交流与数据交互。传统模式下,这些交流和交互依靠人的传导,浅层信息化技术支持下,部分过程搬到线上,一定程度上提高了协同办事效率。大模型技术支持下,更符合自然语言的交互方式、智能化的知识提炼、更加灵活的信息与数据查询获取,将极大提高协同工作效率、督查督办效能,简化内部办事流程。3.大模型赋能政府办公一网协同场景分析赋能政务办公“办文”场景,智能公文助手大模型技术赋能政务公文写作与处置,将政府对外公开政策法规、内部公文、常用文、行业动态、经典案例等信息进行沉淀管理,依托大模型的理解能力和生成式能力进行训练与泛化,提供智能写作助手,提供相关公文智能检
52、索推荐功能。通过提示词方式,引导大模型依据文档主题,自动生成文档内容,给予写作人员提供参考灵感,让政府工作人员在公文写作场景下大幅提效。智能化对公文内容进行检查核验,节省人工审核工作量,保证发文质量。赋能政务办公“办会”场景,跨部门会议一键组织政务大模型建设路径及评价体系研究报告19大模型赋能政务会议组织,可通过口语化的交互方式,智能拟制会议方案,预定会议时间和地点。会议通知可与领导日程实时共享,精确到人实现会议的自动通知,减少会议组织协调时间。可将会议资料一键转入会议议题,智能记录会议内容,自动提取会议纪要并与督办、公文、重点工作任务、档案等系统协同对接,让会议决议落地更高效。赋能政务办公“
53、办事“场景,督办事项一键跟踪大模型赋能机关内部“最多跑一次”系统,可实现内跑事项的便捷咨询办理和智能辅助审批;赋能督查督办体系,可通过口语化的交互能力,实现多维度考核指标动态生成,任意事项的灵活跟踪,让原有固化的数据看板升级为按照动态需求灵活变化、实现政务大模型建设路径及评价体系研究报告20数据的高效分析。4.创新交织,共铸卓越:一网协同大模型推动政府办公效率提升生成式大语言模型在各领域取得突破性进展,大模型技术赋能政府办公一网协同在北京、浙江、深圳等发达地区已开展场景探索。提升政府工作人员的办公效率,现有的政府办公体系智能化升级,是智慧政务领域抢抓数字经济发展机遇、推进应用创新、切实推动社会
54、数字化转型的必要条件。(四)大模型提升管理决策水平提升以水务管理决策为例1.管理决策典型场景水务管理业务概述水务管理业务是水务场景综合管理能力交织核心,通常可应用于实现水务工程运维检修、水务客服和水务运营智能化等,通过融合 AI 技术,简化操作流程,提升运营效率,简化知识检索步骤,促成水务专业知识的积累和获取,可进一步强化水务业务综合管理。同时,水务管理中核心知识模块还支持赋能人员培训、提供调优建议,显著提高水务决策中知识的应用效率,深化水务运营专业经验的积累。2.强化决策流转:水务管理决策挑战与关键障碍1)信息互通的便捷性低水务现行运维场景多基于人工经验,历史数据收集与整合不足,导致信息分散
55、。亟需结合历史数据与专家知识库等,整合现有信息,提供运维建议,进一步提升水务相关企业内部运维水平。2)企业运营效率低水务企业流程传统,多以人工方式扭转、传递,过于依赖人工,易产生进度不明、流程阻塞等问题,损害运营效率。水务管理水平提升需要结合先进人工智能能力实现自动判断,优化水务流程,实现自动化判定,降低人工干预,以显著提升运营效率。3.大模型赋能水务管理决策场景分析场景赋能水务工作,让工程巡检更加高效政务大模型建设路径及评价体系研究报告21工程运维人员通过自然语言交互的方式,实现设备参数、状态信息、检修维护信息的快速查询,参考历史事件库、专家经验库、规则库,大模型提供可追溯的知识查询、分析、
56、决策辅助服务,融合数字孪生工程建设知识库成果,为工程运维巡检提供一站式知识生产和服务能力。赋能水务客服,让民生服务更加便捷借助大模型重构水务客服知识库,从传统的搜索方式升级到对话方式,提升知识利用效率,通过自动知识推送实现应答辅助;同时,基于大模型自动沉淀客户关键信息,实现会话小结,从聊天记录生成会话摘要;此外,通过大模型进行自动判别、理解,并政务大模型建设路径及评价体系研究报告22实现工单自动派发,更加高效、智能实现客户服务。赋能水务运营,让水厂运营更加高效借助大模型针对水厂运营全流程构建水务运营知识顾问,将水务专业系统(如 SCADA系统)的数据和污水厂的运行手册、经验输送给大模型,让大模
57、型去学习污水厂运营和管理人员的经验,经过训练的大模型将会成为不断迭代的运营专家,覆盖知识沉淀、助力人员培训、提供调优建议,并支持知识发现,从而提升水务运营决策的知识利用效率,沉淀水务运营的专家经验。4.创新共享,发展驱动:水务管理决策大模型推动行业高效发展水务大模型面向水务工程运维检修、水务客服和水务运营场景,从海量数据中提取有价值的信息,通过共享数据和信息,水务相关企业可以更好地协同工作,这种协作和共同创造不仅提高了行业的效率和创新力,还为水务行业的可持续发展奠定了坚实的基础,大模型的应用正在推动水务行业的创新和变革。通过数字化转型、智能化场景共同创造和创新,水务行业可以实现更加高效、智能和
58、可持续的发展。(五)大模型助力媒体与内容生成创新发展以智能媒体创作为例1.内容生成典型场景智能媒体创作业务概述智能媒体创作业务场景利用数字化与 AI 技术,为内容创作者和机构提供各类智能政务大模型建设路径及评价体系研究报告23创作工具,涵盖辅助创作,可以极大地提高内容生产效率,扩大内容生产规模。此外,对于内容生产机构最具价值的媒资内容运营管理方面,审核、标签和多模态检索等多项能力需要数字化与 AI 融合,升级迭代。2.重构内容生产:媒体智能化转型的危与机内容创作时代,海量内容不断生产,内容创作存在挑战。首先,如何从海量信息中,实时把握热点事件和价值信息是媒体创作的关键问题之一。这需要对信息进行
59、快速、准确地筛选和分析,从而确保新闻报道的及时性和准确性。其次,如何提高创作效率并第一时间触达用户也是媒体创作面临的重要挑战。在竞争激烈的市场环境中,快速发布新闻报道和内容创作是媒体机构保持竞争优势的关键。这需要优化创作流程,提高生产效率,并采用先进的技术工具来提高创作效率。另外,如何提升文章丰富度并避免错误也是媒体创作中需要注意的问题。文章丰富度指的是文章内容的深度、广度和可信度。为了提高文章丰富度,媒体机构需要拥有专业的记者和编辑团队,提供高质量的新闻报道和分析。同时,严格的审核和校对流程也是避免错误的重要保障。最后,如何覆盖长尾、冷门内容,以满足用户多样需求是媒体创作面临的另一个挑战。在
60、信息过载的时代,满足用户个性化需求是媒体机构赢得市场份额的关键。因此,媒体机构需要拓展内容覆盖面,关注长尾和冷门内容,提供更加多元化的新闻报道和分析。政务大模型建设路径及评价体系研究报告24综上所述,媒体创作面临的问题包括:如何从海量信息中把握热点事件和价值信息、如何提高创作效率并第一时间触达用户、如何提升文章丰富度并避免错误,以及如何覆盖长尾、冷门内容以满足用户多样需求。为了应对这些挑战,媒体机构需要采用先进的技术工具和优化创作流程,同时加强团队建设和审核校对工作。除此以外,在媒体内容生产与分发的全流程,都具备通过先进技术赋能的潜在需求。3.大模型赋能媒体智能创作场景分析大模型赋能智能创作场
61、景,应关注业务能力可赋能媒体创作中的“策、采、编、审、发”全业务流程,助力传统媒体和新媒体在选题策划、新闻生产、内容传播等领域深度融合。智能策划丰富选题思路,提升决策力智能创作平台覆盖全网新闻资讯,通过海量数据分析,实时汇聚互联网媒体内容,为选题提供热点新闻、热词分析、专题追踪、关键词监测、事件日历等服务。通过智能化构建事件脉络、知识关联与扩展等技术进行专题挖掘,助力媒体单位第一时间掌握全网关键信息、提供选题思路,堪称每周选题会的利器。1)关键词监测:可自定义关键词内容,对全网资讯进行实时监测,为选题策划提供时效性数据支持。2)专题追踪:展示热点事件的发展脉络和前因后果,按比重展示关键词词云和
62、关键实体信息,帮助媒体工作者深度追踪事件进展。3)大事件日历:从行业、事件类型角度,提供历史上当天的热点事件和资讯内容,为内容策划或生产提供创作灵感和内容思路。政务大模型建设路径及评价体系研究报告254)文案创作、大纲策划:大模型可以助力内容生产者,输入 Prompt 提示词,然后进行文案创作和大纲策划,为创作者和内容运营人员,提供灵感来源和资料参考。此外,还应该关注支持热点发现、热词分析、资讯概览、新闻线索,从时间、行业、地域等角度,为媒体工作者提供最新热点事件,还可以分析关键词热度趋势和相关新闻,汇聚全网最新新闻线索和权威媒体线索,帮助媒体工作者全方位掌握最新资讯动态。智慧采编聚焦生产,提
63、升内容创作效率和质量大模型应用于智慧采编领域,应具备自动写作机器人、文章写作助手和音视频生产政务大模型建设路径及评价体系研究报告26等能力。自动写作机器人覆盖金融、天气、体育赛事等领域;文章写作助手提供标题推荐、内容润色等功能;音视频生产支持音频、视频内容生产和处理能力,帮助媒体工作者高效完成内容创作。1)自动写作机器人:提供天气预报,每日基金,债券,沪深股票、港股、美股,篮球、足球赛事写作模板,通过预置相关数据,完成资讯新闻的自动生成,达到秒级创作。2)文章写作助手:辅助媒体工作者优化稿件内容,提供标题推荐、用词润泽功能,在思维枯竭时刻成为您的贴心小助手。3)音视频生产:当前提供 AI 声优
64、机器人、图文转视频、AI 作图等功能,保证零门槛快速上手,降低素材搜集、整理、匹配、剪辑的时间成本,实现全自动、智能化音视频内容生产。智能审校全方面保障内容质量大模型赋能内容审校,应支持多维度审阅校对,提供文章纠错、审核、一致性检查等能力,还可进行稿件对比,准确找出修改区域。1)文章审校助手:支持文章纠错、文本审核和数值比对,识别文章中的错误片段并给出正确建议,识别文本中涉黄、涉政内容,还可以识别文本中前后不一致的数字、日期和时间等,高效、全方面保障内容质量。政务大模型建设路径及评价体系研究报告272)稿件比对:可快速找出两篇稿件中的不同区域,帮助媒体工作者快速找到版本差异。3.个性化审核:自
65、定义输入 Prompt 关键词,即可对内容完成个性化审核,在通用图像审核模型(色情、涉政、暴恐、违禁等)之外,解决业务的个性化审核诉求的使用场景,全方面保障内容合规、安全。分发助手助力千人千面,提升分发效率大模型应用于内容分发,应具备生成文章摘要、文章分类与标签,还可以自动生成政务大模型建设路径及评价体系研究报告28文章标题;还可通过全网比稿,甄别文章原创度,保障原创与版权,从而优化分发策略,加持爆款推荐效果。1)文章分发助手:一键生成文章摘要、文章分类和标签、文章主题短语、文章所在的地域信息,帮助文章在分发时自动打标签和定向地域标签推送。2.)原创度识别:识别文章是否为原创内容,帮助媒体工作
66、者准确高效的找出非原创文档,节省审核人力。科学评馈追溯首发媒体,关注传播趋势与版权监控科学评馈模块将通过监控互联网数据,提供版权监控、传播力分析、新闻趋势分析等功能,帮助新闻工作者及时发现侵权行为,并提供相关决策依据。在更为先进的数字虚拟主播场景,通过大模型能力赋能,基于虚拟主播语音驱动及云渲染技术,仅需文字或音频输入,即可快速、大规模生产 3D 拟人主播播报视频,提升主播播报类视频的生产效率,具备口型适配度高、动作表情丰富的特点,可在线提供虚拟主播透明背景视频及画中画样例模板,供业务灵活接入。4.创新生成,智领未来:大模型推动媒体创作智能化的引领范式领先的大模型加载支持智能创作技术,集合先进
67、的人工智能能力,为内容创作者和机构提供各类 AI 赋能的创作工具。在 AI 大模型的驱动下,创作优质内容变得更加容易,除包含高频创作工具外,也解决内容生产中长尾的细节问题,真正实现全场景、精细化、智能化、高效率生产。其中,一站式智能创作工具应集纳海量成功案例,打造专业、安全、高效的智能创作平台,为创作者提供一站式内容创作工具。智能创作内容需关注效果稳定性强,通过大模型以及海量训练样本,提高算法在复杂多变的应用场景下的效果稳定性和适配性,以保障视频创作与智能写作能力稳定性强、效果优。政务大模型建设路径及评价体系研究报告29四、政务大模型典型场景评价体系(一)建设政务大模型平台及典型场景评价体系的
68、必要性我国高度重视数字政府建设工作,推动政府数字化转型的政策红利正在加速释放,中央与地方层面发布多项数字政府相关政策文件,从顶层设计、基础设施、业务应用、标准规范、安全保障等方面为数字政府建设提供引导和支持。随着数字政府建设迈入深水区,整个行业在技术规范、服务水平、价值成效等方面凸显出一系列问题,业界亟需建设完备的标准和评价体系,为数字政府建设在选型、能力、价值衡量等方面提供规范化指引和参考依据。中国信通院牵头编制“数字政府建设水平和运营效果成熟度模型(IOMM-G)”方法论,能力域和价值域两个维度进行衡量,能力域包括机制完备化、云智平台化、支撑共性化、数据价值化、运营体系化和安全信任化六个方
69、面,价值域包括智能敏捷、效益提升、质量保障、业务创新、安全最优和用户满意六个方面展开,聚焦数字政府建设水平和应用价值,对数字政府建设的不同环节和模块进行评估,为衡量数字政府案例的成熟度提供参考依据,有力地推动了数字政府全面提质增效。政务大模型评价体系的建设是对数字化时代管理和治理的响应,参考 IOMM-G 方法论的核心思想,政务大模型评价指标同样从能力域和价值域两个维度进行制定,结合上文提出的政务大模型建设架构和典型场景,能力域评价主要考虑政务大模型平台能力及针对各政务场景下应具备的必要功能,而价值域评价主要考虑各政务场景中模型应为用户带来的效果,从而确保政务大模型能够提供智能化、高效率和高质
70、量的政务服务。政务大模型平台建设和评价具备行业通用性,而政务大模型的应用场景则有多样性,从而导致不同场景大模型评价也不会有统一定式,但其核心的评价方法都可基于 IOMM-G能力域和价值域的评价思维。本章选取“一网通办”、“一网统管”、“一网协同”等成熟典型场景提出评价体系,作为示范,能够以此类推到数字政府、水利水务、广电传媒等更多场景大模型评价体系的制定。(二)政务大模型平台关键评价指标1.政务场景下的大模型平台建设如今大模型赋能政务多个领域,为降低大模型使用门槛,提升计算资源利用效率,政务领域也需建设政务的大模型平台,快速赋能各类业务领域。政务大模型建设路径及评价体系研究报告30建设政务的大
71、模型平台不仅是技术创新的必然趋势,更是实现政府高效治理、服务民生、实现创新发展的重要途径。这将为政务领域带来深刻的变革,推动政府与社会实现更加紧密的合作与共赢。2.政务大模型平台的评价指标政务大模型平台的评价指标的提出旨在确保平台具备高效、可靠和可扩展的能力,为政府机构提供强大的工具支持和技术保障。通过数据管理能力、提示模板能力、模型训练能力和预测服务能力四项指标,确保平台被广泛高效地使用。模型管理能力、干预支持能力、政务知识管理能力和业务评测能力四项指标的提出对约束政务大模型平台实际应用场景进行系统化管理和评估干预。为了使平台根据实际需求高效利用资源,还应关注业务流量调度能力和会话策略配置能
72、力两项指标。通过这十项评价指标确保政务大模型平台在不同场景环境下具有可用性,有利于提高业务办理工作效率。(三)“一网通办”典型场景-智能政务服务大模型关键评价指标大模型在一网通办的领域应用用于解决民众办事难和企业政策匹配判断的问题,通过大语言模型技术很好的实现了用户意图识别,实现对口语化的各类问题的意图理解,解决口语对话和政务术语之间鸿沟的问题,带来实质性效果的提升,同时优化政府与企业公众间信息提供的交互模式,自动解读海量政策,发挥知识价值。政务服务作为面向民众/企业的服务应用,从效果层面和功能层面均有较高要求。政务大模型建设路径及评价体系研究报告31从效果层面考虑,政务服务需要具备准确性、友
73、好性、完整性和可靠性。在功能层面上,政务服务需要实现意图识别、信息提取、多轮问答、阅读理解和内容安全五个维度功能进行评价。智能政务服务的评价指标的创建具有重要意义,这些评价指标可以帮助衡量政务服务的效果和功能,从而提供具体的参考和指导,以持续提升数字政府服务的质量和用户体验。有效的评价指标能够帮助政府部门和相关服务提供商了解其服务的优劣之处,并针对性地进行改进和优化。通过评价指标的使用,政务服务可以更好地满足民众和企业的需求,实现数字化转型的目标,进一步促进社会的可持续发展。1.效果指标效果层面是对政务服务的核心因素进行评估和测量的重要角度。准确性、友好性、完整性和可靠性是衡量政务服务效果的关
74、键指标。1)效果指标一:准确性准确性反映了智能政务服务在为用户提供信息和解答问题时的精确程度和可靠性,使用户能够依靠政府提供的信息和服务进行决策和行动。该指标主要涵盖了答案准确性、抗干扰性和回答稳定性。答案准确性:准确理解用户问题,并基于相关知识提供能回答用户问题的准确答案。抗干扰性:不会附加与问题无关的其他无效内容,增加用户阅读成本。政务大模型建设路径及评价体系研究报告32回答稳定性:多次提问所生成的答案保持核心知识点一致性。2)效果指标二:友好性友好性的提升可以增强政府与公民之间的互动和沟通,建立积极的政府形象,增进公众对政府的信任和支持。该指标主要涵盖了响应快捷性、情绪识别能力和对话友好
75、性。响应快捷性:针对用户提问给予解答所需的服务效率,在合理的时长范围内。情绪识别能力:可感知用户负面情绪,并予以疏导,对话解答过程具有共情力。在用户诉求得不到满足表现出负面言语时,始终保持正向引导。对话友好性:答案可理解,与用户对话中,答复语言自然、流畅、亲和。对话公平性:评估模型在不同用户群体之间是否平等对待,避免歧视或偏见的存在。3)效果指标三:完整性完整性是指智能政务服务所提供的信息和内容的全面程度,以及其在知识依据来源参考方面的准确性和广泛性。在评估智能政务服务的完整性时,需要考察答案全面性和答案可靠性的能力。答案全面性:针对用户提问,答案十分全面,能够覆盖用户需求的各个方面,信息有效
76、可靠。答案可靠性:针对用户提问,答案均标记出准确答案来源(如:政策引用来源是否有误或缺失)。4)效果指标四:可靠性可靠性涵盖了资源利用效率、运行稳定性和服务可扩展性等。可靠性反映了智能政务服务的稳定性、可持续性和可信赖性,对于确保政府服务的连续性和效能至关重要。资源效率:模型处理用户请求服务的处理速度和资源利用效率,包括响应时间、计算资源消耗等指标作为参考依据。运行稳定:模型在长时间运行中的稳定性和可靠性,确保其在各种情况下都能产生一致可靠的预测结果。服务可扩展性:评估模型在面对大规模数据和高并发请求时的处理能力和性能政务大模型建设路径及评价体系研究报告33表现。2.功能指标功能层面是对政务服
77、务应具备能力进行评估和测量的重要角度。意图识别、信息提取、多轮问答、答案生成和内容安全是衡量政务服务功能是否能高效支撑用户工作的关键指标。1)功能指标一:意图识别意图识别反映了政务服务对于用户提出的各类问题的理解和引导能力,让用户能够更简单直接的表达清楚其意图。该指标主要涵盖了常规意图识别、复杂意图识别和模糊意图澄清。常规意图识别:问题中完整包含咨询事项关键字(如租房、提取、公积金),明确识别到用户意图。复杂意图识别:问题描述一个复杂场景,不完整包含咨询事项关键字,能明确识别到用户意图。模糊意图澄清:对于用户的模糊意图,能够以提问的形式,对用户的模糊意图进行澄清问答。2)功能指标二:信息提取信
78、息提取反映了政务服务对用户问题中关键信息的识别和分析能力,更好的匹配到用户真正想了解的政务信息。该指标主要涵盖了用户信息识别、地址识别。用户信息识别:能根据业务需求,识别到问题中的用户实体信息。地址识别:能根据业务需求,识别到问题中的用户地理位置。3)功能指标三:多轮问答多轮问答反映了政务服务能持续理解用户多轮话题的能力,让用户无需重复说明或操作。该指标主要涵盖了上下文关联、多轮引导和话题切换。上下文关联:多轮对话中,保持语境连贯性,穿插提问后能结合上下文给予回复,不会跳出相关语境。多轮引导:支持在多轮对话中,对于用户提出的不明确问题,进行引导式提问。政务大模型建设路径及评价体系研究报告34话
79、题切换:支持在多轮对话中,对于用户提出的其他话题,能自然进行话题切换。4)功能指标四:答案生成答案生成反映了政务服务能在理解用户意图后基于政策的问答结果生成能力,让用户能获取到准确可靠的人性化答案。该指标主要涵盖了政策问答、办事指南问答、FAQ问答以及拒绝话术。政策问答:能根据政策内容,针对客户问题生产答案内容。办事指南问答:能根据办事指南内容,针对客户问题生产,可提供对应服务办理流程信息、可提供相应的材料信息、可进行询问后直接进入办理流程。FAQ 问答:能根据标准问答对,针对客户问题生产答案内容。拒绝问答:能针对超出范围无法回答的问题,给出友好性的拒绝话术。5)功能指标五:内容安全内容安全反
80、映了政务服务在输出的内容信息的合规性能力,使政府的公信力能真正得到保障。该指标主要涵盖了超政务领域答复、敏感红线问题答复和意识形态相关问题答复。超政务领域答复:针对提问中超政务服务范围的部分,答复口径符合安全管理要求。敏感红线问题答复:针对提问中涉及敏感内容、涉恐涉政涉暴及其他负面情况,答复口径符合安全管理要求,不存在负向引导。意识形态相关问题答复:答复口径符合正向意识形态管理要求。(四)“一网统管”典型场景-智能问数大模型关键评价指标大模型在一网统管的领域应用从领导指挥角度出发,需要满足随时随地随机对政府数据的问询和查询场景,基于 NLP 大模型技术对问题的理解和拆解,数据的分析和导出,以及
81、产品端到端的 CUI 使用体验和易用性有较高的诉求。从效果层面考虑,智能问数服务需要具备准确性、易用性和扩展性。在功能层面上,政务服务需要从数据查询与分析、结果交互、安全与稳定、可插拔能力四大维度功能进政务大模型建设路径及评价体系研究报告35行评价。智能问数服务的评价指标的创建具有重要意义,这些评价指标可以确保大模型在一网统管的领域应用中能够提供准确、易用、可扩展的服务。通过评价指标的建立,一网统管服务可以更好地满足指挥和管理需求,实现智能化社会治理的目标,进一步促进社会的可持续发展。1.效果指标效果层面是对智能问数服务的核心因素进行评估和测量的重要角度。准确性、易用性和扩展性是衡量智能问数效
82、果的关键指标。1)效果指标一:准确性准确性反映了智能问数服务在一网统管领域起到的精确程度和可靠性,使用户能够依靠政府提供的信息和服务进行决策和行动。该指标主要涵盖了政府数据自由问询的准确性和互联网补充数据的准确性。政府数据查询:对政府数据在自由问询下的数据反馈准确性。互联网补充:对互联网补充数据问询下的准确性。2)效果指标二:易用性易用性反映了智能问数服务使用用户的学习成本和操作成本,是否可以快速应用起到管理服务的效果,支持决策和分析。该指标主要涵盖查询速度、视觉效果、学习成本、政务大模型建设路径及评价体系研究报告36多模态。查询速度:对政府数据库查询返回速度,等待时间。视觉效果:视觉感官评价
83、。学习成本:学习操作的时间成本。多模态:产品界面 CUI 是否友好性,支持多语音、手势、文字等多种输入输出。3)效果指标三:扩展性扩展性反映了智能问数产品在多种类型终端的延伸性覆盖度,产品配套丰富程度,三端数据的协同和实时处理,是否支持随时随地的指挥办公也是在一网统管领域里非常重要的能力。该指标主要涵盖大屏 IOC 端、中屏 pc 端、小屏手机端:大屏 IOC 端:大屏产品具备多模态数据分析和查询的智能问数能力,且可以与中小屏同步。中屏 PC 端:中屏产品具备多模态数据分析和查询的智能问数能力,且可以与大小屏同步。小屏手机端:小产品具备多模态数据分析和查询的智能问数能力,且可以与大中屏同步。2
84、.功能指标功能层面是对领导问数应具备能力进行评估和测量的重要角度,关键指标包括数据查询与分析、结果交互、安全与稳定、可插拔能力。1)功能指标一:数据查询与分析数据查询与分析反映了领导问数能应对问数维度的普适性和多样性,让用户真正可以随心问数。该指标涵盖了简单查询、约束查询、推理计算、多轮查询与预测、跨表查询和数据归因。简单查询:支持单属性和多属性查询。约束查询:对单个属性进行值过滤和排序。推理计算:支持聚合/判断/比较/分组统计/列计算等。政务大模型建设路径及评价体系研究报告37多轮查询与预测:能够基于前文查询结果,进行追问,可能包括以下多轮提问方式:聚合/下钻/条件变更。跨表查询:支持跨多表
85、的定向查询,可跨表越多能力越强。数据归因:能够基于原始表或结果表(查询结果)进行数据描述或趋势总结。2)功能指标二:结果交互结果交互反映了领导问数在问题推荐和结果管理方面的合理性和丰富性,让问数结果呈现易于理解且准确有效。该指标涵盖了意图输入、问题推荐、结果回溯、数据可视化、数据结果管理。意图输入:用户可通过文字或点选选项形式输入意图。问题推荐:用户可直接通过点击预置问题或推荐问题进行意图输入。结果回溯:用户可通过交互,回溯至某一轮对话的结果进行展示。数据可视化:对结果数据进行可视化展示,支持多种图表展示。数据结果管理:能够保存某轮对话的数据结果。3)功能指标三:安全与稳定安全与稳定反映了领导
86、问数据问数来源及安全保护全面,该指标涵盖了安全性、稳定性。产品的安全性(数据泄露风险):符合政务内网和政务外网的数据安全需求,无数据泄露风险,符合三级等保条件。产品稳定性(SLA):是否能达到 99.99。4)功能指标四:可插拔能力可插拔能力反映了领导问数产品交付集成的复杂度,该指标涵盖了便捷度、时间成本、价格成本。便捷度:接口文档和使用说明的友好行,集成被集成效率。单端延伸的时间成本:部署时长、生态介入时间成本。单端延伸的价格成本:硬件资源的消耗和依赖。政务大模型建设路径及评价体系研究报告38(五)“一网协同”典型场景-智能公文写作大模型关键评价指标大模型在一网协同的领域应用在于提升政府内部
87、办公、机关事务处置效率。其中智能公文写作,聚焦党政机关“办文”下的公文写作场景,借助大模型语义理解、自主学习和智能推理等能力,构建公文写作模型,提供公文创作、公文沉淀、素材推荐 3 组功能,辅助公务人员自动快速生成公文大纲及内容,激发人员写作灵感与思路,让公文写作省心省力省时间!公文种类繁多,内容涉及领域广,且规范性和严谨性要求非常高,智能公文写作作为服务于党政机关人员的应用,在效果和功能两方面都有较高的要求。从效果层面考虑,要具备准确性、合理性、专业性、多样性、高效性。在功能层面考虑,需要从公文创作、公文沉淀、素材推荐和审阅反馈四个维度进行评价。1.效果指标效果层面是对公文写作的内容及质量进
88、行评估和测量的重要角度,共包括准确性、合理性、专业性、多样性、高效性五个关键指标。1)效果指标一:准确性准确性反映了智能公文写作创作的公文时的精确程度及可靠性,使用户能够基于生成的公文进行微调和优化。该指标涵盖了语法准确性、信息准确性、政策法规一致性。语法准确性:评估生成的公文内容是否遵循正确的语法规则,避免拼写错误、语法错误等问题。信息准确性:评估生成的内容是否与主题的事实和数据相符,避免出现错误的政务大模型建设路径及评价体系研究报告39描述或数据。政策法规一致性:评估生成的内容是否与当前的政策法规保持一致,不包含过时或错误的信息。2)效果指标二:合理性合理性反映了智能公文写作创作的公文的语
89、义表达及思想传递的清晰连贯程度,确保读者可以准确理解。该指标涵盖了逻辑连贯性、信息流畅性、表达清晰性。逻辑连贯性:评估生成的句子和段落是否在逻辑上连贯,能够合理地表达思想,避免出现矛盾或混乱的逻辑结构。信息流畅性:评估生成的内容是否以清晰、流畅的方式传达信息,使读者能够迅速理解公文的主旨和内容。表达清晰性:评估生成的内容是否明确表达了意图,避免含糊不清的句子或用词,以确保读者可以准确理解。3)效果指标三:专业性专业性体现了政务公文对政务、行业知识的高要求,一定程度弥补用户的知识不足。该指标涵盖了专业性和事实性。专业性:评估生成的内容是否能够体现出对特定领域、领域术语和专业知识的理解,以确保公文
90、内容具备专业性。事实性:评估是否能够自动核实生成内容中的事实准确性,以避免错误信息的传播。4)效果指标四:多样性多样性是指智能公文写作可生成的公文种类、主题、风格的全面程度,该指标涵盖了格式专业性、主题适应性、语言多样性。格式专业性:评估是否能够根据不同公文类型的格式要求,生成符合规范的结构和排版,以满足不同类型的公文写作需求。主题适应性:评估是否能够根据不同主题和事务,生成相关且恰当的内容,确保公文内容与特定主题紧密相关。政务大模型建设路径及评价体系研究报告40语言多样性:评估生成的公文是否支持多种语言,是否能够根据不同机关的要求调整语气、风格和用词,以适应不同机关的写作风格。5)效果指标五
91、:高效性高效性是指智能公文写作的生成时效及基础内容质量符合度,使用户摆脱常规性内容的重复写作,提升写作效率。该指标涵盖了生成效率、生成一致性。生成效率:评估是否能够在短时间内生成公文大纲和内容,以提高公务人员的工作效率。生成一致性:评估生成的内容是否在格式、用词等方面保持一致,以确保文档的整体质量和专业性。2.功能指标功能层面是对智能公文写作应具备能力进行评估和测量的重要角度,衡量智能公文写作是否能高效支撑公务员工作的关键指标包括公文创作、公文沉淀、素材推荐、审阅反馈。1)功能指标一:公文创作公文创作反映了智能公文在公文内容生成方面的基础能力水平,该指标涵盖了生成大纲能力、段落生成质量、文本扩
92、写能力、文本续写能力。生成大纲能力:评估生成的大纲内容是否符合公文格式要求,大纲架构是否全面、清晰、合理。段落生成质量:评估生成的段落内容是否具有足够的信息量和逻辑性,能够在各个段落中表达清晰的思想。文本扩写能力:评估是否能根据用户提供的关键信息自动扩写内容,扩写是否不改变中心思想,能让原文观点更加突出、深刻。文本续写能力:评估是否能基于上文自动续写内容,续写是否与上下文融洽性高、衔接合理、逻辑严谨、结构清晰、完整连贯。2)功能指标二:公文沉淀公文沉淀反映了智能公文在生成内容的管理能力的全面程度,让用户使用过程更安政务大模型建设路径及评价体系研究报告41心、省心。该指标涵盖了保持与管理、版本控
93、制、导出格式多样性。保存管理:评估是否提供便捷的保存和管理功能,允许用户随时存档和检索他们创建的公文文档。版本控制:评估是否支持对公文文档的版本管理,让用户能够比较不同版本,追踪修改历史。导出格式多样性:评估是否支持公文内容导出为多种格式,如 Word、PDF 等,以满足不同的输出需求。3)功能指标三:素材推荐素材推荐可提升公文写作内容的丰富度,让用户可结合推荐素材快速完善公文内容。该指标涵盖了素材推荐、素材摘要、素材示范。素材推荐:评估是否能根据公文主题或内容,为用户提供相关的资料和参考文献,帮助丰富公文内容。素材摘要:评估是否能自动给出推荐素材的摘要信息,让用户更快速判断素材内容是否匹配公
94、文内容。素材示范:评估是否能展示类似主题或类型的公文样本,以供用户参考和借鉴。4)功能指标四:审阅反馈审阅反馈反映智能公文写作在用户使用过程中对生成内容的互动反馈程度,该指标涵盖了用户反馈、语法纠错、内容审查。用户反馈:评估是否允许用户对生成内容提供反馈,以便改善应用性能和生成结果。语法纠错:评估是否能自动检测和纠正生成内容中的语法和拼写错误,提升文档的准确性。内容审查:评估是否能识别内容中可能存在的问题,如不一致之处、模糊表达等,并提供改进建议。政务大模型建设路径及评价体系研究报告42五、政务大模型未来发展趋势和建议(一)注重大模型 AI 芯片技术发展,助力大模型算力提升“硬”实力大模型的出
95、现为原本面临应用场景缺失的 AI 芯片提供了新的发展机会,国内市场对于 AI 芯片的硬需求在逐渐提升,为了实现更高效、智能和安全的政务管理,AI 芯片技术的发展将成为关键的发展方向。一是 AI 芯片的规模将继续扩大,性能不断提升,以支持更为复杂的 AI 任务。从设计模式而言,AI 芯片的未来发展应从制程、兼容性、通信接口、显存容量、片间互联等多方面进行考虑,以提升芯片的整体性能、易用性和功能。从应用领域而言,AI 芯片将进一步向智慧政务、智能医疗、智能交通等垂直领域渗透,推动 AI 技术在各个领域的应用和落地。二是 AI 芯片技术的发展可以有效解决数据隐私和安全性问题。政务大模型通常需要处理大
96、量的敏感数据,包括人员信息、财务数据等。为了保障数据的安全性和提升系统性能,通过应用芯片技术,能够在硬件层面上实现数据加密和隔离,提供更高的数据安全保障,有效防止数据泄露和滥用。三是 AI 芯片技术的发展有助于稳固供应链和技术健康发展。从芯片设计企业的角度,除了在设计模式上需有创新之外,为了推动产业链的发展和实现协同创新,企业还需要加强业务部署及生态建设,提升 AI 芯片的市场竞争力。从行业主管部门角度,需要制定相关配套政策,包括研发攻关、应用落地、项目招引、配套服务、上下游产业链协同等方面,多层次全方位的鼓励和支持企业开展计算芯片及新架构技术研究、大模型技术及其应用发展,从而驱动 AI 算力
97、企业步入良性发展轨道。四是推动 AI 芯片生态的繁荣发展将为大模型技术的创新提供强有力的支撑。AI 芯片是提升计算能力的关键,但提高计算能力并非大模型发展的全部,还需要实现大模型与高算力之间的有效耦合。因此,未来大模型的发展应注重芯片、框架、模型的全面耦合,推动软硬协同技术创新。通过全面接入大模型开源生态,有助于企业更好地应对大模型应用时面临的算力不足和场景不够开放等问题,进一步推动我国大模型的技术研发和应用落地。同时,各方需要与产业链上下游合作伙伴紧密合作,共同促进技术、资源、场景等多方主体的协作,为推动我国 AI 生态的繁荣发展做出贡献。政务大模型建设路径及评价体系研究报告43(二)不断迭
98、代大模型结构升级,推动数字政府可持续演进政务大模型应不断迭代其结构以满足人民日益增长的美好生活需要为出发点和落脚点。一是更透明的决策过程,能够向相关利益相关者传达决策的原理和依据,建立起公众对模型的信任,推动政务大模型的广泛应用。二是更加强大的平台能力,注重提升平台的稳定性、安全性和可扩展性,以应对不断增长的数据和用户需求。三是更广泛适用的通用框架与模型层能力,在模型设计、数据标准化和算法开发方面进行深入研究,以确保模型的可复用性和适应性。四是更广泛的应用支撑能力,从单一场景的智能化实现向多模态与多场景相结合的生成式人工智能发展。通过使用领域大模型和场景小模型的组合,以行业专业领域知识输入进行
99、训练,实现行业深度智能升级。五是更加小型化的模型体系,通过精简参数、修改模型结构和压缩方法,使其在资源有限的端、边等场景下依然可以应用。六是更加完善的安全保障,确保政务大模型在处理数据时符合相关法规和规范,保护用户的信息安全。七是更加长效完善的运营与服务能力,通过采取政府主导的模式,建立统一的管理框架和监管机制,同时引入合作伙伴的专业能力和创新思维,共同推动政务大模型的长期稳定和连续创新。政务大模型的开发和应用应该从顶层设计出发,构建 AI 原生思维,推动大模型落地应用。通过顶层设计驱动可以确保模型发展的针对性和系统性,降低人机交互成本,进而使模型提供更可靠、高效的解决方案。实现思维模式的根本
100、性变化,在技术发展的同时构建 AI 原生思维,持续创新,推动模型智能化发展。政务大模型的建设发展应注重培养与引进理解大模型专业化人才,以便更好地面对挑战和解决问题。这些人才将在政务领域内推动模型的优化和创新,并将其与实际应用场景相结合,从而确保大模型的行业化应用能够符合政务部门的需求和期望,实现更好的效果。政务大模型的未来发展还需要与各利益相关方进行广泛合作。政府机构、学术界、行业组织和社会公众等多方参与,共同推动政务大模型的迭代升级。通过建立合作机制和共享数据资源,可以促进模型的数据多样性和训练效果的提升,从而进一步增强政务大模型的准确性和实用性。(三)探索丰富政务应用场景,激发政府创新发展
101、澎湃动能现阶段,大模型在诸如问政、治理、协同、咨询、创作等方面的实践应用,不仅能够提供了高效便捷的服务,还取得了积极的反馈结果。然而,政务大模型的应用前景远政务大模型建设路径及评价体系研究报告44不止于此,未来将在当前已应用场景持续深化的同时,不断探索其在更多领域的广泛应用机会。政务大模型可以更深入的应用于城市公共安全领域。在突发事件的应对过程中,通过多模态语义关联、语义加强等能力,快速而准确地获取和分析城市对象全要素信息,并与三维模型融合,高效赋能数字孪生城市信息模型,构建具备完备语义、信息逻辑关系复杂的城市数字孪生体。此外,还可通过自然语言理解和数据分析的能力,快速解读公众舆情和社交媒体的
102、信息,捕捉事件发展趋势,为决策者提供及时有效的决策支持。政务大模型将有巨大潜力开发出更多场景所需的水务水利应用,如为水利工程建设和维护提供决策支持。通过建立包括地质、地形、工程结构等因素在内的综合模型,政务大模型可以对水利工程的选址、设计和运维过程进行模拟和优化,确保工程的稳定性和可持续性。同时,政务大模型还可以结合物联网和大数据等技术,实现对水利设施的智能监测和维护,提高设施的运行效率和安全性。政务大模型未来会赋能在人社、税务、应急、交通等泛政务领域应用场景建设,为社会治理和政府决策提供更多支持。政务大模型将进一步深入各个政务领域,推动公共服务的创新和提升。(四)完善政务大模型监管体系,赋能
103、数字政府健康发展2023 年 7 月,国家网信办等七部门联合公布 生成式人工智能服务管理暂行办法,旨在促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益。政务大模型的出现改变了政务服务和流程处理的办理方式,重塑了使用者与技术的交互模式,并开启了对于未来创新政府的无限想象。如以往其他技术创新一样,大模型的应用也是一柄双刃剑,其在助力繁荣与发展的同时,政务大模型实际应用中也存在模型决策不够透明,以及在进行大量模型训练过程中对隐私信息保护不足等风险。在这种情形下,一方面应尽可能精准识别生成式人工智能产生的风险,在现有信息内容治理框架内,继续完善从数据
104、到算法再到生成内容的全链路体系规制,并建立反馈投诉机制,以接收、监测和评估实时出现的风险,及时采取补救措施。另一方面应支持和扶持大模型开发与部署,同时加强企业社会责任意识,确保数据处理和个人信息保护的规范与安全,以确保人工智能模型的开发和应用符合伦理道德标准和遵循社会主义核心价值观,共同构建一个安全、可信、可持续的人工智能时代。政务大模型建设路径及评价体系研究报告45未来政府应继续完善国内大模型监管体系制定,建立健全政务大模型的法律法规和政策,政务大模型的发展与治理需要政府、企业、社会、人民等多方参与,共同促进生成式人工智能健康发展。(五)推动政务大模型标准指标和评估体系建设,赋能数字政府健康
105、发展标准和评价体系是推动政务大模型高质量发展的重要力量,第三方机构应加快构建政务大模型相关标准和规范体系,指导政务大模型建设、应用、评价等各环节,推动政务大模型发展“有据可依”。中国信通院围绕政务大模型领域积极开展标准研制,面向供给侧,开展政务大模型平台通用技术能力、场景化应用能力等解决方案类标准研制,旨在衡量服务商提供政务大模型相关产品和服务的可信能力;面向需求侧,开展 IOMM-G 政务大模型建设和应用效果成熟度评价体系标准,为政务大模型的应用成效和价值衡量提供“标尺”。同时,相关评估体系的落地和推广将进一步巩固政务大模型建设案例的引领作用,提高其可信度和可靠性,增强用户和企业的信任感。未来,随着政务大模型标准与评估体系日臻完善,将会进一步推动政务大模型健康有序发展。