用时:34ms

人工智能行业研究报告-PDF版

您的当前位置:首页 > 人工智能
  • 融管理社区:2023软件研发质量管理体系建设白皮书V1.0(131页).pdf

    1目录前言 _ 1本白皮书的背景和意义 _1预期读者 _1策划和组织本白皮书的团队 _2第一章 质量管理体系概述 _ 41.1 质量管理体系的定义 _41.2 质量管理体系的原则 _51.3 质量管理体系的目的和意义 _10第二章 确立软件质量管理体系建设思路 _ 152.1 分析现状问题 _152.2 确定建设范围 _152.3 获取管理支持 _16第三章 制定质量政策和质量目标 _ 193.1 质量政策制定 _193.2 质量目标设定 _21第四章 建立质量型组织 _ 284.1 质量型组织设计 _284.2 质量角色定义 _294.3 质量关系协调 _304.4 质量管理组织架构 _31第五章 定义符合质量管理体系要求的流程 _ 355.1 流程体系设计 _355.2 流程管理实施 _365.3 流程体系优化 _375.4 典型质量管理体系流程 _38第六章 制定质量考核机制 _ 766.1 质量检查设计 _766.2 质量评估执行 _776.3 质量改进闭环 _2第七章 实施质量培训和文化建设 _ 817.1 质量培训计划 _817.2 质量文化推广 _82第八章 提供资源保障 _ 868.1 人力资源配备 _868.2 基础设施建设 _908.3 资源分配保障 _91第九章 持续改进与评审 _ 939.1 内部质量审核(Audit)_939.2 外部质量审核 _949.3 持续改进机制 _95附录 A 常见的质量管理体系介绍(QMS)_ 98A.1 ISO9001 _100A.2 IATF6949(TS16949)_101A.3 CMMI _104附录 B 软件研发质量管理过程常见文档设计实践 _112B.1 架构设计文档编写 _112B.2 模块设计文档编写 _113B.3 数据库设计文档编写 _114B.4 接口设计文档编写 _ 115B.5 数据流图文档编写 _116B.6 详细算法和数据结构描述 _117B.7 编码过程文档 _118B.8 源代码文档编写 _118B.9 编码规范编写 _120B.10 单元测试文档编写 _121B.11 测试文档分类 _1前言前言本白皮书的背景和意义本白皮书的背景和意义软件在现代社会中发挥着越来越重要的作用,但软件质量问题也越来越受到人们的关注。尤其是在软件开发的过程中,可能存在的质量问题会导致交付产品质量下降、项目超预算和延迟交付等问题。在这种背景下,建立研发质量管理体系是非常重要的。本白皮书的主要目的是指导团队如何建立软件研发质量管理体系,帮助软件开发团队提高交付质量,降低缺陷逃逸率和不良质量成本。具体来说,本白皮书为保证软件研发质量而建立的一套完整的流程、方法、实践等的整体内容,覆盖了管理职能、资源管理、产品发布、质量与改进四个方面。通过阅读本白皮书,读者将会了解到建立软件研发质量管理体系的重要性,以及如何建立一套覆盖全面的、可以有效实施的质量管理流程和方法,以提高整体软件研发质量。预期读者预期读者本白皮书的目标读者是质量总监、质量经理、软件开发人员、软件测试人员、项目管理人员、其他质量保证工作相关人员,以及所有对质量关心的组织成员。1.需要参与质量管理体系建设和管理的管理人员和技术人员:包括 CTO、研发总监、产品总监、质量总监、质量经理、质量保证工程师、测试经理、项目经理、开发人员、产品经理以及测试人员等。本白皮书将为他们提供相关的指导和实践案例,帮助他们实现高质量软件开发和管理。2.具有软件开发和管理背景的专业人士:这些人士对于质量建设和保障的技术层面有深入的理解和实践经验,他们需要提升通过组织层面质量管理体系的建设来推动软件质量和持续改进的能力,以便能够更好地满足客户的需求。3.软件开发和管理领域的研究人员:白皮书对于软件开发和管理领域的研究人员也有一定的参考价值。他们可以从本白皮书对实战的指导中获得启发。4.已经或准备进入软件工程领域的学生:白皮书也适用于存在学习软件工程相关领域的学生,帮助他们更好地理解质量工程、质量管理体系建设和管理以及软件开发和项目管理的相关概念和实践案例。2总之,本白皮书的预期读者包括从事软件开发、项目管理、质量管理、软件测试等相关工作的各类人员,以及对于软件工程领域有所关注和了解的学生和研究人员。策划和组织本白皮书的团队策划和组织本白皮书的团队宋涛、孙正亮、陈晓鹏、刘哲、刘冉、周航宇、周玲、何凡、郑蒙正、郭智杰、卢腾飞、陈磊、徐东伟共同完成了本次白皮书的撰写(排名按照章节承担顺序)。4第一章 质量管理体系概述1.11.1 质量管理体系的定义质量管理体系的定义全面质量管理的创始人,费根堡姆,将质量管理体系定义为“一个协调组织中人们的质量保持和质量改进努力的有效体系,该体系是为了用最经济的水平生产出客户完全满意的产品。”ISO9000 给出的定义是指“在组织建立的对质量进行指挥和控制的管理体系(To direct and control an organization with regard to Quality)”。所以说质量管理体系首先是一种管理体系,与人力资源管理体系、财务管理体系类似,是各种要求、资源、治理等有机组成的一个整体,是系统化的,是全局的而不是局部的。其次,质量管理体系是组织内部建立的,是协调组织内部的人、资源,为组织能够持续满足客户需求、提高客户满意度而服务的。它是将资源与过程结合,以流程管理方法进行的系统管理。企业根据自身特点,选用若干体系要素加以组合,形成系统。质量管理体系一般包括管理职责、资源保障、价值创造以及度量分析与改进四大要素(见图 1-1,来自 ISO9001)。其中价值创造(又称产品工程)涵盖了从确定顾客需求、设计研制、生产、检验、销售、交付之前全过程的策划、实施、监控、纠正与改进活动的要求,是企业实现客户价值的最核心要素,也是企业流程优化的重中之重。图 1-1 质量管理体系5再次,质量管理体系是为实现质量方针和目标而构建的,与组织的使命和战略方向是一致,如同环境管理体系是为环境服务的,职业健康安全管理体系是为职业健康和安全服务的,质量管理体系是为实现质量目标所必需的,是组织其他目标,如收入、盈利等的有效支持与保障。最后,质量管理体系采用的手段是管理。所谓管理,是“用来指挥和控制组织的相互协作的活动,达成既定的组织目标”。因此,需要公司自上而下地推进,全员参与,并制度化、标准化,从而形成企业独特的文化。1.21.2 质量管理体系的原则质量管理体系的原则质量管理体系的有效实施,因不同组织、不同行业的属性不同,在具体实施方法上会有所不同。但从“道法术器”的基本原理层面,它有着质量管理体系所必备的基本“原则”。作为“原则”,它是一种基本的信念,理论或规则,对完成某项工作的方式具有重大影响。而“质量管理原则”,类似软件开发的敏捷宣言一样,是一整套公认的基本信念、规范、规则和价值观,可以用作质量管理的基础。国际标准化组织的 ISO9000 标准族定义了质量管理的 7 大原则(在 ISO 9001 质量管理体系 2008 年版及以前的版本中,是用的质量管理八项原则)。而在 ISO 9001:2015 质量管理中,删减了“系统管理方法”一项,它们是由 ISO/TC176 工作组的国际专家开发和更新的(ISO/TC176 负责制定和维护ISO 的质量管理标准),分别是原则 1以客户为中心、原则 2领导作用、原则 3全员参与、原则 4流程方法、原则 5持续改进、原则 6循证决策和原则 7关系管理。1.2.11.2.1 原则原则 1 1 以客户为中心以客户为中心质量管理的主要重点是满足客户需要并努力超越客户期望。只有当组织能做到吸引客户,并维持、提振客户和其他利益相关方的信心时,才可以获得持续的成功。以客户为中心,可以提高客户价值,增加客户满意度和忠诚度,从而维持长久的业务关系。通过组织的客户关注,提升了组织声誉,从而进一步扩大客户群体,增加组织的收入和市场份额。以客户为中心,可以让企业通过与客户全方位地互动,为客户创造更多价值。而这些互动,包括了客户的沟通,高层的互访,客户需求的讨论,售后的反馈,客户的申诉等。每一次互动,提供了了解客户和其他利益相关方当前和未来需求的机会,保障了组织的持续成功。针对 B 端客户,常见的客户聚焦的行动包括了如何识别组织的直接或间接客户,了解客6户当前和未来的需要和期望(Needs vs.Want),将组织的管理目标与客户需要和期望联系起来,并充分沟通客户需要和期望。同时,需要组织从产品的规划、设计、开发、生产到产品的交付和支持及服务,实现制度化、流程化,以满足客户的需要和期望,并能够度量和监控客户满意度,采取适当的措施,以积极、主动地管理客户关系,确定并采取可能影响客户满意度的利益相关方的需要和期望。1.2.21.2.2 原则原则 2 2 领导作用领导作用企业各级领导者需要建立统一、一致的使命、愿景和战略方向。企业领导者应将质量作为组织重要战略之一,落实在行动中,并努力创造条件,激励企业全员参与实现组织的质量战略目标。领导的积极参与和重视,能够提高实现组织质量目标的效率和效果。企业领导者身体力行地实践质量管理的理念,能够让全体员工“听其言、观其行”,自觉实践领导的意图,使质量战略的实施,达到事半功倍的效果。建立统一目标,能够使组织调配其战略、政策、流程和资源。通过组织的制度及流程协调资源,改变“人治”的管理模式,改善组织各层级和职能部门之间的沟通,降低沟通成本。同时,创造条件,激励员工积极参与质量目标建设,则能够发展与改善组织及其员工交付预期结果的能力,集中优势,有效实现其目标。不同企业,其管理风格各不相同,但归纳总结起来,质量管理成功的企业,如丰田、摩托罗拉、宝马等,都能够做到:及时、准确地传达组织的使命、愿景、战略、政策和流程;对组织各层级的行为做出规范,创建并维持公平的环境,建立共享的价值和道德规范,并培育信任和诚信的文化。企业应该鼓励整个组织对质量的承诺,各级领导起到模范带头作用。企业的领导作用还包括为员工提供所需的资源、培训。并充分授权、激发、鼓励、认可员工的贡献。1.2.31.2.3 原则原则 3 3 全员参与全员参与拥有具备竞争力的、高度授权、高度投入的团队是整个组织持续创造和交付客户价值的关键所在。通过认可每一个人的贡献,并建立授权机制和完善的培养体系,这可以提高每一个个体的能力,从而促使每个人都参与实现组织的质量目标。全员参与,重要的是尊重每一个个体都是“不一样的烟火”,要使所有人都参与进来。7这样,组织的全体成员能够更好地理解组织的质量目标,激发实现该目标的动力。通过全员参与,能够促进人们积极参与质量改善活动,从个人方面,可以提高个人主动性和创造力,有益于个人职业发展。对组织而言,能够在组织中增强信任与合作,提高员工对共享价值的关注,有利于整个组织文化的形成。要实现全员参与,组织的管理风格及人事制度可以从几个方面强调:沟通透明:让组织的每一位成员了解,作为个体,对质量目标实现的重要性及其贡献的价值;文化倡导:在组织中倡导“协作”而不是“背锅”的文化,鼓励员工谨慎冒险精神,赞赏、认可员工的贡献;工作氛围:创建公开透明的工作氛围,鼓励知识和经验的共享。如有可能,实施员工满意度调查,及时沟通调查结果并采取改进措施;评价体系:让员工能对个体目标作出自我评价,并自驱改进,并对其进步及时正向反馈。1.2.41.2.4 原则原则 4 4 过程(过程(ProcessProcess)方法)方法“过程(Process)”,在某种意义上,被某些自媒体、宣传媒介妖魔化,被定性为外资企业在国内发展不顺的绊脚石。然而,作为工业革命的重要产出物,我们需要意识到,只有将企业经营活动理解为相互关联、相互依赖的过程,以流程管理作为中枢神经,才能促使企业各部门如同一部精密钟表的零部件一样,相互协调、密切合作,成为一个连贯的,高效的系统。只有这样,企业交付的产品或服务质量才能更稳定,从而提振干系人对未来预期的信心,而不必担心出现飘忽不定的大起大落。企业的经营活动是由一系列相互关联、相互依赖的过程活动构成的一个有机整体。而质量管理体系则是描述这些企业活动过程,包括但不限于必要的体系文档,过程交互,资源管理,度量系统,人员配置等。所以,只有理解质量管理体系的内涵,系统化地管理该体系,组织才可以优化其经营活动,提高组织产出。应用流程管理的方法,就是促使组织对满足内、外客户需求的理解保持一致性,企业经营、生产和研发过程强调对客户的增值而不是部门利益保护。流程管理的方法需要根据客观事实、数据及信息对经营、生产和研发过程持续改进,确保流程与时俱进,提高组织的适配性和敏捷性。通过流程管理的方法,可以最大化地利用资源,优化企业经营表现,打穿部门墙,降低部门间的内耗。而流程体系化,将企业主要的客户增值流程通过质量管理体系显性表达,能够聚焦于重要的和关键的客户增值流程及其改进机会,使各8经营活动之间顺畅衔接,保障了企业交付的一致性及稳定性,减少了内卷,提振了企业干系人对企业经营的效果及效率的信心。需要强调的是,流程管理方法,不是简单地把经营活动文档化。实际上,流程管理更像产品的设计,需要高屋建瓴的系统化思维,从架构设计到详细设计、各流程域、流程模块要环环相扣,如同齿轮一样,协调运作。流程体系的建设,可按下列五步法进行:(1)行动前,了解组织目前的能力和资源约束、管理干系人的期望。(2)确定流程体系的目标并识别达成该目标所需要的必要流程。(3)确定流程之间的依存关系。(4)系统化管理流程及其相互关联的流程,对单个流程的修改要分析其对整个系统的影响。(5)建立流程管理的职责及授权和问责制度,保障流程体系能够制度化、标准化,并落地执行。通常,在传统 B 端行业,如汽车行业,这部分职责落在质量管理部门。除此之外,在实施流程管理方法过程中,我们还需要:确保信息的透明、通畅。对整个系统进行监控、分析和绩效评估;针对可能影响流程和整体质量管理体系输出成果的风险进行管理。1.2.51.2.5 原则原则 5 5 持续改进持续改进成功的组织是非常关注持续改进的。只有持续改进与优化,组织才能保持当前的绩效水平,对内部和外部环境的变化及时做出反应并创造新的机遇。持续改进是组织自我愈合、自我改进的重要原则。如质量原则 QMP 4 所言的流程化管理,只有通过持续改进,才能保障流程性能改进,组织能力提升和客户满意度增强。如果想要进行持续改进,就需要了解持续改进的方法和技巧,培养组织及员工追根溯源的精神,定义并执行纠正、预防措施的能力。同时,增强了对内部和外部的风险、机遇的预期和反应能力,以及组织的创新能力。持续改进,可以是自上而下的改进,也可以是自下而上的改进。通常,系统性的重大改进或对组织影响深远、范围广泛的改进,都需要自上而下的领导力支持,以确保改进的效果。但不管何种改进,都需要组织在各个级别建立改进目标,倡导组织持续改进的文9化;都需要定义和部署持续改进相关的流程,遵循项目管理的方法,在组织中实施改进项目。同时,从技能上,为确保人们有能力成功地促进和完成改进项目,应在各个层次上教育和培训员工如何应用基本的持续改进工具和方法,例如,质量管理基本工具、精益工具、六西格玛工具等,来实现改进目标。在改进文化成熟的公司中,常见的持续改进的方法通常遵循一下原则:(1)识别改进的机会(problem statement)。(2)得到利益相关方的支持,成立改进项目。(3)跟踪、评审和审计改进项目的计划、实施、完成和交付物,确保改进的效果。通常,改进过程的实施可以按照 DMAIC1的小迭代模式快速推进。(4)如果改进效果显著,将改进事项应用到新的商品、服务和流程中,并将之制度化,确保改进成果能够保持。(5)认可并表扬改进项目团队。1.2.61.2.6 原则原则 6 6 循证决策循证决策基于数据和信息的分析和评估,能够让我们的决策更有可能产生预期的结果。我们都知道,决策是一个复杂的过程。它的复杂性在于决策时太多的不确定性因素。这些因素通常涉及多种类型和来源的输入,以及对输入的主观解读。所以,了解事物的深层因果关系及可能的、预期之外的后果,对决策是非常重要的。通过事实、证据和数据分析,推理预演可能各种方案,可以有效提高我们对决策的客观性和决策信心。循证决策,可以帮助我们改善决策的流程和效率、有效度量流程的绩效及组织取得既定目标的能力。循证决策,还可以提高我们的运营效率,通过对历史经验数据的分析,沉淀知识,增强组织自我审查、挑战各种决策选项的能力。要支持循证决策,组织需要利用系统化的管理手段,制定、测量和监控与组织管理绩效相关的关键指标,收集、萃取数据,并能够最大程度地做到数据的透明,促使全员可以有效方便地访问数据,确保人员有能力根据需要分析和评估数据。循证决策需要数据,但并不是完全依赖数据。由于数据在收集过程中可能被污染,我们需要确保数据和信息足够准确、可靠和安全。要使用适当的方法,比如假设检验、帕累托图(Pareto)、散1DMAIC:是六西格玛管理中流程改善的重要工具,指定义(Define)、测量(Measure)、分析(Analyze)、改进(Improve)、控制(Control)五个阶段构成的过程改进方法,一般用于对现有流程的改进,包括制造过程、服务过程以及工作过程等等。10点图等图表、回归预测等,全面分析评估数据和信息。同时,根据证据做出决定并采取行动,需要结合过去的经验和直觉而不是完全放弃。1.2.71.2.7 原则原则 7 7 关系管理关系管理为了获得持续的成功,组织需要管理与利益相关方(例如供应商)的关系。利益相关方是组织生态环境的重要组成部分,包括了供应商、合作伙伴、战略联盟、加盟商、投资伙伴、社区等。他们的绩效会直接影响组织的绩效。当组织管理与所有相关方的关系,优化其对自己绩效的影响,则更有可能获得持续的成功。其中,对供应商和合作伙伴的关系管理尤为重要。管理完善的供应链,可提供稳定的商品和服务。通过对供应商和合作伙伴的关系管理,可以有效识别增强组织绩效。与利益相关方理解彼此的目标和价值,甚至通过共享资源、技能以及管理与质量相关的风险,增强为利益相关方创造价值的能力。要对利益相关方进行管理,首先,组织需要确定谁是利益相关方及其与自己的关系。常见的利益相关方包括供应商、合作伙伴、客户、投资者、员工以及整个社会。其次,我们需要确定需要管理利益相关方关系的优先级。同这些利益相关方建立长期战略与短期利益的平衡关系,与其共享信息、专业知识和资源。最后,需要度量利益相关方的绩效并酌情向其提供绩效反馈,建立改进计划,与供应商、合作伙伴和其他相关方共同进步。当然,对供应商和合作伙伴的成就及进步也要及时鼓励和认可。1.31.3 质量管理体系的目的和意义质量管理体系的目的和意义1.3.11.3.1 质量管理体系重要性质量管理体系重要性质量管理体系为广大企业完善管理、提高产品和服务质量提供了科学指南,同时为企业走向国际市场找到了“共同语言”。近些年,各行各业将加快推进国际标准化进程,“标准贯彻”变得更加迫切。毋庸置疑,“标准贯彻”不是万金油,不能包治百病,但通过质量管理体系的建立及其符合国际标准的选取:1.增强了企业全体员工的质量意识与管理意识,明确了各项管理的职责和工作的程序,促使企业的管理工作由“人治”转向“法治”,真正做到了凡事有人负责、凡事有章可循、凡事有据可查、凡事有人监督,实现了“以预防为主”。112.规范了企业的作业程序,明确了各部门和全体员工的职责和权限,预防并控制了不合格的发生,降低了企业质量管理成本。3.通过定期组织质量检查、质量审核活动,能够及时发现和找出经营管理活动、服务质量方面存在的问题和薄弱环节,并进行有效纠正,提高了企业整体经营管理水平和质量监控能力,为企业实施全面的科学管理奠定了基础。4.贯彻了“以人为本”的原则,全面提高了员工的业务技能和综合素质,为企业长远发展打下了坚实的基础。5.围绕“让客户满意”及时认真地处理客户投诉或意见,不断满足客户需求与期望,赢得客户信任,提高客户满意度,提升企业的社会形象和市场竞争力。1.3.21.3.2 质量管理体系的收益质量管理体系的收益质量管理体系的作用,如果企业能够真正踏踏实实将其落地执行,将会得益良多,大大节省成本,提高效率。1.1.提高组织的形象和信誉提高组织的形象和信誉当顾客看到您被认可的认证机构认证,他们会明白,您已经实施了一个以满足顾客要求和改进为关注焦点的体系。他们会更加相信您的承诺。2.2.提高顾客满意提高顾客满意质量管理体系的一项主要原则是识别并满足顾客要求和需要,以提高顾客满意为关注焦点。顾客满意度提高了顾客的回头率也就相应提高。3.3.全面整合的过程全面整合的过程质量管理体系原则要求过程方法,您不仅看到组织中的各个过程,也看到这些过程的相互作用,这样就更容易识别到组织内需要改进和节约资源的领域。4.4.使用基于证据的决策使用基于证据的决策确保在证据充分的基础上作出决策,是质量管理体系成功的关键。确保决策有充分的证据支持,就可以把资源用到刀刃上,以最好的效果纠正问题、改进组织的效率和效益。5.5.创造持续改进的企业文化创造持续改进的企业文化12以持续改进作为质量管理体系的主要输出,您在时间、资金和其他资源上的节省可见日益增加。将持续改进作为企业文化,可将员工的工作重点放到对他们直接负责的过程的改进。6.6.员工参与员工参与在某个过程中工作的员工,是改进该过程的最好帮手。调整员工的工作重点,让他们不仅管理,而且还参与改进过程,他们会更加与组织休戚与共。1.3.31.3.3 软件企业质量管理体系的作用软件企业质量管理体系的作用建立好的研发质量管理体系对于企业的软件开发和研发工作非常重要。1.1.提供高质量的软件产品提供高质量的软件产品企业最终要提供的是能够满足客户需求的软件产品,在软件开发过程中,建立好的研发质量管理体系,通过各种规范和标准将研发过程的每个环节予以衡量和标识,从而掌握产品开发并控制系统开发风险,能够在代码、需求、文档、测试等方面综合考虑,确保软件质量(参阅 ISO25010 中有关软件质量的定义)达到客户预期。强调高品质的开发过程,具有在项目中提高软件产品质量标准,降低产品缺陷率的能力。在市场竞争激烈的今天,这一点对于企业的成功至关重要。2.2.提高软件开发效率和降低成本提高软件开发效率和降低成本通过研发质量管理体系着重的质量内建(Build-In Quality)、模块化和重用性,高质量的研发成果相关的潜在危险和维护成本将降低,从而系统性的降低整个的开发成本。在长期的软件开发过程中,缺陷率更低的软件需要更少的维护工作,节约开发成本,同时提高了开发的质量。3.3.提高客户满意度和信任度提高客户满意度和信任度通过完善的研发质量管理体系,提供高品质的软件产品,让客户对企业的开发和研发能力产生信任,提高客户对企业品牌和产品的满意度,为企业长期的发展壮大奠定良好的基础。从而推动企业的长期稳定发展。4.4.强制自我评估和改进强制自我评估和改进建立研发质量管理体系过程中,普遍会针对流程文档和内部标准和规程进行自我评估、调整和改进。研发质量管理体系要求及时发现研发中的问题,能够更快地提高研发过程13的质量,为最终产品提供更好的品质保证。长期的一个处于不断成长和改进状态的研发质量管理体系能够有力地支持研发过程。研发质量管理体系的建立对于企业来说具有非常高的实践价值。通过建立研发质量管理体系,能够确保软件开发的高品质,提高开发效率和降低整个研发过程的成本,并且提升公司在市场中的竞争力。15第二章 确立软件质量管理体系建设思路2.12.1 分析现状问题分析现状问题分析现状问题是指对当前软件研发过程的质量状况进行全面的分析和评估,找出存在的问题和不足之处。以下是分析现状问题的一些要点:1.1.收集数据收集数据收集软件研发过程中的各种数据,包括缺陷率、任务完成时间、代码质量等。这些数据可以反映软件研发过程的质量状况,为后续的问题分析提供依据。2.2.分析问题分析问题对收集到的数据进行深入分析,找出软件研发过程中存在的问题和不足之处。可以采取多种分析方法,如趋势分析、因果分析、鱼骨图分析等,以便更好地挖掘问题的本质和原因。3.3.归纳总结归纳总结将分析结果进行归纳和总结,找出主要的问题和瓶颈环节。针对不同的问题,可以采取不同的解决方案和方法,如改进流程、优化工具、提升技能等,以便更好地提升软件研发过程的质量。需要注意的是,分析现状问题需要全面、客观、准确地进行,以确保分析结果的真实性和有效性。同时,需要根据实际情况不断调整和完善,以便更好地适应软件研发过程的变化和需求。2.22.2 确定建设范围确定建设范围确定建设范围是指在进行软件研发质量管理体系建设时,明确建设的范围和目标,以便有针对性地进行建设工作。以下是确定建设范围的一些要点:1.1.明确建设目标明确建设目标确定软件研发质量管理体系建设的目标,如提高软件质量、降低缺陷率、优化研发流程16等。建设范围应该围绕这些目标进行规划和设计。2.2.确定建设范围确定建设范围根据建设目标,确定软件研发质量管理体系的建设范围,包括需要涵盖的部门、团队、流程等。建设范围应该根据实际需求进行合理划分,避免过于宽泛或过于狭窄。3.3.确定建设内容确定建设内容根据建设范围,确定软件研发质量管理体系的建设内容,包括需要建立的质量管理流程、质量保证措施、质量评估标准等。建设内容应该与建设目标相匹配,以便有效实现建设目标。4.4.确定建设周期确定建设周期根据建设范围和建设内容,确定软件研发质量管理体系的建设周期,包括建设开始时间、建设结束时间、建设周期内的具体计划等。建设周期应该合理安排,以便在保证建设质量的同时,尽快实现建设目标。需要注意的是,确定建设范围是软件研发质量管理体系建设的重要环节,应该根据实际需求进行合理规划,确保建设工作的有效性和可行性。同时,在建设过程中应该不断调整和完善,以便更好地适应软件研发过程的变化和需求。2.32.3 获取管理支持获取管理支持获取管理支持是指在进行软件研发质量管理体系建设时,获取高层管理者的支持和参与,以确保建设工作的顺利推进和成功实施。以下是获取管理支持的一些要点:1.1.明确管理支持的重要性明确管理支持的重要性向高层管理者介绍软件研发质量管理体系建设的重要性,包括提高软件质量、降低风险、提升组织能力等。使高层管理者认识到他们在建设工作中的重要性和作用。2.2.建立沟通渠道建立沟通渠道与高层管理者建立有效的沟通渠道,及时汇报建设进展、解决问题、获取支持等。保持良好的沟通,使高层管理者能够了解建设工作的具体进展和困难,并提供必要的支持和帮助。173.3.展示成果和效益展示成果和效益在建设过程中,及时展示取得的成果和效益,如降低缺陷率、提高软件质量、提升客户满意度等。让高层管理者看到建设工作的实际效果,以便更好地获得他们的支持和认可。4.4.培训和管理层参与培训和管理层参与对高层管理者进行软件研发质量管理的培训,使他们了解建设工作的具体内容和流程。同时,邀请高层管理者参与建设工作中的重要活动和会议,以便更好地推动建设工作的开展。5.5.定期汇报和监控定期汇报和监控定期向高层管理者汇报建设工作的进展情况、存在的问题和解决方案等。同时,建立监控机制,及时发现和解决问题,确保建设工作的顺利进行。需要注意的是,获取管理支持是软件研发质量管理体系建设的关键环节,应该高度重视并与高层管理者保持有效的沟通和合作。同时,在建设过程中应该不断调整和完善,以便更好地适应软件研发过程的变化和需求。19第三章 制定质量政策和质量目标3.13.1 质量政策制定质量政策制定质量政策是对组织质量理念的高层次诠释和承诺,指导质量管理体系建设的方向。制定质量政策需要注意以下实践步骤:1.1.调研分析阶段调研分析阶段通过调查和访谈,分析现有质量问题和需求改进的方面,确定质量政策需要重点关注的领域。2.2.政策草稿阶段政策草稿阶段起草质量政策的内容框架,明确质量政策需要表达的理念、原则和价值取向。内容上要简洁明确,易于传播。3.3.征求意见阶段征求意见阶段将质量政策草稿发布,在公司内部广泛征求员工和管理层的意见建议,吸收整合有价值的想法。4.4.评审修改阶段评审修改阶段组织评审会,由公司高层和质量管理团队组成的专家进行评审,提出修改意见,进一步优化完善。5.5.发布实施阶段发布实施阶段质量政策经过评审后,由最高管理者发布和批准,并在公司范围内传达贯彻。通过培训、议事等使员工理解质量政策。6.6.持续评估阶段持续评估阶段实施一段时间后,评估质量政策的实际成效,如产生的影响和改变,根据情况对政策进行动态调整和更新。20质量政策的样式应该简短和原则性。这主要基于以下考虑:质量政策定位为高层方针,其作用是阐释和导向,而不应过于具体;简洁的语句可以增强可传播性和可记忆性;原则性指导可以适应组织的变化和长期发展;具体执行要求应在质量目标和质量管理流程中展开;但是,过于空泛的质量政策也会显得形式化和宣传式,为使质量政策兼具指导性和可操作性,建议:在简洁原则的前提下,增加某些具体的管理诉求;结合组织实际,使政策内容更具针对性;在政策中连接到质量目标,形成闭环;不时复核政策,确保与组织发展方向一致。如果能在简洁和具体之间找到平衡,使质量政策既有原则性又有可操作性,就能够使之成为真正有价值的指导文件。质量政策示例质量政策示例 1 1:A A 公司质量政策公司质量政策我们公司立志成为最值得信赖的软件解决方案提供商,致力于为客户提供高质量、高效率的软件产品和服务。为达成这一愿景,我们公司坚持以下质量理念:以客户为中心,倾听客户声音,持续优化客户体验;培育质量优先文化,使质量意识深入员工日常工作的方方面面;加强过程管控,落实质量管理体系,持续改进软件生命周期中的各环节;强化预防理念,从源头减少缺陷的产生;开展持续的质量改进,确保产品和服务持续进步和超越客户期望。21我们全体员工将致力于贯彻这些质量理念,以赢得客户信任和满意度。公司管理层也将提供全力支持和资源保障,以实现质量政策中阐述的承诺。质量政策示例质量政策示例 2 2:B B 公司质量政策公司质量政策我们公司立志成为业界公认的高质量软件提供商。为实现这一目标,我们将遵循以下质量方针:以客户为中心,深入理解客户需求,提供可靠、高效的软件解决方案;培育全员质量文化,营造积极主动的质量改进氛围;强化过程管控,持续优化全生命周期质量管理流程;加强质量数据监测和分析,及时发现和解决质量问题;开展质量培训和交流,提升全员质量管理意识;加大质量管理基础设施建设投入;鼓励创新,运用新工具、新技术提高质量效率;与客户和合作方保持高度的质量共识。我们全体员工承诺恪守质量政策,与客户和合作伙伴一起,持续提升产品和服务的质量水平。3.23.2 质量目标设定质量目标设定3.2.13.2.1 概述概述质量目标的设定是质量管理的关键环节之一,合理的质量目标将指导质量管理实践的开展。质量目标设定分为长期和短期。长期质量目标是组织对产品质量的承诺,也是组织持续改进产品质量,传播质量文化,提高客户满意度的指南针。短期质量目标是组织在年内需要达成的具体质量目标,短期质量目标可以是组织级的复合指标,也可以是项目级别的项目交付质量目标。22组织质量目标,需要分解落实到具体的战略行动或项目,并清晰确认责任人/单位,确保目标的逐步,有序顺利实现。设定质量目标时,需要注意以下几点:1.1.质量目标要具体、可测量质量目标要具体、可测量质量目标不能停留在语义模糊的阶段,要设定具体的、可测量的目标指标,如“降低产品缺陷率到 0.5%”。可测量的目标便于衡量进度和考核达成情况。2.2.质量目标要与业务目标相联动质量目标要与业务目标相联动质量目标要紧密服务于业务目标,比如降低质量成本、提升用户满意度等。要进行业务影响分析,评估质量目标对业务结果的促进作用。3.3.重点关注客户需求重点关注客户需求质量目标的制定要以客户需求为导向,比如提高产品易用性、用户体验等。可以通过客户调研、质量数据分析等确定客户关注的质量要点。4.4.考虑现有资源约束条件考虑现有资源约束条件在设定质量目标时,要考虑现有的资源条件、能力限制,不要设定超出可实现范围的目标。目标要与现状匹配,同时也要有适当的提升空间。设定质量目标时,需要考虑对应的质量指标的数据收集的可行性和采集成本,如有必要,实施改进项目,实现数据采集的数字化手段。5.5.质量目标要层层分解质量目标要层层分解高层的质量目标需要分解为各部门、团队的质量目标,还要分解为每个人员的质量目标,形成全员参与的目标体系。6.6.开展质量目标评审开展质量目标评审设定的质量目标需要提交评审,由质量管理团队、相关部门主管进行评审,确保质量目标合理、可实现。还可以组织专题评审会进行讨论。7.7.持续监控和评估目标达成情况持续监控和评估目标达成情况23质量目标达成情况要定期进行监控,如果出现需要调整的情况,要及时更新和调整质量目标,做到动态管理。3.2.23.2.2 常见质量目标指标常见质量目标指标1.1.产品完成度产品完成度(1)需求通过率(已通过需求/已计划需求),体现需求的完成度,也可以统计为测试用例通过数/计划的测试用例总数计算(用测试用例计算隐含了默认用例覆盖是完全的这样的前提条件)。(2)功能点通过率(已通过功能点/已测试功能点),同上,当需求规模比较大时,功能点统计会更有价值,难点在于,需求功能点需要有额外的过程进行确认,一般在测试分析阶段统计拆分功能点。(3)风险规避情况(已规避风险/已预估风险),产品已知风险的应对情况,需要风险分析过程的支持。(4)需求稳定性(需求变更数/需求总数),衡量一个周期内需求的稳定性。2.2.产品质量产品质量(1)测试通过率(已执行测试数/已计划测试数),比较直观的数据,通过测试的通过率来衡量产品质量。(2)缺陷密度(缺陷总数/千行代码数),缺陷密度对于产品质量而言是非常直观有价值的,但由于千行代码数这一度量并不多用,对测试而言也可能获取存在难度,所以经常可以转化为(缺陷总数/功能点数)*100%、(缺陷总数/对应模块)(缺陷分布率)、(缺陷总数/交付需求数)*100%等计算方式,但是具体选择哪一种计算方式还需要依据团队相关实践来决定。(3)缺陷严重级别分布(对应严重级别缺陷数/缺陷总数),缺陷的数量并不能总是体现出产品实际质量,比如最严重级缺陷过多显然是一个问题,所以缺陷统计应该体现数量和严重级别的二维分布。(4)缺陷类型分布(对应类型缺陷数/缺陷总数),通过对应缺陷类型分布比例来衡量软件某一方面的质量。24(5)缺陷模块分布(对应模块缺陷数/缺陷总数),通过对应缺陷模块分布比例来衡量软件某个模块的质量。(6)缺陷修复率(已修复缺陷数/缺陷总数),缺陷已被修复的比例统计。3.3.测试完成度测试完成度(1)用例覆盖率(已设计用例数/计划设计用例数),用于监控测试设计的进度情况。计划设计用例数这一数字比较模糊可能来自估算。可以采用自下而上的方式收集:即让模块测试负责人进行局部数据收集,再汇总统计。(2)测试执行率(已执行的测试数/计划执行的测试数),测试已被执行的情况,用于测试进度跟踪。执行率并不关注测试失败情况,进一步细化可以展开统计测试通过、失败、阻塞和未执行的比率。(3)测试通过率(已通过测试数/计划执行的测试数),测试通过比率。4.4.研发过程质量研发过程质量(1)缺陷生存周期(缺陷生存总时长/缺陷数),通过统计缺陷从打开到关闭的平均时长,衡量研发团队的缺陷修复能力。(2)测试用例命中率(缺陷数量/用例数量),通过用例发现的缺陷数量统计,衡量测试设计的有效性。(3)二次故障率(缺陷二次重开数量/缺陷总数量),缺陷多次重开会造成缺陷修复周期拉长,说明 1.开发修复缺陷能力存好 2.测试团队缺陷压量存好 3.开发理试之间沟通效率存好,需要具体分析。(4)缺陷有效率(有效缺陷数量/缺陷总数量),测试团队提交的缺陷有多少比重是有效缺陷,应该就具体缺陷失效原因进行分析。(5)缺陷移除率(缺陷当阶段移除数量/当阶段引入缺陷数量),用干统计研发等阶段的缺陷数量和在当阶段被解决的比例,实际是测试尽量介入的体现,比如需求中的缺陷需要在当阶段通过需求评审等手段探测并解决,此数据统计起来有一定难度。255.5.计划偏离度量计划偏离度量(1)工作量偏离(实际工作量-计划工作量)/计划工作量),用于衡量计划的合理度,是否有大量计划外工作未被纳入估算当中。26(2)工作进度偏离(已超出计划进度的时间),通过统计工作进度的偏离来揭示项目时间风险。(3)预算使用比例(已花费测试预算(人/天)/计划总测试预算),用于计算测试预算的花费情况。(4)问题等待时间(具体问题等待解决时间),等待时间通常难以被计划,通过计算等待时间可以帮助衡量项目瓶颈所在,并为后续项目组织提供思路。可细化为需求等待时间,测试阻塞时间等。6.6.产品质量趋势产品质量趋势(1)缺陷到达率(缺陷数量/时间周期),周期性的缺陷接出数量,比如月缺陷到达率,周缺陷到达率,通过持续时间的到达率监控,可以体现项目产品的趋势。(2)缺陷收敛度(缺陷遗留数量/时间周期),通过统计遗留缺陷随时间推移的趋势,判断后续产品质量的走向。理想情况下,单迭代周期内缺陷数量经过集中爆发后,应呈持续走低态势。(3)缺陷引入率(新增缺陷数量/新增千行代码数),用以衡量产品的增量和修改对于质量的影响,也为后续产品的更新迭代提供参考指标。28第四章 建立质量型组织4.14.1 质量型组织设计质量型组织设计质量型组织设计是指在一个组织内部建立一种质量文化,并通过合理的组织结构和职责分工,确保软件研发过程的质量。以下是质量型组织设计的一些要点:1.1.质量型组织结构的确定质量型组织结构的确定根据软件研发规模和组织规模,设计合适的组织结构,明确各级别之间的职责和关系。例如,可以设立质量管理部门或质量保证小组,负责软件研发质量管理体系的建立和实施。2.2.质量职责的分配质量职责的分配将质量职责分配给各个部门或岗位,确保每个部门或岗位都能够承担相应的质量责任。例如,开发部门负责编码和测试,质量管理部门负责质量保证和质量控制。3.3.质量流程的设计质量流程的设计设计合理的质量流程,包括代码审查、测试、缺陷管理等,确保每个环节的质量得到有效控制。同时,需要明确每个环节的责任人和流程执行的标准,以便在具体实施过程中进行统一的指导和要求。4.4.质量工具的配备质量工具的配备根据需要配备相应的质量工具,例如自动化测试工具、代码审查工具、缺陷跟踪工具等。同时,需要明确每个工具的责任人和使用方法,确保工具的有效使用和顺利运行。5.5.质量计划的制定质量计划的制定制定软件研发的质量计划,明确软件研发的质量目标、质量标准、质量保证措施等。同时,需要明确质量计划的执行人和执行时间,确保计划的有效实施。需要注意的是,质量组织设计需要根据具体的组织规模、研发流程和质量要求进行具体的设计和实施。同时,需要根据实际情况不断调整和完善,以确保软件研发过程的质量得到有效控制。294.24.2 质量角色定义质量角色定义质量角色定义是指在一个组织内部明确与软件研发质量相关的各个角色及其职责和权力。以下是质量角色定义的一些要点:1.1.质量经理质量经理质量经理是软件研发质量管理体系的核心角色,负责制定和执行软件研发的质量策略,监督和管理软件研发过程的质量,确保软件产品的质量符合要求。2.2.质量工程师质量工程师质量工程师是负责软件研发质量的技术专家,负责软件研发过程中的质量保证和控制,包括缺陷预防、缺陷检测、缺陷分析和修复等。3.3.需求分析工程师需求分析工程师负责收集、分析和管理项目需求,与产品经理和研发团队紧密合作,确保需求的准确性和一致性。4.4.产品经理产品经理产品经理是负责软件研发需求质量的技术专家,确保将客户需求,准确,清晰,完整地转化为组织内部技术需求。典型的质量相关的行动包括产品定义评审,产品走查,产品验收等。5.5.软件架构师软件架构师架构设计是软件质量的基石。软件架构师是负责软件产品架构的质量的技术专家,确保软件产品的架构设计的合理性,平衡软件产品成本,产品架构的生命周期,技术实现手段与软件质量属性,如可用性,易用性,安全性等之间的平衡。6.6.开发工程师开发工程师开发工程师是软件研发的主要实施者之一,负责按照软件研发的质量要求进行编码和测试,确保软件产品的质量。7.7.测试工程师测试工程师30测试工程师是负责软件测试的专业人员,负责制定测试计划、设计测试用例、执行测试、反馈问题和跟踪缺陷等。8.8.配置管理员配置管理员配置管理员是负责软件配置管理的专业人员,负责配置管理过程,包括版本控制、变更管理、构建和发布管理,确保软件配置的正确性、可追溯性和一致性。9.9.项目经理项目经理项目经理是软件研发项目的管理者,负责协调和管理整个项目的进度和质量,确保项目按照预定的时间和质量要求完成。需要注意的是,质量角色定义需要根据具体的组织结构和研发流程进行具体的设置和分配。同时,需要根据实际情况不断调整和完善,以确保软件研发质量的全面管理和有效控制。4.34.3 质量关系协调质量关系协调质量关系协调是指在一个组织内部协调与软件研发质量相关的各个关系方之间的关系,以确保软件研发过程的顺利进行和软件质量的提高。以下是质量关系协调的一些要点:1.1.内部关系协调内部关系协调内部关系协调主要指在组织内部协调各个部门之间的关系,包括开发部门、测试部门、质量管理部门等。质量管理部门可以作为各部门的桥梁和纽带,协调各部门之间的合作和沟通,确保软件研发过程的质量得到全面管理和控制。2.2.外部关系协调外部关系协调外部关系协调主要指与组织外部的相关方之间的关系协调,包括客户、供应商、第三方机构等。在与客户的协调中,需要明确客户的质量要求和期望,并确保软件研发过程的质量能够满足客户的要求。在与供应商的协调中,需要确保供应商提供的产品和服务符合质量要求,并协调供应商与组织内部的相关方之间的沟通和合作。在与第三方机构的协调中,需要确保第三方机构的评估和审核符合质量要求,并协调第三方机构与组织内部的相关方之间的沟通和合作。3.3.质量问题协调质量问题协调31质量问题协调主要指在软件研发过程中协调解决质量问题的方式和流程,包括缺陷管理、问题跟踪、质量反馈等。在缺陷管理中,需要确保缺陷得到及时报告和反馈,并协调相关方解决和处理缺陷。在问题跟踪中,需要跟踪和监控质量问题,并及时向相关方反馈问题和建议解决方案。在质量反馈中,需要收集和分析质量反馈信息,并协调相关方改进和优化软件研发过程的质量。需要注意的是,质量关系协调需要根据具体的组织结构和研发流程进行具体的协调和管理。同时,需要根据实际情况不断调整和完善,以确保软件研发过程的顺利进行和软件质量的提高。4.44.4 质量管理组织架构质量管理组织架构4.4.14.4.1 质量管理团队组织方式质量管理团队组织方式质量团队的组织方式通常是建立一个专门的质量管理团队,负责质量管理活动和流程的执行。这个团队通常由一些经验丰富的专业人员组成,他们在质量管理领域具有专业知识和技能,以下是一些常见的质量团队组织方式。1.1.质量管理部门质量管理部门建立一个独立的质量管理部门,该部门负责整个组织的质量管理活动。这个部门通常由质量经理或质量总监领导,负责质量管理策略的制定、质量目标的设定以及质量管理过程的规划和执行。2.2.组织级质量管理小组组织级质量管理小组组织内部设立的一个专门的组织级虚拟质量管理小组,通常由质量管理部门牵头,由各相关部门代表组成,他们具备所需质量管理知识和技能,共同制定和推动质量管理策略、指导项目团队进行质量管理活动,以及监督和评估质量绩效。比如按 CMMI 标准设立的EPG 小组,甚至是为特殊的目的成立的质量问题解决小组都属于此类。3.3.项目级质量负责人项目级质量负责人在每个项目中指定一位质量负责人,负责项目级质量管理工作。这些负责人通常是具备质量管理背景和经验的人员,他们负责制定和执行符合组织级质量要求的项目级质量计划、监控项目级质量目标的实现,并协助项目团队进行质量审核和改进活动。项目级质量负责人也有可能虚线汇报给组织级质量管理小组或者质量管理部门中的成员,形成质量管理的层级关系。324.4.组织级质量管理委员会组织级质量管理委员会这是由组织级最高领导者组成的组织级虚拟委员会,该委员会确保:对组织质量管理体系的有效性承担责任;确保制定质量管理体系的质量方针和质量目标,并与组织环境和战略方向相一致;确保质量管理体系要求融入组织的业务过程;促进使用过程方法和基于风险的思维;确保获得质量管理体系所需的资源;沟通有效的质量管理和符合质量管理体系要求的重要性;确保实现质量管理体系的预期结果;促使、指导和支持员工努力提高质量管理体系的有效性;推动改进;支持其他管理者履行其相关领域的职责。组织级质量管理委员的具体开展形式可能是单独的会,由质量部门最高领导牵头,也有可能与其他最高领导层会议,例如总经理办公会,事业部运营会议等合并。这些组织方式的选择取决于组织的规模、结构和需求。不同的组织可能采用不同的方式或结合多种方式来建立和组织质量团队,以确保质量管理活动得到有效执行和协调。重要的是要建立明确的角色和责任分工,以确保质量团队能够有效地推动质量管理工作并实现持续的质量改进。4.4.24.4.2 团队角色团队角色不同的质量团队组织方式,其角色也有一定的差异性,以下给出一些角色建议。1.1.质量管理部门质量管理部门质量经理/质量总监:负责领导和管理质量管理部门,制定质量管理策略和目标,监督33质量管理活动的执行,并与组织高层管理层沟通和协调。质量管理专员/质量管理工程师:协助质量经理进行质量管理工作,包括制定和更新质量管理计划、指导和培训团队成员,监控和评估质量绩效,收集和分析质量数据等。2.2.质量管理小组质量管理小组质量小组负责人:领导和协调质量管理小组的工作,包括制定质量管理策略和目标,分配任务,指导团队成员,确保质量管理活动的执行和进展。质量管理专家:提供专业的质量管理知识和经验,参与制定和改进质量管理过程和方法,指导和培训团队成员,协助质量问题的解决和质量改进活动的推动。3.3.质量管理代表质量管理代表项目质量管理代表:作为项目团队的一员,负责项目的质量管理工作。制定和执行质量管理计划,监督和检查质量控制活动,收集和报告质量指标,协助质量审核和改进活动,确保项目团队按照质量管理要求进行工作。功能团队质量管理代表:作为功能团队的一员(实线或者虚线),负责功能团队内部的质量活动,培训辅导组织新人对流程的理解与答疑解惑,监督审核团队成员组织级工作流程符合性,宣传组织质量文化,培养团队成员的质量意识,推动组织和产品质量的持续改进。4.4.质量管理委员会质量管理委员会委员会主席:主持质量管理委员会的会议,制定议程,确保会议的有效进行,促进成员之间的合作和沟通;部门代表:来自各个部门的代表,负责将部门的质量管理需求和问题提供给委员会讨论,分享和推广最佳实践,参与质量管理政策和流程的制定,协调解决组织层面的质量问题。在团队组织方式下,质量团队角色成员有可能存在跨职能合作,目的是共同推动质量管理和质量改进。同时团队角色需要根据组织的具体需求和特点,进一步调整和补充角色和责任分工,以适应项目和组织的实际情况。35第五章 定义符合质量管理体系要求的流程5.15.1 流程体系设计流程体系设计设计质量管理流程体系时,需要注意以下实践方面:1.1.流程范围确定流程范围确定根据组织情况和质量管理需求,确定流程体系需要覆盖的范围,是否包括需求、设计、编码、测试、发布等全部软件生命周期过程,以及需规划的辅助性质量保证流程。2.2.现状流程分析现状流程分析通过流程绘制、观察、访谈等手段,调研当前的质量管理流程情况,找出存在的问题和改进点。3.3.标杆流程研究标杆流程研究研究行业内优秀公司的质量管理流程模式,借鉴其中可行的元素。同时,参考质量管理标准中对流程的规定。4.4.流程架构设计流程架构设计根据研究结果,设计流程体系的总体框架和结构,确定关键流程和关联关系。采用流程图或模型描述流程架构。5.5.细节流程设计细节流程设计在架构基础上,详细设计每个流程的具体内容和步骤、输入与输出、职责分配、资源需求等。制定流程规范文件。6.6.流程评审优化流程评审优化组织进行流程评审,由流程专家和相关角色负责人参与,提出优化意见。并根据反馈进行迭代优化。7.7.流程支撑系统设计流程支撑系统设计36考虑在流程设计时融入信息系统支持,如质量数据收集和分析系统。提高流程执行效率。8.8.流程改进计划制定流程改进计划制定根据设计结果,制定未来流程优化改进和持续改进的具体行动计划。9.9.流程培训计划准备流程培训计划准备规划对员工开展流程培训的范围、方式、时间等,确保员工理解并能贯彻新的流程。5.25.2 流程管理实施流程管理实施为了有效实施质量管理流程,需要注意以下实际操作方面:1.1.制定实施计划制定实施计划针对不同流程,确定实施的范围、阶段、时间表、资源及工作分解,形成详细的实施计划。2.2.组织实施小组组织实施小组由相关部门负责人及员工组成实施小组,明确小组成员的角色和责任。3.3.开展培训开展培训对涉众员工进行流程培训,确保他们理解新的流程要求。4.4.完善支持系统完善支持系统配套建设或改进相关的 IT 系统,提供流程执行所需的系统支持。5.5.流程规范发布流程规范发布通过手册、在线 Wiki 等方式,发布流程规范,便于员工查询。6.6.组织内部分享交流组织内部分享交流通过召开流程说明会等方式,引导员工就新流程进行讨论和经验分享。377.7.规范测试运行规范测试运行在试运行阶段,监督员工按规范执行,记录问题,及时优化。8.8.正式实施正式实施通过部门会议等方式正式宣布启动新流程,并监督落实。9.9.结果评估结果评估实施后适当时间,评估实施效果,是否达到质量和效率提升的预期。10.10.持续改进持续改进根据评估结果,继续优化流程,使之成为组织的一种习惯。5.35.3 流程体系优化流程体系优化在质量管理流程正式实施后,还需要建立常态化的流程优化和改进机制,具体实践包括:1.1.优化机会识别优化机会识别通过员工建议、客户反馈、质量数据分析、流程评审等方式,识别流程存在的问题点和优化机会。2.2.优化方案提出优化方案提出对应优化点,由流程管理团队和相关角色提出具体的优化建议方案。方案需要论证优化的意义和效果。3.3.定量和定性效果分析定量和定性效果分析评估方案的效果影响,包括对质量、效率、成本等的定量和定性影响。明确优化的价值。4.4.管理层评审管理层评审由高层管理者对优化方案进行评审,确定是否有必要投入资源进行优化。5.5.优化实施优化实施38对获批准的优化方案,制定具体实施计划,安排流程调整和员工培训等工作,将优化落到实处。6.6.效果跟踪验证效果跟踪验证优化实施后,监测流程指标变化,以验证优化效果是否达到预期。持续跟踪效果。7.7.标准化和推广标准化和推广将经验证的优化方案,进一步扩展推广到其他相关流程,并形成标准化的最佳实践。8.8.持续优化文化培育持续优化文化培育通过持续的优化实践,培育员工的流程改进意识,使之成为组织文化的一部分。5.45.4 典型质量管理体系流程典型质量管理体系流程5.4.15.4.1 需求管理需求管理明确用户需求和产品功能,并确保需求和功能能够被追踪和满足。设计并维护需求跟踪矩阵和需求变更控制。需求评审内容和需求分工。1.1.需求质量管理的定义需求质量管理的定义需求质量管理是指通过管理和控制产品需求,确保最终产品或服务能够满足用户的需求和期望。2.2.需求质量管理的重要性需求质量管理的重要性需求质量管理在整个产品开发过程中起着至关重要的作用:(1)提高产品质量:通过清晰、明确的需求,确保项目团队在开发过程中准确地实现需求,从而提高产品质量。39(2)降低成本:有效的需求管理可以避免项目团队在开发过程中出现偏差,确保产品设计和开发的方向正确,从而节省纠正错误的成本。(3)减少风险:通过保持需求的一致性和完整性,降低项目中的成本和风险。(4)增强市场竞争力:提供高质量的产品可以增加客户的满意度,以及在市场上获得竞争优势。3.3.需求质量管理的流程需求质量管理的流程需求质量管理流程包括以下步骤:(1 1)需求获取需求获取需求的收集、分析、细化、核实并组织的步骤,并将它编写成文档。这个活动包括了编写项目视图和范围文档、用户群分类、选择用户代表、建立核心队伍、确定使用实例、召开联合会议、分析用户工作流程、确定质量属性、检查问题报告和需求重用等。(2 2)需求分析需求分析根据需求获取中得到的需求文档,分析系统实现方案。这个活动需要完成下面几个任务:绘制关联图,用于定义系统与系统外部实体间的边界和接口的简单模型;创建开发原型,当开发人员或用户不能明确某些需求时,开发一个系统原型,这样使得许多概念和可能发生的事更为直观明了;分析可行性,在允许的成本、性能要求下,分析每项需求实施的可行性,明确每项需求实现相联系的风险,包括与其它需求的冲突,涉及各类用户的利益平衡,对外界因素的依赖和技术障碍;确定需求优先级:分析方法来确定使用实例、系统特性或单项需求实现的优先级别,以优先级为基础确定产品版本将包括哪些特性或哪类需求;为需求建立模型,为需求建立图形分析模型是软件需求规格说明极好的补充说明,可以为系统需求从多个角度建模;编写数据字典,创建数据字典数据字典是对系统用到的所有数据项和结构的定义,以确保开发人员使用统一的数据定义;40应用质量功能调配,将系统特性、属性与对客户的重要性联系起来,提供了一种分析方法以明确哪些是客户最为关注的特性。(3 3)编写需求规格说明书编写需求规格说明书需求开发的最终成果是客户和开发小组对将要开发的产品达成一致协议,这一协议就是通过文档化的需求规格说明书来体现。需求规格说明书包括项目视图和范围文档说明了系统的业务需求,而使用实例文档则说明了用户需求。这个活动需要完成下面几个任务:采用模版:编写软件需求规格说明书等文档定义一种标准模板,该模板为记录系统需求和各种其它与需求相关的重要信息提供了统一的结构;指明需求来源:为了让所有项目风险承担者明白需求规格说明书中为何提供这些功能需求,要能追溯每项需求的来源,来源可能是一种使用实例或其它客户要求,也可能是某项更高层系统需求、业务规范、政府法规、标准或别的外部来源,这些来源应该记录在需求的跟踪能力矩阵中;为每项需求注上标号:为了满足软件需求规格说明的可跟踪性和可修改性的质量标准,必须唯一确定每个软件需求,制定一种惯例来为需求规格说明书中的每项需求提供一个独立的可识别的标号或记号;记录业务规范:指关于系统的操作原则,比如谁能在什么情况下采取什么动作,将这些编写成需求规格说明书中的一个独立部分或一独立的业务规范文档;创建需求跟踪能力矩阵:建立一个矩阵把每项需求来源、定义与实现、测试它的设计和代码部分联系起来,这有利于需求的管理和需求变更影响范围的评估。(4 4)需求验证需求验证需求的验证是为了确保需求说明准确、完整,表达必要的质量特点,需求将要作为系统设计和最终验证的依据,因此一定要保证它的正确性。需求验证务必确保符合完整性、正确性、灵活性、必要性、无二义性、一致性、可跟踪性及可验证性这些良好特征。这个活动需要完成下面几个任务:审查需求文档,对需求文档进行正式审查是保证软件质量的有效的方法。组织一个由不同代表(如用户,分析人员,设计人员,测试人员)组成的小组,对需求规格说明书及相关模型进行仔细地检查;依据需求编写测试用例,根据用户需求所要求的产品特性写出系统的功能测试用例作为系统测试依据;41编写用户手册,在需求开发早期即可起草一份用户手册,用它作为需求规格说明的参考并辅助需求分析;确定合格的标准,需求说明中描述什么样的产品才算满足用户的要求和适合用户使用的,将合格的测试建立在使用情景描述或使用实例的基础之上。(5 5)需求管理需求管理需求管理是一种用于组织、控制和文档化需求的系统化方法,也是一种建立和维护用户和开发组织对于改变系统功能的协议。需求开发的结果经验证批准就定义了开发工作的需求基线,这个基线在客户和开发人员之间就构筑了一个需求约定,需求管理包括在项目进展过程中维持需求约定一致性和精确性的活动。现在很多商业化的需求管理工具都能很好的支持需求管理活动。这个活动需要完成下面几个任务:确定变更控制过程,建立需求跟踪矩阵(Requirement Traceability Matrix,RTM):它可以帮助团队成员跟踪每个需求的状态,以便进行变更影响范围分析和验证。RTM通常以表格或图形形式表示,其中包含了每个需求的标识符、状态、相关任务、实现人员等信息。通过 RTM,团队成员可以快速了解每个需求的相关信息,并及时发现和解决可能出现的问题。通过需求跟踪矩阵,确定一个选择、分析和决策需求变更的过程,所有的需求变更都需遵循此流程;建立软件变更控制委员会(SCCB,Software Change Control Board):组织一个由项目风险承担者组成的小组作为变更控制委员会,由他们来评估和确定需求变更;进行变更影响分析:评估需求变更对项目进度、资源、工作量和项目范围以及其它需求的影响;跟踪变更影响的产品:当进行某项需求变更时,参照需求跟踪能力矩阵找到相关的其它需求、设计文档、源代码和测试用例,这些相关部分可能也需要修改;建立基准和控制版本:需求文档确定一个基线,这是一致性需求在特定时刻的快照,之后的需求变更就遵循变更控制过程即可;维护变更的历史记录:记录变更需求文档版本的日期以及所做的变更、原因,还包括由谁负责更新和更新的新版本号等情况;跟踪每项需求的状态:这里状态包括“确定”、“已实现”、“暂缓”、“新增”、“变更”等。建立一个数据库,其中每一条记录记录一项需求。425.4.25.4.2 软件设计和编码软件设计和编码在全面质量管理时代,软件研发不仅需要注重结果质量,过程质量同样重要。软件设计与编码阶段是研发过程中十分关键的环节。我们需要制定详尽的软件设计与编码规范,为研发人员提供依据,持续改进研发工作质量,指导团队成员更高效、更高质量地进行研发,最终呈现给用户体验良好、性能优异、稳定性高、安全性高的产品。本阶段遵循以下原则:预防于未然,培育质量意识,降低缺陷率和维护成本。通过严密的过程控制和规范指引,从源头上消除质量问题;统一标准,提高协作效率。制定详尽的规范和标准,为研发人员设计和编码提供明确指南,最终实现设计和代码的高度一致。这可以显著提高团队协作效率;追求工匠精神,打造精品代码。要求研发人员以工匠的态度对待设计和代码,追求精益求精,生成高质量的精品设计和代码。通过严谨的代码评审与检查,不断优化以产出高质量代码。1.1.软件设计与编码流程管理软件设计与编码流程管理本阶段流程图如图 5-1:图 5-1 软件设计与编程流程图43(1 1)需求获取与变更需求获取与变更在需求管理阶段,软件研发团队与需求提出方共同评估相关需求的技术实现可行性,确定最终需求,形成了原型设计和需求规格说明书。当需求方提出需求变更请求时,研发团队首先需要评估技术实现的可行性,其次需要考虑对现有产品逻辑和代码架构的影响。对原有产品和代码有重大影响的变更,需要进行全面、彻底的回归测试。每次需求变更需由需求管理人员修改相关文档,并提交研发团队审核确认,最终版本文档由研发团队管控与存档。(2 2)架构设计架构设计基本原则:在设计架构、应用程序或类时,要考虑代码的扩展性,而不仅仅是实现某些基本功能。常用的设计原则包括:SOLID 原则(单一职责原则、开放封闭原则、里氏替换原则、接口隔离原则、依赖倒置原则)。根据需求,确定所选用的相关技术和框架,例如前端语言及框架、后端语言及框架、数据库、缓存、消息中间件等。依据产品需求规格说明书,设计对应的模块和功能流程,采用适当的设计模式,由研发负责人组织研发工程师制定架构设计图。(3 3)代码开发代码开发搭建初始框架后,按照架构设计图中设计的模块和模式编写相应代码。项目中推荐采用配置管理平台对配置值进行集中管理。(4 4)单元测试单元测试研发过程中,对于常用或核心的模块和算法,应编写相应的单元测试用例。研发人员在开发自身负责的功能模块时,应在交付测试前自行完成测试验证。(5 5)代码重构代码重构研发工程师可对基础模块提出重构申请,或研发负责人在现有代码审核后提出重构要求,评估后安排研发工期。代码重构的最佳实践可以参考重构改善既有代码的设计一书。该书阐述了许多代码重构的技巧与方法,如提炼函数、内联函数、拆分变量、消除重复代码、简化条件表达式等,助于理解代码重构的具体操作与收益。442.2.代码管理代码管理采用统一的代码管理服务器管理和维护研发项目代码。通常研发过程中,配置多个代码分支,比如开发分支、测试分支、预发布分支、发布分支,可以在开发分支上开发,相关功能在测试分支经过审核和测试确认无误后,合并到预发布分支,产品上线发布时则使用发布分支。(1 1)代码审核机制代码审核机制1)上级审核:部门上级对下属提交的代码进行抽查。不符合规范的代码将退回,要求相关人员修改后重新提交。审核时间根据开发时间制定,比如两周一次。审核结果记入代码审核记录表,作为后续绩效评估依据。2)代码互查:部门成员之间采取代码互查。对不规范代码可以告知相关人员进行修正,拒不修改的代码可向上级部门报告。互查时间根据开发时间制定,比如一周一次。互查结果记入代码审核记录表,作为后续绩效评估依据。3)审核重点:查看代码逻辑是否与需求规格说明书中的功能描述一致;查看代码中是否存在严重影响性能的逻辑(如构建大量对象、死循环等,滥用线程sleep 等);边界值判断是否考虑周全(如非空判断);检查其他常见问题。(2 2)代码注释规范代码注释规范为了保证相关代码逻辑清晰,方便功能扩展、代码维护和问题修复,代码注释规范如下:1)核心逻辑部分:相关类、方法、字段都必须添加相应注释;方法内部代码块必须添加相关逻辑描述文字。2)其余部分:尽可能多添加相关代码注释。(3 3)代码命名规范代码命名规范45为确保研发项目整体编码风格的统一,方便团队成员之间的协作和代码维护,应该有组织级的代码命名规范。组织级的代码命名规范一般都是遵循各语言通用的命名规范:如类名通常采用大驼峰命名法,JavaScript、Python、Java 方法名采用小驼峰命名法,C#方法采用大驼峰命名法等。具体可以参考以下规范:谷歌代码风格指南;Vue 风格指南;.NET 设计指南;阿里巴巴移动端开发手册;阿里巴巴 Java 开发手册。(4 4)接口安全规范接口安全规范为确保单个系统的内部安全,系统对外提供接口时,需遵循以下接口安全规范:接口设计采用参数加密 超时处理 私钥验证 HTTPS 机制实现安全性;对于无需登录验证的公开接口,后台需要做好反爬等限流机制以防止服务器过载;对于包含密码、手机号、身份证等敏感信息的接口,敏感信息应进行加密处理,切勿明文传递。(5 5)接口文档规范接口文档规范为减少编写文档时间,方便团队成员之间的协作开发,推荐使用 Swagger 在线文档工具。接口文档规范如下:文档应包含接口功能说明、接口名称、请求路径、访问类型、请求参数说明、返回参数说明、返回错误码说明及作者信息等;对涉及加解密相关的接口,密钥应通过内部邮件、U 盘等方式传递而非在接口说明中公开;生产环境接口应屏蔽 Swagger 接口说明。463.3.数据管理数据管理(1 1)数据管理数据管理采用统一的代码管理服务器管理和维护项目代码。未经部门领导和公司同意,严禁将工作相关代码、资源和数据上传至外部代码仓库、网盘,严禁分享给公司外部人员。违者按违反保密协议进行处理。一般情况下,也不通过聊天工具传输代码。根据业务流程和规则,采用规范的数据建模工具设计数据库表结构、字段属性和约束条件。通过数据建模可以制定出简洁且符合业务需求的数据库设计。数据库设计直接影响软件的性能、扩展性和可维护性。制定数据校验机制,如唯一键约束、非空约束、外键约束等,确保数据的准确性、有效性和业务逻辑正确性。并定期对数据库数据进行校验,发现并修复不一致和异常数据。在系统版本升级或业务需求变更时,可能会涉及到数据的迁移和不同系统的数据集成。制定数据迁移计划和方案,选择合适的工具执行迁移,并在迁移后验证数据的正确性和一致性。对不同系统的数据进行匹配、清洗和汇聚集成,实现跨系统的数据共享和使用。运维人员根据实际需求,按固定周期(小时或天)备份生产环境数据库。定期备份数据库操作记录等。(2 2)数据库操作管理数据库操作管理禁止在生产数据库上直接通过数据库管理工具或 SQL 语句进行数据的增加、修改和删除等操作。如遇特殊情况,需要提前备份相关数据。操作前,需要找另外的研发人员核对相关 SQL 语句逻辑是否正确。操作完成后,需要核对相应数据,确保没有对范围外数据造成影响。软件设计与编码是软件研发质量控制的核心部分之一。良好的设计与编码标准可以大大提高软件质量,减少维护成本,促进研发效率。本部分系统地阐释了代码、接口与数据等方面的规范与管理,为软件研发质量过程控制提供指导与依据。研发团队需要在具体项目中执行这些规范,定期评审实施效果,并根据需要进行持续改进。475.4.35.4.3 软件测试软件测试软件测试是指在软件开发过程中对软件系统进行验证和验证的过程。它旨在发现和纠正软件中的错误、缺陷和问题,并确保软件在发布之前达到预期的质量标准。软件测试可以涉及多个方面,包括功能测试、性能测试、安全性测试、兼容性测试等;从测试层次来看可以区分单元测试、集成测试、系统测试、验收测试等。图 5-2 测试流程481.1.测试流程测试流程软件测试生命周期是一个反复的、循环的过程,其目的是防止软件中的错误。它包括测试分析、计划、设计、设置、执行和测试结束等活动。由于软件的复杂性,如果只进行一次测试,不可能保证产品没有错误。因此,在软件测试生命周期的每个阶段都要进行多项测试。(1 1)测试需求分析测试需求分析这个阶段从测试角度检查功能和非功能需求,以确定可测试的需求。测试团队与客户、解决方案架构师、技术负责人、业务分析师和其他利益相关者与质量保证团队沟通,理解客户的要求,以便根据客户的规格制定测试方案。在本阶段确保对业务需求的正确理解,识别和确定测试需求。(2 2)测试计划测试计划这个阶段根据测试需求,明确测试的目标和范围,选择要进行的测试类型和测试方案;针对测试需求确认和分配角色和责任,以及需要的测试资源和设备。计算测试活动所需的工作量和时间计划表,并与开发人员和产品经理同步。测试计划一般包含测试所需资源,测试工作分工,研发提测节点,回归测试节点等。(3 3)测试用例的编写测试用例的编写测试用例的表现形式直接影响了它的可读性,可维护性。因为一套不易读,冗长繁琐且没有统一规范的测试用例会直接导致测试用例难以阅读和维护;其次还会直接影响到测试执行和结果的正确性。下面总结了三种经典的测试用例编写方法。但是由于不同的团队和不同的项目情况不同,所以没有一种最佳方法适合于所有团队。测试用例编写人员需要根据自己团队和项目的特点和情况,选择适合并且实用的测试用例编写方法,从而更好的维护和执行测试。方法一:操作和执行步骤方法一:操作和执行步骤这是一种常规的测试用例编写方法,通过描述操作和执行系统的步骤来描述测试用例。其优点是非常直观,而缺点是过于繁复。如果操作和执行步骤经常更改的情况下,其维护成本就非常高。所以它适合一些比较稳定,业务需求和执行步骤变更较少的项目。下面是两个实例,展示了两个申请新用户的用例。实例:49用例 1:申请一个新账号成功Given 准备申请一个新的账号When打开“注册”页面并点击“下一步”Then“用户信息”页面成功打开When完成填写“用户信息”页面并点击“下一步”Then“审核”页面成功打开When用户信息审核完成并点击“下一步”Then“申请”页面成功打开用例 2:申请一个新账号失败Given 准备申请一个新的账号When打开“注册”页面并点击“下一步”Then“用户信息”页面成功打开When完成填写“用户信息”页面并点击“下一步”Then“审核”页面成功打开When用户信息审核完成并点击“下一步”Then“申请”页面成功打开方法二:系统或者用户行为方法二:系统或者用户行为在行为驱动开发(BDD)出现后,越来越多的测试用例通过系统行为来编写。其优点是相对于方法一,它非常简练。所以在修改和维护时成本较低。但是它有一个前提,就是50测试执行人员必须了解功能细节的前提下,才能通过行为描述来进行测试。所以这种方法写出的测试用例多数用于自动化测试。下面是将方法一种的两个实例通过行为驱动开发重写后的实例。实例:用例 1:申请一个新账号成功Given 准备申请一个新的账号When完成新账号申请流程Then新账号创建用例 2:申请一个新账号失败Given 准备申请一个新的账号When完成新账号申请流程Then新账号创建方法三:用代码思维编写测试用例方法三:用代码思维编写测试用例方法一和方法二都存在不同程度的重复,不易复用。为了改善或者解决这两个问题,从而进一步增强测试用例的可维护性,降低新增用例和维护已有用例的成本,需要使用代码思维来进行测试用例编写。其核心是尽可能抽象出通用的操作步骤或者系统行为的领域特定语言(DSL),然后通过参数化的方式来进行测试数据传递,从而复用领域特定语言。下面是通过本方法重写方法一和方法二后的实例,它主要体现了众多代码思维中的其中一种,即逻辑与数据分离。步骤实例:用例集 1:申请一个新账号Given 准备申请一个新的账号51When打开“注册”页面并点击“下一步”Then“用户信息”页面成功打开When完成填写“用户信息”页面并点击“下一步”Then“审核”页面成功打开When用户信息审核完成并点击“下一步”Then“申请”页面成功打开数据集:|用户|结果|描述|理查德|成功|他是一名管理员|尼奥|失败|他是一名黑客|行为实例:用例集 1:申请一个新账号Given 准备申请一个新的账号When打开“注册”页面并点击“下一步”Then“用户信息”页面成功打开When完成填写“用户信息”页面并点击“下一步”Then“审核”页面成功打开When用户信息审核完成并点击“下一步”Then“申请”页面成功打开52数据集:|用户|结果|描述|理查德|成功|他是一名管理员|尼奥|失败|他是一名黑客|(3 3)用例评审用例评审在编写测试用例之后,进行审查和验证。邀请其他团队成员、开发人员或领导者参与审查过程,以确保测试用例的准确性、完整性和可理解性。(4 4)测试环境准备测试环境准备1)确定测试环境拓扑结构:根据测试需求和系统架构,确定测试环境的拓扑结构。这涉及到服务器、客户端、数据库、网络设备和其他相关组件的布局和连接方式。2)环境配置和安装:根据测试环境需求和拓扑结构,配置和安装必要的软件和组件。这可能包括被测软件版本、操作系统安装、数据库配置、Web 服务器设置、网络连接等。3)数据准备和导入:根据测试需求,准备测试所需的数据。这可能涉及创建测试数据集、导入现有数据、生成模拟数据等。确保测试数据的完整性、准确性和合理性。4)第三方集成和模拟:如果软件系统需要与第三方系统进行集成,确保第三方系统在测试环境中可用。对于无法直接访问的第三方系统,可能需要使用模拟数据或模拟服务进行集成测试。5)环境验证和确认:在测试环境准备完成后,进行环境验证和确认。确保环境的稳定性、可用性和正确配置。执行一些基本测试,例如网络连通性、服务器访问权限、软件安装验证等。(5 5)测试执行测试执行1)执行测试用例:根据测试计划和测试用例,按照预定的步骤和操作顺序执行测试。记录每个测试用例的执行结果,包括输入、实际输出和预期结果。2)记录测试结果:在测试执行过程中,及时记录每个测试用例的执行结果,保存原始53测试日志等相关记录。这包括记录通过的测试用例、失败的测试用例以及遇到的问题和异常情况。3)跟踪和管理缺陷:如果在测试执行过程中发现软件缺陷,及时记录并报告给相应的负责人或缺陷跟踪系统。包括准确描述缺陷、提供复现步骤和截图,以便开发团队进行修复,验证缺陷是否修复。4)进行回归测试:在所有功能提交测试通过后,执行回归测试,确保验证相关功能是否正常工作,是否引入其他未知缺陷,是否具备版本发布条件。5)如果规划了性能或负载测试,执行性能和负载测试:根据需求和测试策略,执行性能测试和负载测试,评估软件系统在不同负载和压力下的性能和稳定性。(6 6)测试报告测试报告测试报告是测试工作的重要成果之一,它提供了测试执行的详细结果和评估,以便项目团队和相关利益相关者了解软件质量和测试覆盖范围。测试报告的一般内容为:报告概述、测试执行数据、缺陷分析数据、测试结果和评估、性能和负载测试结果(如有)、风险评估、总结和建议,附录和支持文档(测试用例、测试数据、缺陷详情、环境配置)。2.2.测试方法与工具测试方法与工具(1 1)单元测试单元测试单元测试是一种集中测试最小单元(通常是函数、方法或模块)、独立性和隔离性强、功能验证和正确性验证的测试方法;由开发人员执行,旨在提高软件质量、减少错误和缺陷,并支持软件开发过程的可靠性和可维护性。常用的单元测试方法包括:白盒测试、边界值测试、参数测试;单元测试常采用自动化方式进行。(2 2)集成测试集成测试集成测试是验证多个组件或模块在整体上正确集成和协同工作的测试方法,以确保系统的功能和接口符合预期,并检测潜在的问题和缺陷。涵盖系统的主要功能和关键路径,验证系统与外部系统或服务的集成,如数据库、网络服务等。它是软件开发过程中的重要环节,帮助确保系统的稳定性、可靠性和互操作性。常用的集成测试方法包括:自顶向下集成测试、自底向上集成测试、并发集成测试、Big Bang 集成测试、逐步集成测试等。(3 3)系统测试系统测试54系统测试的目标是测试整个软件系统,包括其各个组件、模块和子系统之间的集成和协作。它着重于验证系统的功能、用户界面、性能、安全性、可靠性、兼容性等方面,以确保系统在各种使用场景和负载条件下的正常运行。系统测试可以分为以下几个方面:1)功能测试:验证系统的各项功能是否符合规格和需求,包括核心功能、辅助功能和特定的用户场景。2)性能测试:评估系统在不同负载条件下的性能和响应能力,包括吞吐量、响应时间、资源利用率等指标。3)安全性测试:检查系统的安全性和保护机制,验证系统对潜在威胁的防御能力,如授权验证、数据加密、漏洞扫描等。4)兼容性测试:测试系统在不同操作系统、浏览器、设备和网络环境下的兼容性和可用性。通常手动在不同操作系统、浏览器和设备上进行测试。5)可靠性测试:验证系统的稳定性和可靠性,包括错误恢复、容错机制、日志记录等。6)用户界面测试:评估系统的用户界面的易用性、可访问性和一致性,确保用户能够轻松使用系统并满足其期望。(4 4)验收测试验收测试验收测试的目标是确保软件系统满足业务需求,具备所定义的功能、性能和质量要求。它着重于从最终用户的角度对系统进行测试,以确定系统是否满足用户的实际使用需求和预期效果。验收测试通常由最终用户、客户或业务代表来执行,他们代表了最终使用软件的利益相关者。在验收测试过程中,用户执行一系列测试用例或场景,模拟真实业务操作,验证软件的功能、界面、性能、安全性等方面是否符合预期。3.3.测试用例管理测试用例管理(1 1)介绍介绍在软件测试工作中,测试用例是其最为重要的基础。一个良好的测试用例可以帮助测试人员更容易阅读、理解、修改并管理它,从而提高测试工作的质量和效率。要编写好的测试用例,首先需要对业务需求和验收标准进行深入的分析,并确定业务需求和验收条件的正确性和合理性。然后对其进行测试分析,并完成整体测试用例的设计55和编写,其中包括功能测试用例,端到端测试用例,异常测试用例等等。在分析和设计用例的过程中,可以通过启发式测试策略模型(HTSM)这类方法来进行分析,并通过等价类、边界值、决策表、PairWise 等方法来设计测试用例。其中的难点是如何让测试用例尽可能覆盖到验收标准,从而完成验收功能的高覆盖测试率。并且还要尽可能找到业务需求、技术架构等系统相关的各种限制,通过分析限制可以得到更多的测试用例,包含异常测试用例。对于设计好的测试用例需要进行分类并管理,然后根据不同的分类进行分层测试。通常情况下可以将测试分为端到端测试,功能测试,集成测试,单元测试等。根据这个分类方法,可以方便进行测试分层管理,就是某些测试用例放在端到端测试类型里面,而有些测试用例则放到集成测试类型里面。而根据测试用途还可以将某些类型的测试分类成回归测试、验收测试、健全测试和冒烟测试等。由于一个测试用例可能既属于回归测试,又属于冒烟测试,所以这种情况下就需要一个良好的测试管理系统或者管理方法来对大量的分类后的测试用例进行管理。编写和管理测试用例是测试用例工作中工作量最大、最为繁琐的部分。其质量的高低直接影响到测试工作是不是能高效和顺利地进行并完成。所以结合产品的类型和团队的情况,选择适合自己团队的用例编写和管理方式,从而事半功倍。(2 2)测试用例分类测试用例分类测试用例在来源方面可以分为两大类,即验收测试用例和探索测试用例;在执行方式方面可以分为手动测试用例和自动化测试用例;在用途方面可以分为功能测试用例和非功能测试用例。但是对测试用例进行管理,需要对不同类型的测试用例进行系统化的管理。而对于一个软件系统的测试用例体系化,需要注意以下几个重点:1 1)测试用例分类的三个难点测试用例分类的三个难点难点一,明确清晰的验收条件。难点一,明确清晰的验收条件。验收测试用例的核心就是验收条件,对于明确清晰并且细化到足够程度的验收条件,可以直接转换为或者作为测试用例来使用。但是往往很多情况下验收条件没有细化,甚至不够明确和清晰,存在歧义,从而导致很难设计出足够的用例来映射到所有验收条件,称之为 AC Mapping。难点二,功能测试覆盖率。难点二,功能测试覆盖率。56对于整个软件系统来讲,由于很多验收条件都是一些分散的点,而如何通过分析业务需求和验收条件等来设计测试用例,保证测试用例对于系统功能或者端到端功能场景的全覆盖是一个难点。难点三,功能和系统限制。难点三,功能和系统限制。它的核心是如何通过分析验收条件、业务流程、技术架构等信息,发现某个功能或者系统级别的限制,只要突破这个它们即开始在做探索性测试,它们也可以叫探索性测试用例。无论验收测试用例还是探索性测试用例,都可以使用各种基础的测试用例方法来分析和设计测试用例,比如等价类、因果图、错误推测法或者场景法等等。所以一般情况下,可执行的功能测试用例全集等于验收测试用例与探索式测试用例之和。2 2)测试用例分类的一些注意事项测试用例分类的一些注意事项对于手动测试用例和自动化测试用例,它们只是执行方式的不同。并且大部分情况下,自动化测试用例是从手动测试用例中选出来的一部分子集。除了必须执行的功能测试用例以外,一个软件系统还存在大量的非功能测试用例,比如安全测试、性能测试、易用性测试、兼容性测试等等。对于验收测试用例和探索式测试用例,以及手动测试用例和自动化测试用例,都应该进行统一化管理;对于非功能测试,一般需要与功能测试用例分开进行管理。而对于测试用例本身,需要使用代码化的思维来进行编写、维护和管理,其目标就是易读、易维护、易执行和易管理。为了达到这个目标,还需要克服以下测试用例的难点:自然语言的多样性、数量大、自动和手动难统一。大部分情况下的测试用例都会使用自然语言进行描述。而自然语言的多样性和歧义,可能会让用例设计和编写者以外的手动测试执行人员或者自动化测试开发人员产生误解,从而理解错测试用例,并得到错误的测试过程和结果。其次当测试用例的数量增大以后,比如几千上万的时候,维护和管理的问题也随之困难起来,其中还包括如何统一管理自动化测试和手动测试用例,从而减少对于重叠测试用例的维护和管理。为了解决这些问题,需要用多一些方法,其中包括使用代码式思维来编写测试用例,比如用 DSL 语言、测试步骤和测试数据分离等,其次还需要强大的测试用例管理系统等等。4.4.测试用例测试用例分类与分类与管理管理编写和管理测试用例一直是一件十分繁琐又很难降低成本的工作,为了尽可能降低其成本,测试用例需要具有以下特性:易阅读、易维护、易执行、易管理。而难点也比较突出,其中包括语言的歧义性和多样性导致的不易阅读和理解;手动测试和自动化测试用例很难统一管理和统一执行;当测试数量很大的时候,如果测试用例管理系统不易用,测试用例的复用性也不高,则会导致测试用例不易维护,从而会极大的增加了其管理成57本。所以测试用例的编写需要用到代码思维,比如高内聚、低耦合、易复用、清晰的模块划分等。再加上自动和手动测试用例的统一管理系统,则可以使测试管理更加容易。(1 1)测试用例的管理方法测试用例的管理方法测试用例管理是一项繁琐的工作,所以需要明确的管理流程,下面是一个经典的测试用例管理流程(如图 5-3),项目可以根据自己的特定和需求对这个流程进行修改和定制。图 5-3 测试用例管理流程其次测试用例有四种经典管理方法方法,分别是文件管理、系统管理、代码活文档和系统活文档。与编写用例一样,没有一种用例管理方法是银弹,适合所有不同的团队和不同的项目。所以了解它们的特点,再根据自己团队和项目的实际情况,选择适合的才是最佳实践。方法一:文件管理方法一:文件管理本方法是中小型项目中比较常见的测试用例管理方法。其优势是简单易用,而劣势是需要自己对测试用例模版进行定制,并且当测试用例过多的时候管理成本会急剧增加。其次对于本地文件模式,则很难让多人进行协作编写,但是在线文档没有这个问题。下面是一个 Excel 实例,如图 5-4:58图 5-4 Excel 管理实例图方法二:系统管理方法二:系统管理此类方法一般是中大型项目中最为常用的管理方法,其优势是管理系统提供了强大的管理和协作功能,如协作编写用例、协作执行用例、测试步骤管理、截图管理、测试迭代管理,以及丰富的测试用例和测试结果报表等。因此,它有一定的学习曲线,并且基本上都是界面操作,相对比较烦琐,有些修改很难跟踪,如测试步骤、测试数据的更改等。另外,这种系统一般需要一个独立服务器来部署和运行,相对成本比较高。方法三:代码活文档,自动化测试框架和代码版本工具方法三:代码活文档,自动化测试框架和代码版本工具本方法适合于有足够软件技术工程实践的团队和个人,因为它需要使用到代码版本管理工具、集成开发环境(IDE)、自动化测试框架、持续流水线等实践才能高效的编写、维护、执行、管理测试用例、测试日志和测试结果。本方法的优势是可以同时管理自动化测试用例和手动测试用例,并且更容易跟踪测试用例和测试数据的更改。而劣势是需要测试工程师有足够的工程技术能力来实现。方法四:系统活文档,方法二结合方法三方法四:系统活文档,方法二结合方法三本方法是将代码活文档和系统管理结合,通过测试管理系统编写和管理测试用例,然后59会自动生成代码模式的测试用例。也可以只编写代码模式的测试用例,然后自动同步到测试管理文档中。自动化测试在持续集成流水线执行,通过流水线进行展示并同步到测试管理系统中。手动测试人员执行了手动测试后,将测试结果通过测试管理系统或者在测试代码中进行记录,并最终汇总到测试管理系统的进行统一展示,从而实现了让不同人员可以一起协作分析、设计、管理和执行测试用例的工作。下面是本方法的架构设计图(图 5-5、图 5-6)。图 5-5 系统活文档架构图 60图 5-6 系统活文档架构图 25.5.总结总结测试用例是测试工作的根本,不管是手动测试还是自动化测试的成功,都十分依赖于测试用例的质量。但是只有充分的做好测试分析、设计、编写和管理才能产出一套合格甚至优秀的测试用例套件。从保证测试工作可以高效正确的进行,为产出高质量软件保驾护航。5.4.45.4.4 缺陷管理缺陷管理缺陷的定义可以追溯到 IEEE729-1983 中的描述:“从产品内部看,缺陷是软件产品开发或维护过程中存在的错误、毛病等各种问题;从产品外部看,缺陷是系统所需要实现的某种功能的失效或违背。”缺陷是产品与规定要求不相符的部分,会存在于软件产品的整个生命周期中,通过测试活动及早发现软件系统中的缺陷,并确保缺陷被有效标识、跟踪、和修改,保证软件系统能够达到要求的质量。611.1.缺陷的生命周期缺陷的生命周期缺陷的生命周期就是一个缺陷从新建到关闭的过程,这是一个典型过程(如图 5-7)。在实践应用过程中由于不同的测试管理平台,不同团队的内部实践都会有些细微调整。图 5-7 缺陷的生命周期(1 1)新建新建缺陷发现后,由测试工程师或者其他发现缺陷的人员新建缺陷(推荐采用有缺陷管理功62能的系统来维护,也可以用电子表格维护)。缺陷新建后,提交前可以反复编辑,补充缺陷记录的信息。新建缺陷描述的要求为分类准确、叙述简洁、步骤清楚、有实例、可再现、复杂问题有据可查(截图或上传附件的形式),具体要求为:单一:尽量一个报告只针对一个软件缺陷;简洁:每个步骤的描述应简洁明了;再现:描述重现的步骤和条件,比如具体输入参数值,以便进行回归验证。应提供截图;期望结果:有期望结果描述;实际结果:有实际结果描述;其它信息,可依实际情况增加。(2 2)提交提交测试工程师确认缺陷已经表述清楚,可以提交缺陷。提交后的缺陷状态时“已提交”。缺陷提交前必须分配一个具体的缺陷处理负责,如果测试工程师不确定谁负责,可以把缺陷分配给开发负责人或者项目负责人,由开发负责人重新分配责任人。(3 3)处置处置开发工程师确认缺陷是自己负责后,开始着手处理,并修改缺陷的状态为“打开”,表示缺陷正在处理中。如果开发工程师无法复现或者认为测试工程师的描述不是一个缺陷,可以将缺陷状态改成已驳回,这样缺陷就退回给测试工程师进行再次的验证或丰富的辅助信息描述,再重新进入对应的流程。如果不需要驳回,开发工程师就需要确定是否在当前迭代完成修复,这个一般都是基于缺陷的修复难度、缺陷的影响范围等经团队负责人、需求负责人商讨后做出的判断,如果需要延期修复那么将缺陷状态修改成“延期处理”,缺陷生命周期处理结束,等待下次进入解决阶段后,进入后续处理流程。否则开发工程师完成对应缺陷的修复,在对缺陷处置完成后,需做处置记录:原因:说明缺陷产生的原因,比如:设计考虑不周,边界处理不严密,逻辑判断不合理。要求描述具体简洁,以便总结经验;解决方法:修改稿涉及的文件、源代码、配置、脚本等;概括:缺陷是否可能存在于其他位置,或引起其他问题。63已打开的缺陷也可以修改负责人。(4 4)解决解决问题解决后,填写解决处理记录,写明造成缺陷的原因和解决方案,改变缺陷状态为“已解决”。如果开发工程师发现如下情况,可以把缺陷驳回给测试工程师:缺陷不可再现;与先前登记的缺陷重复;不是缺陷,是测试人员理解错误;缺陷轻微,且修改困难、或修改易导致更大的潜在问题。如果按照开发计划,缺陷发生的功能不属于当前开发阶段必须完成的(需与项目负责人确认)。(5 5)验证验证测试工程师对“已解决”状态的缺陷进行重新测试,测试步骤应当按照等级的可重现步骤进行。(6 6)关闭关闭测试工程师确认缺陷已经解决后,关闭缺陷。对于被开发工程师驳回的缺陷,测试人员需和项目负责人讨论,项目负责人同意的可以关闭,否则需驳回给开发人员。(7 7)重开重开验证测试不通过的缺陷,应当驳回给开发人员,状态为“重新打开”。关闭了的缺陷再次出现时(通常因为解决缺陷的方法导致相同位置出现不同形式的缺陷时),测试人员重新打开缺陷,开发人员需要继续解决。2.2.缺陷的编写规范缺陷的编写规范缺陷描述的清楚与否,可以很好的帮助开发工程师快速定位、解决问题,而且还可以提64高测试工程师基本测试技能。因此,建立标准的缺陷描述规范是十分重要、也是十分必要的。首先清晰的缺陷描述可以帮助开发人员快速定位、解决问题。软件测试部门中员工的水平各有不一,对于缺陷的认知、描述侧重面也会存在不同。因此,如同一个问题,由不同测试工程师描述缺陷,就有可能会存在描述不一致的问题。这就会造成让开发工程师理解不清晰,从而延误解决问题的周期。其次标准的缺陷描述可以提高测试工程师的基本测试技能。如有新入职员工,他可以先从缺陷中查找缺陷了解公司产品的整个开发、研制中产生的问题。而标准清晰的缺陷描述可方便快速的使其尽早、尽快地融入测试部门。另外,对于缺陷的追踪验证时,由于是不同测试工程师进行验证,所以规范的缺陷描述,可以提高测试工程师验证问题的效率。编写一个缺陷需要的必要信息有标题、详情、属性。其中标题是用简洁的话描述该缺陷,主要是让开发知道这是一个什么样的缺陷,主要从功能操作和缺陷现象上描述。详情描述便于开发重现和定位问题,需要描述在什么样的测试环境中,通过什么测试数据,用那几个步骤发现的缺陷,并且要针对缺陷站在测试工程师的角度描述这是一个什么样的缺陷,和预期结果产生了什么样的偏差,过程中尽量提供截图、视频等方式给开发直观的缺陷表述,截图或者录制视频要进来的提供全页面的图像,避免局部截图;属性重点包含验证程度、状态、优先级、提交人等等信息。表 5-8 缺陷的严重程度及说明严重程度严重程度标示标示含义含义例子例子致命1导致软件无法使用问题,例如整个程序崩溃,导致无法使用,测试阻塞。1.问题会自发的影响整个系统。2.用户使用正常的操作步骤,就会影响整个系统提供的服务。3.具有操作先后顺序的功能,已开始的步骤出现故障,导致后续步骤无法使用。1.系统无法访问,崩溃2.死循环3.数据库死锁4.因错误操作导致的程序中断5.数据库连接异常656.主要功能缺失严重2某个功能未实现或导致一个特性或导致一个特性不能运行并且没有替代方案1.功能与需求不相符2.系统接口设计错误3.数据库表、业务规则、缺省值没有完整性约束等4.主要功能错误一般3错误导致了一个特性不能运行但可有一个替代方案。功能特征设计不符合系统的需求,不影响系统的业务,并且有相应的补救方法。1.操作界面问题2.格式、显示问题3.删除没有二次提醒4.数据库大量空字段建议4建设性的意见或建议。需求文档没有规定的特性,如果实现会对系统功能或易用性有所提高。1.辅助性说明不清晰2.提醒交互信息不明确3.UI 设计不符合规范表 5-9 缺陷的状态及说明缺陷状态描述初始状态测试或开发人员提交一个新的缺陷,等待开发人员或项目经理分配66修改负责人确认已经确定是 BUG,但是还没开始修改激活确认了 BUG,并开始修改 bug已解决缺陷已被开发人员修复,等待测试人员验证关闭测试人员验证已修复的缺陷表 5-10 缺陷优先级优先级优先级标示标示含义含义立即解决P0如果故障妨碍开发人员的进一步开发活动,应立即修复。如果阻塞测试,应立即修复。高度重视P1必须修改,版本发布前必须修正正常处理P2必须修改,不一定马上修改,但需确定在某个特定版本发布前必须修正低优先级P3如果时间允许应该修改675.4.55.4.5 配置管理配置管理配置管理是贯穿与整个软件生命周期,为软件研发提供了一套管理办法与活动原则,它是一种 IT 管理流程,用于跟踪 IT 系统的各个配置项目,通过使用配置识别、配置控制、配置状态记录与报告、配置审计等手段,建立并维护工作产品的完整性,以此为所有过程域提供支持。配置管理是一个系统工程流程,用于跟踪和监视对软件系统配置元数据的更改,它强调了对项目的所有的相关产物及其之间的关系都要进行有效管理,从而实现管理项目中的变化,实现不同角色之间的高效协同,并且实现全部的制品过程的可追溯、可审计,从而达到持续的又快又好的交付的目标。配置管理可以提炼成三个方面的内容分别是版本控制、变更控制和过程支持。在应用层面上,配置管理主要包含了代码和制品的配置管理、环境的配置管理和应用的配置管理。代码和制品的配置管理主要包含了组织采用的分支策略,使用的版本管理系统,管理制品的制品库的选择以及对于二方、三方包的依赖管理;环境的配置管理主要是针对应用对外提供服务需要依赖的软硬件、外部系统级依赖等的管理;应用的配置管理是对应用中的一些环境配置、服务配置、数据库配置等。1.1.配置管理及其质量要素配置管理及其质量要素(1 1)代码和制品的配置管理代码和制品的配置管理系统的变更从代码变更开始,那么针对代码的版本控制主要依托于某种版本控制系统。这里特别需要注意的是,版本控制中所说的代码并不仅仅是业务实现代码,还包含了数据库变更代码、测试代码、构建脚本、部署脚本等。先定好一个版本控制系统后,就需要决定团队采用的分支模型,管理变更交付过程中代码仓库中各个分支的关系。针对不同的团队、不同的系统以及不同的交付模式,都应该有最合适的一个分支模型,并没有一个公认的最好的分支模型,“因地制宜”才是最优解。在分支模型的实施过程中,需要将静态代码扫码、单元测试等质量保证活动的结果加入到分支合并的一些质量门禁当中,从而防止代码腐化。从版本控制的代码,经历了构建、测试最后交付到了制品库,完成制品的版本管理。从上面的描述中可以看出制品就是一系列的构建产物(例如二进制包等),制品更加推荐使用制品库管理系统进行管理。在现在制品晋级的理念之下,一次构建多个环境部署的方式越来越收到业界认可,制品库除了管理团队自我构建的包以外,还可以用来管理项目依赖的二方或者三方包。无论是哪一种制品,都推荐有版本控制和语意化版本命名方68式。语意化版本其实是为了能够一样就能看出来版本的变更内容做的一个版本上的定义,一般我们把版本定义为 X1.X2.X3 的三段位,其中 X1 是主版本号,当做了不兼容的修改的时候,才会升级改版本,X2 是次版本号,当做了向下兼容的功能性新增的时候升级这一位,X3 是修订号,当做了向下兼容的问题修正的时候,升级这个版本号。对于制品库中的制品,通常可以使用二进制的一些扫码工具,针对二进制包的安全性进行保证。(2 2)环境配置管理环境配置管理环境配置管理伴随着软件规模的不断增大,持续交付广泛实施变得越来越重要。交付在当前工程实践领域并不再单独交付一个系统,而是交付一个可以对外提供服务的应用,这其中就包含了应用对外提供服务的硬件、操作系统、中间件、数据库等一系列基础设施。通过一些工具可以很方便的定义在那个环境中安装什么软件,启动那个服务,使用那个配置,测试过程需要保证在这些环境管理工具上的环境配置是幂等的、有效的、安全的。(3 3)应用配置管理应用配置管理应用配置管理能够将一切应用程序的运行依赖参数标准化,并可以注入部署包中的服务。应用通过配置的变更管理、推送等功能实现了一次构建多次运行,通过集中管理所有应用环境中的配置,降低分布式系统中管理配置的成本,并降低因错误的配置变更造成可用性下降甚至发生故障的风险。测试工程师要验证应用配置的可用性、有效性,保证对应环境的对应配置是正确的和起效果的。2.2.配置管理的质量约束配置管理的质量约束虽然有格式各样的系统保证配置管理的过程,降低了操作成本提高了自动化程度,但是很多生产故障都和配置参数错误有关,因此对配置参数的变更需要有严格的控制过程和验证流程。配置参数的验证往往是伴随制品晋级的过程进行验证的,也是通过开发、测试、用户验收后才能进入生产环境。同时在变更过程中需要加入人工评审环境,变更的多重保证机制的存在可以从不同角度保证交付的质量,尤其是针对通过某一种开关机制可以控制的配置,其多种控制方式、多种参数参数的交叉验证更应该是不能忽略的配置管理中的质量验证点。针对一次构建,多次部署的应用,不同环境的配置文件需要严格验证,尤其是程序内部需要调取后才能运行的参数,要充分验证不同环境对应参数的有效性和正确性,对于参数配置和应用服务的先后升级关系一定要在团队内达成共识,建立统一约束,统一操作,避免配置文件更新程序读取老配置的常见问题。配置文件验证中最重要的一个环境就密钥、密码的保密性设置,常规是通过配置文件的人工评审来保证的。695.4.65.4.6 发布管理发布管理1.1.发布条件发布条件软件发布前需要满足一定条件,才允许启动发布流程,其中有这几方面报告要求。功能要求:是否进行充分测试活动,是否满足项目期初期制定目标;性能需求:是否进行性能测试,评估性能指标是否实现;安全性需求:项目实现规范性是否满足,对于安全性指标实现情况;易用性及 UI 需求:需经过特定角色验证并达标。发布项目文件、程序等需经过评审会评审通过,其中参与角色包括但不仅限于技术部门、测试部门、产品部门、业务部门等。2.2.发布前准备发布前准备一个项目或版本发布需要有相关的配套文档作为支撑。其中包括:发布说明、产品白皮书、产品说明书、技术说明书、对内培训文档、对外培训文档、用户操作手册、安装说明书、运维手册等。程序版本:确定版本号并进行程序打包;对原程序进行备份;对上线过程进行模拟演练;数据准备:对与历史版本和数据备份、上线验证数据准备、数据预埋;风险管理:应急预案(包含版本回滚)、上线风险点评估;场景设定:针对不同应用场景设定不同的验证方式和验证角色及时间。3.3.发布过程管理发布过程管理版本号管理:新版本版本号管理;70验证管理:按照上线文档进行分布部署并分步对发布产品进行验证,验证过程需区分哪些功能由什么角色验证、什么时间段验证、预埋数据和验证时间;对于验证过程中出现的问题需要按照应急预案进行处理,并将问题及处理方式和结果进行记录;过程文档记录:对于发布的程序进行了哪些验证;对于上线测试用例执行了哪些以及结果如何进行记录;对于无法验证的部分进行归类并阐明原因,最终形成产品上线验证报告。4.4.发布后管理发布后管理版本管理:新版本进行备份;验证跟踪:针对产品特点,在产品发布后,有些功能需长时间跟踪验证,并对结果进行收集、反馈和处理分析;尤其对于上线验证报告中的问题,需重点进行跟进,并及时和相关人员同步处理状态和结果;问题收集处理:产品发布后设定问题收集机制,经收集到的问题区分功能性、非功能性、优化性等进行问题归类,按照线上问题处理机制做出不同的处理决策,并且问题及处理结果,可用于整体项目产品发布质量的考核指标之一,也可用于回顾会上来进行全面深度分析,从而更好的提升团队产品产出质量;运维:产品发布后需要运维长期的跟踪支持,以提升产品口碑,同时不断地进行优化处理提升产品质量。需要格外注重运维服务质量和效率。5.4.75.4.7 回顾与总结回顾与总结软件质量管理体系的一个重要环节就是回顾与总结,通过回顾与总结对过去一段时间内的软件工作进行总结和反思,以评估软件的质量,找出质量保证过程中的问题和不足,并通过建立改进计划、技术改进需求完成团队的自我成长。1.1.迭代回顾会中质量回顾迭代回顾会中质量回顾在项目的迭代过程中,迭代中的质量回顾和总结是在迭代回顾会中完成的,通过总结本次迭代中质量保证相关的经验、教训并进行改善,从而提高团队的交付质量。迭代回顾会中的针对质量的回顾和总结部分是为了达到如下的一些目的:评估上一个迭代中的质量保证相关的流程、活动、工具方面问题和优秀实践;71对发现的问题进行分析,指定改进计划;对优秀实践进行总结,留存到知识库。迭代回顾会上针对质量保证的回顾可以推动内建质量的文化,提高团队的质量意识。因此在团队针对质量的回顾过程中,大家要避免相互指责、推脱责任,而是要建立一种相互支持、相互鼓励的氛围。迭代回顾会从名字中就可以看出每个迭代结束后都会进行的一个环节,因此在回顾会的形式上、相对时间上、参会人员上以及内容环节上是相对固定并且一致的。在参会的人员上比较提倡和项目制品过程相关的所有人都要参加,有一名主持人主持会议,主持人可以是任意角色,不需要固定,但是要有轮值计划,让下一次迭代会的主持人事先就知道自己未来的角色。迭代回顾会应该在迭代完成后尽快召开,在回顾会上鼓励团队成员对质量保证环境、测试流程等任何和交付质量相关的活动进行回顾,提出问题甚至给出改进意见。对于测试工程师,应该针对本次迭代的制品过程中的质量和生产质量做出整体的回顾,针对问题进行总结,并给出改进计划,从而落实 PDCA。团队的负责人则应该关注交付过程中的协作、质量门禁的流程卡点做回顾总结,总体上管控交付过程。两周一个迭代的项目回顾会时长在 1 小时以内,回顾会不要超过 1 个小时,测试工程师的质量回顾不要超过 10 分钟为宜,针对其他迭代周期的回顾,可按需采纳会议时长。具体取决于迭代的时间长度以及团队完成的工作量。改进项可以整理成技术需求故事卡,进入团队的待办事项列表,在后续迭代中进行交付。回顾会常用 5 段式讨论完成,分别是预设会议基调、收集数据、激发灵感、决定做什么和结束会议,具体的实施方法以及其他回顾会的套路、方法可以参加更多的敏捷实践。2.2.月度、季度、年度的质量回顾和总结月度、季度、年度的质量回顾和总结整体的质量回顾和总结一般会按照月度、季度、年度的时间阶段,虽然时间跨度不一致,但是形式、内容方面还是相对一致的,对于月度、季度、年度质量回顾和总结可以从如下几个方面进行确定:目的:为了提高软件产品的交付质量,增加客户满意度,促进团队学习和成长;对象:是软件项目或者软件产品在不同的阶段或者周期范围的的制品过程质量和交付质量;内容:对软件项目或者产品在需求、设计、编码、测试、发布等方面的质量保证活动和质量结果进行评价,分析问题原因和影响,总结经验教训和优化建议;72形式:根据实际情况选择合适的方法和工具,例如文档、汇报、会议等,参与人员包括项目相关人员、客户代表等;结果:形成一个回顾与总结报告或者记录,包含了项目或者产品的质量数据、缺陷分析数据、经验教训数据和改进计划数据等,如果有可转换成技术需求卡的可以讲需求卡的访问链接一并记录在回顾和总结报告中。将月度、季度、年度的回顾和总结进行标准化会是一种更好的实践方式,这样随着团队不断的实践和积累有助于团队资产的积累并增强团队成员之间的信任。也鼓励团队成员对内容、方式给出更多的改进想法,鼓励更多的成员参与,保持会话的活跃度。总体来说这种时间跨度比较大的回顾和总结重点就是发现优秀的质量表现、挖掘质量实践,建立质量回溯机制,如图 5-11 所示。图 5-11 回顾和总结从而通过制品过程中的质量保证和质量问题的回溯达到了质量回顾和总结的闭环。质量保证目的是质量水平的保持,质量回溯目的是质量保证水平的提高。5.4.85.4.8 文档管理文档管理1.1.介绍介绍在软件研发的质量管理中涉及的文档有多种多样,包含了记录软件系统设计信息的软件开发设计类规范性文档,在过程中记录、留痕信息的研发过程文档以及记录质量结果相关文档等。规划文档管理部分的工作是确保组织能够有效地管理和控制所有相关文档,以支持业务的顺利运作和质量管理的实施,文档管理主要涉及了文档标准和流程、文档73分类和存储、文档的访问和权限约束、文档的审计和改进。2.2.文档标准和流程文档标准和流程在组织内部需要有适用于组织的文档标准和流程,包含文档的创建、评审、批准、发布、修订等流程,这些标准和流程需要组织内部全员推广,接受审计。(1)创建:确定需要创建的文档类型和内容,并制定相关的标准和要求,这里面包含了文档的命名要求、特定的文档模板、统一的文档结构、组织级的文档格式和样式等。(2)评审:在文档创建之后,进行文档评审以确保其准确性、合规性和可行性。评审可以由相关部门或指定的人员进行,他们将评估文档的内容、语法、技术要求、法规要求等方面。(3)批准:经过评审后,文档需要获得批准以确保其适用和可靠性。文档批准的过程可能需要相关领导或专门的批准人对文档进行评估并签署批准意见。(4)发布:批准的文档将被发布给相关人员或部门,以确保他们能够访问、使用或参考。文档发布可以通过内部网络、共享文件夹、文档管理系统等方式进行。(5)修订:在使用过程中,文档可能需要进行修订以反映变更、修复错误或改进内容。修订的过程应遵循变更控制的原则,包括记录变更的日期、版本号、修订内容和修订人。(6)注销和销毁:当文档不再需要时,可以根据规定的保留期限进行注销,并销毁。无论是电子文档还是纸质文档都需要确保文档的安全销毁,以防止机密信息泄露或不当使用。3.3.文档分类和存储文档分类和存储文档的分类和存储主要是通过文件管理系统提供一种方式来组织文件,通过目录、子目录等层次结构为文件建立合适的组织方式,根据项目、主题、日期等相关因素进行分类,以便于快速的查找、访问和方便的管理。该部分一些常见的方法包含文档的分类和命名、文件的索引和元数据、安全存储和备份、归档、访问控制、版本控制和物理文档的管理。(1)文档的分类和命名:使用目录、子目录来建立层次化的组织结构。目录可以按照项目、部门、主题、日期等不同的分类方式进行创建,以便将相关文档组织在一起。同时也需要制定一致的文件命名规则,以便于识别和查找文档。命名规则可以包括项目代码、日期、文档类型等关键信息,以确保文件名的描述性和唯一性。74(2)文件的索引和元数据:应该为文档建立索引和元数据,从而可以提供更加丰富的搜索和筛选的能力,元数据的定义可以包括文件名、作者信息、创建的日期、修改的日期、关键字、文档内容摘要等等能够帮助搜索、筛选能力的内容,从而可以实现快速的定位和筛选所需要的文档。(3)安全存储和备份:文档是组织级别资产,要确保存储截止的稳定和可靠,确保文档的安全存储和备份,以防止意外丢失或损坏。这可能涉及使用网络存储、服务器存储、云存储等技术,以及定期进行数据备份和恢复测试。归档:在不同行业,不同公司对过期、过时文档都应该有对应的归档处理,对不再活跃或已过时的文档进行归档和保留。归档的文档应该按照指定的保留期限进行管理,并采取适当的安全措施来保护其完整性和可访问性;访问控制:设置适当的文档访问权限,以确保只有经授权的用户可以访问和修改文档。这包括定义不同用户角色和权限级别,并进行权限管理和访问审计;版本控制:确保文档版本控制的实施,以防止混淆和误用旧版本的文档。这可以包括使用版本号、修订日期、修订记录和变更控制表等工具来管理文档的变更历史和版本跟踪;物理文档管理:对于纸质文档,可以使用物理存储方法,如文件柜、文件夹、标签等,以及档案管理流程来进行分类、存储和维护。4.4.文档的访问和权限约束文档的访问和权限约束文档的访问和权限约束是对文档的使用价值描述,确保文档的访问权限受到适当的管理和控制,以保护机密信息和遵守数据隐私法规。制定合适的权限级别和角色,并实施适当的访问控制措施,主要包含用户角色和权限级别、访问控制、目录权限等方面。(1)用户角色和权限级别:定义不同的用户角色和权限级别,根据用户的职责和需要确定其可访问和操作的权限范围。确保可访问的用户有对应的权限,无法访问的用户无对应权限。(2)访问控制:建立基于角色的访问控制规则,将用户分配到特定的角色,每个角色都有与之关联的权限。这样可以简化权限管理,并根据用户角色的变化自动更新权限,推荐使用访问控制列表(ACL)进行角色和缺陷的控制。(3)目录权限:除了针对单个文档的权限控制,还需要约束对整个目录以及结构层次的权限约束。这样可以实现对目录下所有文档的批量权限管理。76第六章 制定质量考核机制6.16.1 质量检查设计质量检查设计组织常见的质量检查设计包括了组织内部的质量审核,项目关键里程碑的质量评审,版本发布的决策评审等活动。无论何种形式,质量检查的目的是保护客户不被劣质质量的产品所困扰,并能够及早发现,预防问题的漏出,降低组织内耗,提升组织利润率。设计有效的质量检查机制,需要注重以下实际操作细节:1.1.检查标准制定检查标准制定根据过程的输入和输出要求,制定对应的检查标准,如代码规范检查标准、文档质量检查标准。2.2.检查表检查表/列表设计列表设计将检查标准化为可操作的清单,明确检查内容、评分机制、不符项处理等。3.3.检查时机确定检查时机确定确定关键节点进行检查,如需求评审、代码提交检查、文档评审等。4.4.抽查范围确定抽查范围确定根据资源情况,确定抽查的样本量和比例,如抽查 10%的代码提交。5.5.检查人员确定检查人员确定考虑相关角色的专业能力尤其是检查人员,如测试人员检查测试用例。6.6.检查结果记录检查结果记录记录检查发现的问题和改进机会,以进行跟踪和进行数据分析。7.7.质量数据收集质量数据收集77收集质量检查相关的数据,如发现问题的数量、类型和次数等。8.8.改进闭环设置改进闭环设置根据检查结果,推动对应改进计划,形成“检查-改进”的闭环。9.9.检查效果评估检查效果评估定期评估检查机制的效果,如问题发现效率和项目质量提升情况。6.26.2 质量评估执行质量评估执行实施质量评估需要关注以下方面:1.1.评估计划制定评估计划制定明确评估的范围、对象、时间线、资源及方法。评估可面向流程执行效果、产品质量达成程度等。2.2.评估团队组建评估团队组建由熟悉业务与质量管理的资深员工组成评估小组。也可外聘专业评估机构。3.3.评估标准准备评估标准准备依据组织质量目标与标准,制定量化的评估指标与考核标准。4.4.评估实施评估实施采用文档检查、过程观察、数据统计等方式,收集评估证据信息。5.5.评估报告撰写评估报告撰写汇总评估结果,形成评估报告。报告需量化结果,确保结论客观公正。6.6.改进机会识别改进机会识别识别评估中发现的质量问题及改进机会,区分不同类别,按优先级排列。787.7.改进计划制定改进计划制定针对主要问题制定改进方案,确定负责人,考虑所需资源与时间。8.8.改进执行监督改进执行监督跟踪改进计划的执行进度,必要时采取措施,确保改进落地见效。9.9.评估效果确认评估效果确认在下一轮评估中,验证前一轮改进效果,确保问题得到纠正,达到持续改进。6 6.3.3 质量改进闭环质量改进闭环建立质量改进的闭环机制需要注意以下方面:1.1.问题识别问题识别通过各种渠道收集质量问题、客户反馈、员工建议,质量目标的错失,客户审核改进项等,从中识别质量改进机会。2.2.根本原因分析根本原因分析对关键问题进行根本原因分析,找到问题产生的根源,而非仅治标。3.3.改进方案制定改进方案制定针对分析结果,由相关部门、团队集体制定改进方案。4.4.执行计划确定执行计划确定明确改进方案的执行步骤、时间表、资源及职责分配,制定详细计划。5.5.改进执行改进执行按计划组织实施改进措施,确保各项行动落到实处。6.6.效果评估效果评估79在改进后适当时间对效果进行评估,判断问题是否得到解决。7.7.标准化和推广标准化和推广将经验证的改进方案应用到更广范围,并形成规范,避免问题重复出现。8.8.持续改进文化培育持续改进文化培育不断完善闭环流程,使质量改进成为一种组织文化和习惯。81第七章 实施质量培训和文化建设7.17.1 质量培训计划质量培训计划质量团队的培训是提升团队技能和知识水平的关键环节。培训内容包含且不限于以下几方面:1.1.质量管理基础质量管理基础提供质量管理的基本概念和原则的培训,包括质量规划、质量控制、质量改进和度量等方面的知识。团队成员需要了解质量管理的基本流程和技术。2.2.质量管理过程培训质量管理过程培训培训对质量管理过程的要求,包括质量规划、质量控制、质量度量和绩效评估、质量改进等方面。团队成员需要理解并熟悉这些过程的实施步骤和技巧。3.3.领域相关的培训领域相关的培训根据团队所在的行业和项目类型,提供领域相关的培训,例如软件开发方法、测试技术、需求工程等。这些培训可以帮助团队成员在具体的质量管理活动中应用相关的领域知识。4.4.软件配置管理培训软件配置管理培训如果团队负责软件配置管理,需要提供相关的培训,包括配置管理的基本原理、工具和技术的使用方法、版本控制、变更管理等方面的知识。5.5.沟通和协作培训沟通和协作培训团队成员需要具备良好的沟通和协作能力,因此可以提供沟通和协作技巧的培训,包括团队合作、有效沟通、冲突解决等方面的内容。为了更好的组织质量团队培训,建议采取以下步骤:1.1.确定培训需求确定培训需求根据团队成员的角色和职责,确定每个成员需要接受的培训内容,并结合项目和组织的82需求进行评估。2.2.制定培训计划制定培训计划根据培训需求,制定详细的培训计划,包括培训内容、培训形式(例如面对面培训、在线培训、研讨会等)、培训时间和地点等。3.3.确定培训资源确定培训资源确定培训所需的资源,包括培训师资、培训材料、培训设施等。可以考虑内部培训师、外部专家或培训机构的合作。4.4.组织培训活动组织培训活动根据培训计划,安排培训活动的时间和地点,并发送邀请给参与培训的团队成员。确保培训活动的顺利进行,包括提供必要的培训设施和技术支持。5.5.提供培训材料提供培训材料为培训参与者提供相关的培训材料,包括课程大纲、参考资料、案例研究等。这些材料可以帮助参与者更好地理解和掌握培训内容。6.6.进行培训评估进行培训评估在培训结束后,进行培训效果评估,收集参与者的反馈和意见。根据评估结果,对培训进行改进和优化,以提高培训的质量和效果。7.7.持续学习和发展持续学习和发展质量团队应鼓励成员进行持续学习和发展,提供进一步的培训机会和资源,帮助团队成员不断提升质量管理的能力和水平。需要注意的是,培训计划应根据组织的实际情况进行定制化,根据团队成员的角色和职责、项目特点和质量管理需求进行调整。同时,培训应注重实践和案例分析,以帮助团队成员将所学知识应用到实际工作中,并促进知识的分享和交流。7.27.2 质量文化推广质量文化推广构建一个积极健康的质量文化对于质量团队的成功至关重要。以下方式建议能帮助大家83构建一个良好的质量文化:1.1.高层发声高层发声由高管在重要会议和场合发表关于质量的讲话,释放推进质量文化的信号,在整个组织中强调质量意识的重要性。这可以通过培训、宣传和激励机制来实现。质量意识的根本是每个团队成员都要理解他们的工作对最终产品质量的影响,并对提供高质量的成果负责。2.2.宣传推广宣传推广通过内部刊物、宣传海报、邮件等多种方式进行质量文化宣传。3.3.实施质量管理过程实施质量管理过程确保团队遵循一套规范化的质量管理过程,包括质量计划、质量控制和质量改进。这些过程可以帮助团队识别和解决质量问题,并确保在项目的各个阶段都有适当的质量控制措施。4.4.鼓励团队合作鼓励团队合作建立一个团队合作的环境,鼓励团队成员之间的沟通和协作。团队成员应该能够自由地分享知识和经验,并共同解决质量问题。这可以通过定期组织团队会议、知识分享活动和跨部门合作来实现。5.5.典型案例示范典型案例示范总结和展示质量管理良好实践的正面案例,树立典型,进行横向推广。6.6.目标考核目标考核确保团队对质量目标有清晰的理解,并提供可衡量的指标来评估和监控团队的绩效。这有助于激励团队成员努力达到高质量标准,并及时纠正任何潜在的问题。将质量目标纳入员工和部门绩效考核体系,强化质量意识。7.7.培训强化培训强化继续深化质量管理理念培训,使员工形成共同理念。8.8.经验共享经验共享84鼓励知识共享和学习,使团队成员能够不断提升自己的技能和知识水平。这可以通过组织培训课程、工作坊和交流活动来实现。团队成员应该被鼓励参与专业社区,并将新的最佳实践引入到团队中。9.9.授权激励授权激励对在质量管理中表现突出的员工给予授权和激励。10.10.领导力示范领导力示范管理者以身作则,在日常工作中践行质量优先。11.11.持续改进持续改进鼓励团队成员积极参与持续改进活动。建立一个开放的反馈机制,鼓励团队成员提出改进建议并参与改进实施。这可以通过定期审查团队的绩效、收集客户反馈和组织内部审核来实现。86第八章 提供资源保障8.18.1 人力资源配备人力资源配备8.1.18.1.1 人力资源配备要点人力资源配备要点在质量管理体系中,需要关注人力资源的以下配备:1.1.质量管理团队配备质量管理团队配备设立独立的质量管理部门,或在各部门设立质量管理角色,确保质量工作的推进。2.2.培养质量专业人才培养质量专业人才通过内部培养和外部招聘,获取具备质量管理专业知识和技能的人才。3.3.质量管理岗位设计质量管理岗位设计设计质量经理、质量工程师、质量审核员等质量管理岗位,明确岗位职责。4.4.质量考核激励质量考核激励建立质量目标责任制,将质量指标纳入员工绩效考核,形成质量激励。5.5.供应商质量人员交流供应商质量人员交流与重要供应商开展质量管理人员的交流,提升供应链质量意识。6.6.人力资源培训规划人力资源培训规划根据组织质量目标,制定相应的质量管理培训规划。7.7.质量协作机制建设质量协作机制建设通过工作组等形式,促进与其他部门的质量管理人员协作。878.8.质量人才梯队建设质量人才梯队建设关注质量人才的职业规划,建立质量管理人才梯队。8.1.28.1.2 人员管理人员管理要想做好质量管理,需要关注所谓的“铁三角”人、流程、技术,而这三个维度缺一不可。本节主要讨论的就是关于“人”的维度,因为人的因素往往是这三个维度中最重要的。怎样才能进行有效的人员管理,我们可以借鉴人力资源管理领域的四个环节“选、用、育、留”来阐述如何对人员进行管理。1.1.选选“选”就是要选择合适的人员团队。需要注意的是这里提到的“合适”并不是说指要选择资深人员,因为资深人员一般成本会比较高,对于项目而言是需要考虑投入产出比的,所以一个团队不可能全都由“高手”组成。关于如何才能选到合适的人,有以下几点实践可以供读者参考:(1)要明确招聘需求:即要清晰地知道团队需要招什么类型、什么技能、什么背景的人。只有需求清晰了,招聘同事或猎头在寻找候选人的时候才能精准地找到相应合适的人。(2)引入多元化的招聘渠道:不仅仅依赖传统的招聘渠道,如招聘网站和招聘中介,还可以考虑利用社交媒体、校园招聘、员工推荐等渠道,以扩大招聘范围,吸引更多优秀的候选人。(3)简历筛选要注意细节、“管中窥豹”:比如我们在看简历的时候可以检查中文和英文的内容是否对应,以此推论这个候选人是否细心。因为从事质量管理工作的人如果不够细心是做不好的,如果对自己简历中的问题都熟视无睹,那就很难证明他可以做好质量管理。(4)进行有效的面试和评估:设计有针对性的面试问题,结合岗位要求和能力评估,进行综合性的评估。可以采用不同形式的面试,如行为面试、案例面试等,以获取更全面的了解候选人的能力和潜力。可以进行多轮次面试,并让多个面试官参与评估候选人。不同的面试官可以提供不同的观点和评估维度,有助于更全面地评估候选人的能力和适应性。(5)进行背景调查和参考核实:在最后决定前,进行背景调查和参考核实,联系候选88人的前雇主、直属上司或同事,了解他们的工作表现、团队合作能力和职业操守等方面的信息。(6)注重文化匹配:除了技能和经验,确保候选人与组织的价值观和文化相匹配。考虑候选人的工作风格、沟通方式、适应能力等因素,以确保他们能够融入并与团队协作。(7)态度和自学能力比当前所知更重要:我们不要因为候选人个别问题答不出,就断定该候选人不适合。现在不会不代表以后也不会,关键是候选人要有诚恳的态度、主动的意识和较好的自学能力。只要具备这些品质,假以时日,经过一段时间的锻炼后他一样可以成为合格的质量管理人员。2.2.用用“用”是指要用好这些人才,最大化的发挥每个人的能力。关于“用”以下有一些实践可以供读者参考:(1)适应性培训:按照所到的团队培训对应内容,为员工提供适应性培训,帮助他们快速适应组织文化、工作流程和团队合作方式。培训可以包括组织介绍、岗位培训、工作流程说明等,以帮助他们尽快上手。(2)要把合适的人放在合适的岗位中,人尽其才:有人天生就喜欢钻研技术,那可以安排偏技术方向的工作岗位;有人属于外向型,喜欢与人沟通,那就可以安排多与客户或者外部对接的岗位,从而可以发挥沟通能力强的优点。只有把每个人放在自己喜欢而且适合的位置,他才会有很强的主动性。而如果位置放错了,那么这个人不仅会丧失主动性,而且可能还会导致人员流失的风险。(3)做好绩效管理:建立明确的绩效管理体系,设定明确的目标和绩效标准。定期进行绩效评估和反馈,帮助员工了解自己的表现,并提供改进和成长的指导。3.3.育育“育”就是要考虑如何培养人员,帮助他们提升自我。关于“育”有以下一些实践可以供读者参考:(1)采用激励的方式而不是惩罚的方式来培养人才:使用激励方式将会收到更加明显地效果,因为惩罚的方式短期内或许有效,但可持续性不强。激励的方式可以很多种,比如可以搞些内部竞赛赢大奖之类的活动,一方面可以活跃团队气氛,另一方面也可以提高成员学习热情从而增长知识。需要注意的是在进行奖励时物质和精神奖励同样有效。89其实有时候,员工对于领导的认可和表扬可能比给它发点奖金的激励更加有效。(2)建立导师制度:建立导师制度,将新员工与经验丰富的员工或领导者进行配对,进行经验分享和指导。导师可以提供实践经验、指导建议和职业支持,帮助新员工更好地融入和发展。(3)注重对新员工的培养:一般来说新员工刚进公司,对环境比较陌生,心理上会有不安全感。这时如果能对员工多加关心和爱护、帮助员工一起设计和规划未来发展的方向,这对员工以后的成长非常重要。一方面能迅速消除新员工的陌生感,尽快融入团队;另一方面可以按照团队要求的方向去发展,一张白纸总是比涂满色彩的纸张能画出更美丽的图案。(4)定期评估和反馈:进行定期的绩效评估和反馈,与员工讨论他们的职业发展和培训需求。根据评估结果,制定进一步的培训计划和发展机会。(5)建立学习型组织文化:鼓励学习和知识共享的文化,在组织中营造一个积极的学习环境。提供资源和平台,让员工可以分享经验、学习新知识,并互相支持和合作。4.4.留留“留”就是要留住对团队有价值的人员。对团队没有价值或者是“害群之马”,当然需要从团队中移除出去。如何才能留住人才,有以下几点实践供读者参考:(1)要让成员了解团队风格,帮助其适应风格:每个公司、每个组织、每个团队都有自己的风格。作为团队中的一分子,只有适应这个风格,融入到这种风格,才能在团队中稳定下来。如果成员发现不能适应目前团队的氛围,那是很难能留得住人的。(2)主管要多与团队成员沟通:管理学有过一个研究,员工的离职,90%是和他的顶头上司有关。作为团队主管,需要经常性和下属进行沟通,不管是正式的还是非正式的沟通。沟通可以让员工的情绪得到宣泄,起到防微杜渐的效果,比如可以规定自己每周需要和三名下属进行沟通聊天,可以一起喝咖啡或者一起聚餐,这样在相对放松的环境下,员工往往会比较容易敞开心扉,也有助于他释放负面情绪,起到稳定团队的作用。(3)创造内部岗位轮换的机会:有些岗位做了很长一段时间后人就会疲惫,变得没有动力。这时可以考虑团队内部进行轮换。这样一方面让成员保持新鲜感,另一方面也让成员有机会接触和学习新的东西。(4)提供职业发展和晋升机会:为员工提供良好的职业发展和晋升机会。制定明确的晋升路径和发展计划,为他们提供挑战性的项目、培训机会和导师指导,帮助他们实现90个人和职业目标。人员管理只要做好选、用、育、留四个环节,团队就会变得稳定,人员素质就会变得更好,而整个团队效率就会变得更高。8.28.2 基础设施建设基础设施建设质量管理体系需要以下基础设施建设:1.1.质量管理信息系统质量管理信息系统选择或开发质量数据收集、分析和报告的信息系统平台。通常与项目管理信息系统 PMIS合二为一。2.2.质量知识库建设质量知识库建设构建质量管理知识库,收集质量技术文件、最佳实践等。3.3.质量工具配备质量工具配备配备质量控制统计工具、质量函数展开工具、质量成本核算工具等。4.4.测试环境建设测试环境建设提升软件测试环境的覆盖度,配置模拟生产环境中不同软硬件版本,满足测试对环境的要求。5.5.质量管理平台建设质量管理平台建设创建质量管理可视化展示平台,展示质量目标、进度和关键质量指标。6.6.智能质量管理应用智能质量管理应用采用图像识别、大数据分析等新技术提升质量管理能力。7.7.质量管理专家库建设质量管理专家库建设建立内部质量管理专家库,开展经验传递。918.8.质量管理文化场馆质量管理文化场馆建设质量管理主题环境、展览等文化场馆。8.38.3 资源分配保障资源分配保障要确保质量管理体系建设取得进展,需要在以下方面提供资源保障:1.1.预算投入保障预算投入保障在年度预算中,确保质量管理项目和基础建设的资金需求。2.2.人员配备保障人员配备保障根据质量组织结构和岗位设置,逐步补充质量管理人员编制。3.3.能力建设保障能力建设保障按照人员培训规划,逐步扩大培训规模,提升能力。4.4.设备投入保障设备投入保障根据信息化、自动化需求,配备质量管理信息系统。5.5.激励考核保障激励考核保障将质量目标完成情况纳入员工绩效考核体系,形成质量激励。6.6.组织协同保障组织协同保障建立质量管理与其他部门的协作机制,争取组织资源协同支持。7.7.过程管控保障过程管控保障优化质量管理各项流程,提高资源使用效率。93第九章 持续改进与评审9.19.1 内部质量审核(内部质量审核(AuditAudit)内部质量评审指组织内部针对质量管理体系进行的评审活动,开展内部质量评审需要注意以下要点:1.1.评审范围确定评审范围确定明确评审质量管理体系的范围,如某项流程、关键岗位活动等。2.2.评审计划制定评审计划制定确定评审的时间区间、资源投入、评审小组等,形成评审实施计划。3.3.评审标准拟定评审标准拟定根据质量管理体系要求,拟定评审的检查项和评分标准。4.4.评审小组组建评审小组组建由质量管理和相关部门经验丰富的员工组成评审小组。5.5.开展评审开展评审通过访谈、抽查、数据分析等方式,收集评审证据信息。6.6.不合格项处理不合格项处理对发现的不符合项,要求相关方面限期整改。7.7.评审报告撰写评审报告撰写撰写评审报告,记录评审结果、发现问题及整改情况。8.8.评审效果评估评审效果评估94评估评审的覆盖率和效果,不断优化评审工作。9.29.2 外部质量审核外部质量审核外部质量考核是指由组织外部的独立机构或个人对软件研发过程和成果进行评估和考核。与内部质量评审相比,外部质量考核更注重客观性和公正性,因为外部机构或个人通常不具备组织内部的各种利益关系和主观因素干扰。外部质量审核可以简单分类为“二方审核”或“三方审核”。二方审核通常是由甲方客户或者甲方客户委托的第三方对组织进行的审核;而“三方审核”是由独立的,经过授权的第三方机构对组织进行的审核。以下是外部质量考核的一些要点:1.1.审核审核机构选择机构选择选择具备相关经验和资质的外部机构或个人进行质量考核,确保其能够进行客观、公正的评估。2.2.审核范围确定审核范围确定明确外部质量考核的范围,包括需要评估的软件研发阶段、流程、成果等。同时,需要确定考核的目标和期望的结果,以便在考核过程中进行有针对性的检查。3.3.审核标准制定审核标准制定根据软件研发质量管理体系的要求,制定具体的考核检查项和评分标准。这些标准应该与软件研发过程的具体环节相对应,以便在考核过程中进行准确的评估和判断。4.4.考核实施考核实施由外部机构或个人对软件研发过程和成果进行评估和考核,通过访谈、抽查、数据分析等方式,收集能够证明软件研发质量管理体系符合性的证据信息。5.5.不合格项处理不合格项处理在考核过程中发现的不符合项,需要要求相关方面限期整改。对于严重的不符合项,可以采取现场纠正措施或者进行跟踪管理,确保不符合项得到及时有效的解决。956.6.审核审核报告撰写报告撰写考核报告是外部质量考核的重要成果之一,需要详细记录考核结果、发现问题及整改情况。考核报告应该清晰、准确、完整地反映考核过程和结果,以便相关方面了解软件研发质量管理体系的现状和改进方向。7.7.审核效果评估审核效果评估最后,需要对外部质量审核的效果进行评估。评估的内容包括考核的覆盖率、发现问题的数量和质量、整改措施的有效性等。通过评估,可以发现外部质量考核的不足之处,并采取相应的措施进行改进和优化,提高软件研发质量管理体系的整体水平。需要注意的是,外部质量考核通常是基于特定的目的和要求进行的,例如认证、评估、审核等。因此,在具体的实施过程中,需要根据外部机构或个人的要求和标准进行针对性的评估和考核。9.39.3 持续改进机制持续改进机制持续改进机制是指在一个组织内部建立一种机制,通过不断监测、评估、反馈和改进,推动软件研发质量管理体系的持续优化和提升。以下是持续改进机制的一些要点:1.1.建立持续改进的文化建立持续改进的文化在组织内部建立持续改进的文化,鼓励员工积极参与质量改进活动,并营造一种不断追求卓越的氛围。2.2.监测和分析监测和分析通过各种数据监测和分析手段,收集和分析软件研发过程中的数据,包括缺陷率、任务完成时间、代码质量等,以了解软件研发过程的问题和改进空间。3.3.评估和反馈评估和反馈通过定期的评估和审核,对软件研发质量管理体系进行全面的检查和评估,发现并反馈存在的问题和不足之处,提出改进建议和方向。4.4.建立问题跟踪机制建立问题跟踪机制建立问题跟踪机制,对发现的问题进行跟踪和管理,确保问题得到及时有效的解决。同96时,对解决问题的过程进行记录和总结,为将来的改进提供参考和依据。5.5.推广最佳实践推广最佳实践总结和推广软件研发过程中的最佳实践,将成功的经验和方法进行分享和传播,以推动在整个组织内部的经验交流和知识共享。6.6.激励和奖励激励和奖励建立激励和奖励机制,对积极参与改进活动并取得明显成果的员工进行表彰和奖励,以激发员工的积极性和创造性。7.7.持续改进循环持续改进循环持续改进机制是一个不断循环的过程,需要不断监测、评估、反馈和改进。通过不断优化和提升软件研发质量管理体系,可以提高软件研发的效率和质量,为组织的长期发展提供保障和支持。98附录 A 常见的质量管理体系介绍(QMS)不同的行业,价值创造流程会不一样。不存在一套流程适用所有的行业,所以,逐渐形成不同的,具有行业特色的质量管理体系。目前,国际上的质量管理体系标准主要有 ISO9000,卓越绩效模式,QS9000,ISO/TS16949,VDA,TL9000,等。同时,针对软件行业的特殊性,有 IT 软件的 CMMI 软件能力成熟度模型,汽车软件的 ASPICE 评估模型,这些模型都是质量管理体系的有效补充。不同的行业标准,法令法规的要求,会有各自深深的行业烙印,形成行业特色的,必须遵守的规范。体系标准会规定流程必须包含特定的,本行业需要遵守的要求,比如电信行业标准 TL9000 要求必须实现产品需求到产品设计,开发和测试的双向可追踪性。因为行业特色的存在,如果要进入到该行业,成为行业中的一员,组织需要获取本行业必要的质量体系认证,验证和确认体系的适用性和有效性。组织一旦获得了认证并拿到认证证书,就可以对外宣传(但需遵守使用原则)组织已成功获得认证。为保证认证资格的有效性,组织还需要继续实施所有质量体系的要求。认证机构也会定期对标准执行情况要进行检查(监督审核)。认证有效期一般为 3 年,三年后需要再次评价(复评),复评合格更换认证证书。表 A-1 常见的质量管理体系及适用行业行业质量管理体系任何行业ISO9001汽车行业(硬件相关)IATF 16949医疗服务行业ISO13485食品行业ISO99服务行业ISO20000IT 信息技术ISO27001航空工业AS9100D电信/信息通讯TL9000道路交通安全ISO39001图 A-2 是 ISO 国际标准化组织 2018 年对各质量管理体系认证证书的最新调查结果。很明显,ISO9001 仍然是认证证书最多,行业最广的一种认证。图 A-2 ISO 2018 认证调查100ISO9000 族标准是国际标准化组织为适应国际经济技术交流和国际贸易发展的需要而制定的质量管理和质量保证标准,现已有170多个国家采用。特别是2000年最新版ISO9001:2000 质量标准,具有适用性广、通用性强,对与质量有关的活动进行系统控制的优势,其核心内容是“使客户满意”。贯彻 ISO9000 族标准已被众多企业所看重,成为企业证明自己产品质量、工作质量的一种“护照”。A.1A.1 ISO9001ISO9001ISO9001 的核心质量管理体系的架构如图 A-3 所示:图 A-3 ISO9001 的核心质量管理体系的架构具体来讲,ISO9001 结构分为 10 个章节。前面 3 个章节是介绍性的,后面 7 个章节包含质量管理体系的要求。以下是 7 个主要章节的内容。第 4 节:组织的环境本节讨论了理解组织的要求,以实施质量管理体系。它包括识别内部和外部因素,识别相关方及其期望,定义质量管理体系范围以及确定过程及其相互作用的要求;第 5 节:领导作用领导作用要求涵盖了最高管理者在实施质量管理体系方面发挥作用的必要性。最高管理者需要通过确保以顾客为关注焦点,确定和传达质量方针以及在整个组织中分配角色和职责来证实对质量管理体系的承诺;101第 6 节:策划最高管理者还必须策划质量管理体系的持续有效。需要评估质量管理体系在组织中的风险和机遇,并且需要确定改进的质量目标并制定计划以实现这些目标;第 7 节:支持支持这一节规定质量管理体系所有资源的管理,涵盖控制所有资源的必要性,包括人力资源、建筑和基础设施,工作环境,监测和测量资源以及组织的知识。该章节还包括有关能力、意识、沟通和成文信息(过程所需的文件和记录)的控制要求;第 8 节:运行运行要求涉及策划和建立产品或服务的所有方面。本节包括对策划、产品要求评审、设计、外部供方的控制、产品或服务的提供和放行以及不合格过程输出控制的要求;第 9 节:绩效评价本节包括确保监控质量管理体系是否运行良好所需的要求,包括监视和测量过程、评估客户满意度、内部审核以及对运行中的质量管理体系进行管理评审;第 10 节:改进最后一节包括使质量管理体系持续改进的要求。这包括需要评估不合格过程并采取纠正措施。A.2A.2 IATF6949IATF6949(TS16949TS16949)ISO/TS16949“质量管理体系汽车行业生产件与相关服务件的组织实施 ISO9001:2000的特殊要求”。作为汽车生产的两大基地之一,美国三大汽车公司(通用汽车、福特和克莱斯勒)于 1994年开始采用 QS9000 作为其供应商统一的质量管理体系标准;同时另一生产基地,欧洲特别是德国均各自发布了相应的质量管理体系标准,如 VDA6.1、AVSQ94、EAQF 等。因美国或欧洲的汽车零部件供应商同时向各大整车厂提供产品,这就要求其必须既要满足 QS9000,又要满足如 VDA6.1,造成各供应商针对不同标准的重复认证,这就急需要求出台一套国际通用的汽车行业质量体系标准,以同时满足各大整车厂要求。为了协调国际汽车质量系统规范,由世界上主要的汽车制造商及协会成立了一个专门机构,称为国际汽车工作组(International Automotive Task Force,简称 IATF)。IATF的成员由如下 9 家整车厂:宝马(BMW Group),克莱斯勒(Chrysler LLC),戴姆勒(Daimler AG),菲亚特(Fiat Group Automobiles),福特(Ford Motor Company),通用(General Motors Corporation),标致(PSA Peugeot Citroen),雷诺(Renault)和大众(VolksWagen AG)以及 5 个国家的监督机构:美国国际汽车监督局(IAOB),意大利汽车制造商协会(ANFIA),法国车辆设备工业联盟(FIEV),英国汽车制造与102贸易商协会(SMMT)和德国汽车工业协会-质量管理中心(VDA-QMC)组成。IATF 对 3个欧洲规范 VDA6.1(德国),AVSQ94(意大利),EAQF(法国)和 QS-9000(北美)进行了协调,在和 ISO9001:2000 版标准结合的基础上,在 ISO/TC176 的的认可下,制定出了 ISO/TS16949:2002 这个规范(2016 年之后,ISO 和 IATF 组织共同宣布,IATF16949标准名称替代 ISO/TS16949)。2002 年 3 月 1 日,ISO 与 IATF 公布了国际汽车质量的技术规范 ISO/TS16949,这项技术规范适用于整个汽车产业生产零部件与服务件的供应链,包括整车厂,2002 年版的ISO/TS16949 已经生效,并展开认证工作。在 2002 年 4 月 24 号,福特,通用和克莱斯勒三大汽车制造商在美国密歇根州底特律市召开了新闻发布会,宣布对供应厂商要采取的统一的一个质量体系规范,这个规范就是ISO/TS16949。供应厂商如没有得到 ISO/TS16949 的认证,也将意味着失去作为一个供应商的资格。目前,法国雪铁龙(Citroen),标志(Peugeot),雷诺(Renault)和日本日产(Nissan)汽车制造商已强制要求其供应商通过 ISO/TS16949 的认证。ISO/TS16949 是国际汽车行业的技术规范,是基于 ISO9001 的基础,加进了汽车行业的技术规范。目 ISO/TS16949 的最新版本是 2016 版,该版本是基于 ISO900:2015 发展而来,其整体的规范架构基本与 ISO9001 一致。但更着重于缺陷防范、减少在汽车零部件供应链中容易产生的质量波动和浪费,关注产品成本、在供应链中持续不断的改进、产品质量改进、生产力改进、成本的降低、强调缺点的预防、SPC 的应用、防错措施、减少变差和浪费、确保存货周转及最低库存量、质量成本、非质量的额外成本(待线时间,过多搬运)。图 A-4IATF6949 的标准目录结构,可以看出,其目录保持了与 ISO9001:2015的完全一致。而图七则是 IATF 在 ISO900:2015 基础上增加的具体要求示例。103图 A-4 IATF6949 标准目录结构图 A-5 增加具体要求实例ISO/TS16949 标准的针对性和适用性非常明确,只适用于汽车整车厂和其直接的零备件制造商,也就是说这些厂家必须是直接与生产汽车有关的,能开展加工制造活动,并通过这种活动使产品能够增值。同时,对所认证公司厂家的资格也有着严格的限定,那些只具备支持功能的单位,如设计中心,公司总部和配送中心等,或者那些为整车厂家或汽车零备件厂家制造设备和工具的厂家,都不能获得认证。对 ISO/TS16949 认证的管理是由 5 大监督机构代表 IATF 来完成的,它们采用相同的程序方法来监督 ISO/TS16949规范的操作和实施,以在全世界形成一个标准和操作完全统一的系统。对受审核方的要求 ISO/TS16949 认证注册,只适用于汽车整车厂和其直接的零部件制造商。这些厂家必须是直接与生产汽车有关的,具有加工制造能力,并通过这种能力的实104现使产品能够增值。要求获得 ISO/TS16949:2009 认证注册的公司,必须具备有至少连续 12 个月的生产和质量管理记录,包括内部评审和管理评审的完整记录。对于一个新设立的加工场所,如没有 12 个月的记录,也可经评审符合确认质量系统规范要求后,由认证公司可签发由 NQA 颁发的“符合性证明”。当具备了 12 个月的记录后,再进行认证审核注册。经认证获颁证书的机构,如不能继续保持质量体系的正常运转和产品质量的一致性,将有被吊销证书的风险。而 NQA 为获得 IATF 认可的少数认证机构之一,全面开展 TS16949 的认证活动。SNQA 作为 NQA 的亚太总部,积极地为汽车行业供应商及 OEM 的提供认证。SNQA 在中国各地目前拥有近四十名 TS16949 资深审核员,能根据客户需求迅速安排现场审核。A.3A.3 CMMICMMICMMI(Capability Maturity Model Integration For Software,软件能力成熟度模型集成)是在 CMM(Capability Maturity Model For Software,软件能力成熟度模型)的基础上发展而来的。CMMI 是由美国卡耐基梅隆大学软件工程研究所(SoftwareEngineering Institute,SEI)组织全世界的软件过程改进和软件开发管理方面的专家历时四年而开发出来的,并在全世界推广实施的一种软件能力成熟度评估标准,主要用于指导软件开发过程的改进和进行软件开发能力的评估。所以,严格意义上来讲,CMMI不属于质量管理体系标准,是质量管理体系之上的对软件成熟度的能力评估标准。CMMI 模型最初是为了美国国防部衡量其软件承包商的软件产品质量及交付软件产品能力,后期,CMMI 模型从软件工程领域扩展到任何组织,行业,帮助他们开发,改进,度量组织能力及绩效。CMMI 描述的更多的行业认可的标准实践方法,聚焦于如何改进绩效,并将企业运营与商业目标对齐。随着新的工程实践,例如敏捷,CMMI 也与时俱进,与这些新兴的工程实践相结合。图 A-6 是摘自 CMMI Institute 的对企业管理的调查结果,从另一角度进一步说明为什么要引进业界最佳实践:对标和持续改进。105图 A-6 CMMI Institute 对企业管理的调查结果CMMI 模型是由一系列业界的最佳实践方法构成。这些实践方法按照关键业务能力来分类,帮助企业解决其面临的各种挑战,比如,产品工程和产品开发,绩效提高,服务交付及管理,稳定交付,业务可塑性,管理业务风险,选择及管理供应商,质量保证,员工管理等(具体的关键业务能力参见图 A-7)。图 A-7 业务关键能力CMMI 模型包括开发 CMMI 模型,服务 CMMI 模型,供应商管理 CMMI 模型。其中,最常用的模型是开发 CMMI 模型。目前,CMMI 标准的最新版本是在 2018 年 3 月发布的开发 CMMI模型 V2.0,2020 年 4 月份,CMMI 模型 V1.3 版将不再支持。CMMI 开发模型 2.0 版本共包括了 4 大类,9 个能力域,20 个实践域(CMMI1.3 版本称之为流程域,共 22 个流程域。),这 20 个实践域包括(如图 A-8):106图 A-8 二十个实践域1.1.执行类别执行类别(1)质量保证能力(ENQ:Ensuring Quality)RDM:(Requirement Development&Management)需求开发和管理。需求开发的目的在于定义系统的边界和功能、非功能需求,以便涉众(客户、最终用户)和项目组对所开发的内容达成一致。而需求管理的目的是在客户和软件项目之间就需要满足的需求建立和 维护一致的约定;PQA:(Process Quality Assurance)过程和产品质量保证。为项目组和管理层提供项目过程和相关工作产品的客观信息。VV:(Verification&Validation)验证及确认。验证确保选定的工作产品满足需求规格,并确认证明产品或产品部件在实际应用下满足应用要求;Peer Review:同行评估,确保第二双眼睛一起保障质量。(2)产品工程与开发能力(EDP:Engineering and Developing Product)TS:(Technical Solution)技术解决方案。在开发、设计和实现满足需求的解决方案。解决方案的设计和实现等都围绕产品、产品组件和与过程有关的产品;107PI:(Product Integration)产品集成。从产品部件组装产品,确保集成产品功能正确并交付产品。(3)交付与服务管理能力(DMS;Delivering and Managing Service;该能力域属于CMMI 服务模型)SDM:(Service Delivery Management)服务交付管理。产品如何交付给客户,开始产品售后维保期;STSM:(Strategic Service Management)服务管理战略。应组织战略计划需要,如何建立并维护标准服务。(4)供应商选择与管理能力(SMS:Selecting and Managing Supplier)SSS:(Supplier Source Selection)供应商选择。组织如何选择潜在供应商,如何发标书应答等实践(该实践域属于 CMMI 服务模型);SAM:(Supplier Agreement Management)供应商合同管理。如果有外包或采购产品或服务的行为时,旨在对以正式协定的形式从项目之外的供方采办的产品和服务实施管理。组织如何评估,量化供应商的绩效。2.2.管理类别管理类别(1)计划和工作管理能力(PMW:Planning and Managing Work)PP:(Project Plan)项目计划。保证在正确的时间有正确的资源可用。为每个人员分配任务。协调人员。根据实际情况,调整项目;MC:(Monitoring and Control)项目监督与控制。通过项目的跟踪与监控活动,及时反映项目的进度、费用、风险、规模、关键计算机资源及工作量等情况,通过对跟踪结果的分析,依据跟踪与监控策略采取有效的行动,使项目组能在既定的时间、费用、质量要求等情况下完成项目;EST:(Estimating)评估。对开发或收购或交付的解决方案从工作量,时间和成本进行评估,包括工作本身及所需要的资源。评估用来更好的做计划和锁定项目,降低风险;CONT:(Continuity)持续性。对潜在影响公司业务运营的事件或风险提前计划相应的应对措施,保障业务即使在灾难时仍然能够顺利进行(该实践域属于 CMMI 服务模型)。108(2)业务弹性能力(MBR:Managing Business Resilience)RSKM:(Risk Management)风险管理。识别潜在的问题,以便策划应对风险的活动和必要时在整个项目生存周期中实施这些活动,缓解不利的影响,实现目标;IRP:(Incident Resolution&Prevention)服务事件解决及预防。解决产品或解决方案的事件,降低对客户的影响,提高服务效率(该实践域属于 CMMI 服务模型)。(3)人员管理能力(MWF:Managing the Work Force)OT:(Organizational Training)组织培训管理。增加组织各级人员的技能和知识,使他们能有效地执行他们的任务。3.3.支撑类别支撑类别(1)支撑实施能力(SI:Supporting Implementation)CM:(Configuration Management)配置管理。建立和维护在项目的整个软件生存周期中软件项目产品的完整性;DAR:(Decision Analysis and Resolution)决策分析与解决。应用正式的评估过程依据指标评估候选方案,在此基础上进行决策;CAR:(Causal Analysis and Resolution),识别缺失的原因并进行矫正进一步的防止未来再次发生。(2)管理安全能力(Manage Safety)(3)管理信息安全能力(Manage Security)4.4.改进类别改进类别(1)习惯养成及坚持能力(SHP:Sustaining Habits and Persistence)GOV:(Governance)管理架构。提供指南、建议给组织的高层领导,如何赞助,管控流程管理相关的行动,降低流程实施的成本,提高流程与组织目标的契合度;II:(Implementation Infrastructure)实施基础。确保对组织价值重大的流程能够制度化,标准化并持续改进。109(2)绩效改进(IMP:Improving Performance)PCM:(Process Management)流程管理。管理实施对流程和框架持续改进,支持业务目标的实现。识别并实施利益最大化的改进项目,并确保改进结果可见,可用并能制度化,从而形成组织习惯;PAD:(Process Asset Development)流程资产开发。创建相应的流程体系,资产,确保流程的必要更新,与时俱进;MPM:(Managing Performance and Measurement)绩效与度量管理。通过度量数据和分析来管理绩效,达成业务目标。开发和维持度量的能力,以便支持对管理信息的需要。作为改进、了解、控制决策。CMMI 成熟度是分级别的。在 CMMI1.3 共有 5 个级别,代表软件团队能力成熟度的 5 个等级,数字越大,成熟度越高,高成熟度等级表示有比较强的软件综合开发能力。而 CMMI2.0增加了一个 0 级别(见图 A-9)。0 级代表组织能力不存在的,工作可能交付,也可能无法交付,甚至有随时关闭的风险。图 A-9 CMMI2.0 成熟度CMMI 一级,执行级。在执行级水平上,软件组织对项目的目标与要做的努力很清晰,110项目的目标可以实现。但是由于任务的完成带有很大的偶然性,软件组织无法保证在实施同类项目时仍然能够完成任务。项目实施能否成功主要取决于实施人员;CMMI 二级,管理级。在管理级水平上,所有第一级的要求都已经达到,另外,软件组织在项目实施上能够遵守既定的计划与流程,有资源准备,权责到人,对项目相关的实施人员进行了相应的培训,对整个流程进行监测与控制,并联合上级单位对项目与流程进行审查。二级水平的软件组织对项目有一系列管理程序,避免了软件组织完成任务的随机性,保证了软件组织实施项目的成功率;CMMI 三级,明确级。在明确级水平上,所有第二级的要求都已经达到,另外,软件组织能够根据自身的特殊情况及自己的标准流程,将这套管理体系与流程予以制度化。这样,软件组织不仅能够在同类项目上成功,也可以在其他项目上成功。科学管理成为软件组织的一种文化,成为软件组织的财富;CMMI 四级,量化级。在量化管理级水平上,所有第三级的要求都已经达到,另外,软件组织的项目管理实现了数字化。通过数字化技术来实现流程的稳定性,实现管理的精度,降低项目实施在质量上的波动;CMMI 五级,优化级。在优化级水平上,所有第四级的要求都已经达到,另外,软件组织能够充分利用信息资料,对软件组织在项目实施的过程中可能出现的次品予以预防。能够主动地改善流程,运用新技术,实现流程的优化。112附录 B 软件研发质量管理过程常见文档设计实践软件开发设计文档是一种用于记录软件系统设计信息的文档。它描述了软件系统的整体结构、组成部分、模块划分、数据流、算法、接口等关键设计方面的内容。设计文档提供了开发团队成员之间的共享视野,指导开发工作的进行,并为将来的维护和扩展提供依据。在编写软件设计文档时,确保文档清晰、简洁、易读,并遵循一致的格式和规范。考虑到文档的受众,使用清晰的术语和适当的技术表达。及时更新和维护文档,以反映系统的最新状态和变更。B.1B.1 架构设计文档编写架构设计文档编写1.文档概述:在文档的开头,提供对文档的概述和目的的简要描述。说明文档的受众和所关注的重点。2.系统概述:介绍软件系统的整体概述,包括系统的目标、范围和主要功能。说明系统的关键业务需求和技术要求。3.架构目标:阐明系统架构设计的目标和原则。例如,可维护性、可扩展性、性能等方面的目标。4.架构视图:使用适当的图表和图示,描述系统的不同视图,如逻辑视图、物理视图、过程视图等。每个视图都应明确说明其目的、关注点和关键元素。5.系统组成部分:详细描述系统的主要组成部分和模块,包括每个模块的功能、职责和接口。这包括系统内部的组件和外部的集成模块。6.数据流和处理流程:描述数据在系统中的流动和处理过程。说明系统中的关键数据流和处理逻辑,以及数据的输入和输出。7.技术选择和决策:讨论系统设计中的关键技术选择和决策。解释选择的原因、优势和劣势,以及与其他备选方案的比较。8.接口定义:定义系统内部和外部的接口,包括函数、类、模块等的说明和使用方法。描述接口的输入输出、数据格式、通信协议等。1139.性能和可伸缩性考虑:讨论系统设计中的性能和可伸缩性方面的考虑。包括关键性能指标、优化策略、缓存策略、并发处理等。10.安全性和权限设计:阐述系统设计中的安全性和权限控制机制。描述系统的安全需求和安全措施,如身份验证、访问控制等。11.部署和扩展计划:描述系统的部署计划和扩展方案。包括系统的部署拓扑、硬件和软件要求,以及扩展系统的策略和方法。12.附录和参考资料:提供附录和参考资料,如相关的图表、图示、文档、文献、第三方库和工具的使用说明等。13.审查和验证:在完成初稿后,进行内部审查和验证,确保文档的准确性和完整性B.2B.2 模块设计文档编写模块设计文档编写1.文档概述:在文档的开头,提供对文档的概述和目的的简要描述。说明文档的受众和所关注的重点。2.模块概述:对每个模块进行简要介绍,包括模块的功能、职责和关键特点。明确模块在整个系统中的作用和目的。3.接口定义:描述模块的接口,包括输入和输出的数据格式、参数、返回值等。明确模块与其他模块之间的交互方式和接口约定。4.数据结构和算法:描述模块内部使用的数据结构和算法,包括关键的数据结构定义、算法逻辑和处理流程。提供足够的细节以支持模块的实现。5.函数和方法说明:详细描述模块中的函数和方法,包括函数名、参数、返回值、功能和实现逻辑。提供适当的注释和说明以帮助其他开发人员理解和使用。6.异常处理和错误处理机制:说明模块在出现异常和错误情况下的处理方式和机制。包括异常类型、错误码、错误处理流程等。7.依赖关系:说明模块与其他模块之间的依赖关系,包括依赖的模块、接口和数据。确保模块的正确集成和协作。8.测试策略:描述模块的测试策略和方法。包括单元测试和集成测试的计划和用例设计。性能优化和扩展性考虑:讨论模块设计中的性能优化和扩展性方面的考虑。包114括关键性能指标、优化策略、缓存策略、并发处理等。9.安全性和权限设计:阐述模块设计中的安全性和权限控制机制。描述模块的安全需求和安全措施,如身份验证、访问控制等。10.附录和参考资料:提供附录和参考资料,如相关的图表、图示、文档、文献等,以帮助理解和实现模块。11.审查和验证:在完成初稿后,进行内部审查和验证,确保文档的准确性和完整性。B.3B.3 数据库设计文档编写数据库设计文档编写1.文档概述:在文档的开头,提供对文档的概述和目的的简要描述。说明文档的受众和所关注的重点。2.数据库概述:对数据库进行简要介绍,包括数据库的目的、范围和主要功能。明确数据库在整个系统中的作用和目标。3.数据库架构:描述数据库的整体架构,包括数据库服务器的部署和拓扑结构。说明数据库服务器之间的关系和连接方式。4.数据库模式设计:详细描述数据库的模式,包括表、字段、索引、关系等。明确每个表的功能、属性和关系。5.数据表设计:为每个表提供详细的设计说明,包括表名、字段、数据类型、约束、默认值等。明确每个字段的含义和目的。6.关系设计:描述表之间的关系,包括主键、外键、一对一关系、一对多关系等。明确关系的约束和操作。7.数据完整性和约束:阐述数据库的数据完整性要求和约束条件。包括唯一性约束、非空约束、参照完整性等。8.视图和存储过程设计:讨论视图和存储过程的设计和使用,包括视图的目的和内容,以及存储过程的功能和参数。9.数据访问和安全性设计:阐述数据库的访问控制和安全性设计。包括用户权限、角色、审计等方面的考虑。11510.数据备份和恢复策略:讨论数据库的备份和恢复策略,包括备份频率、备份存储位置和恢复流程等。11.性能优化和索引设计:讨论数据库性能优化的考虑和策略,包括索引的设计和优化。12.数据库扩展计划:描述数据库的扩展计划和策略,包括数据增长的预测、容量规划和扩展方法。13.附录和参考资料:提供附录和参考资料,如数据库模型图、表结构定义、索引设计等,以帮助理解和实现数据库。14.审查和验证:在完成初稿后,进行内部审查和验证,确保文档的准确性和完整性。B.4B.4 接口设计文档编写接口设计文档编写1.文档概述:在文档的开头,提供对文档的概述和目的的简要描述。说明文档的受众和所关注的重点。2.接口类型和范围:明确系统中涉及的接口类型,如应用程序接口(API)、网络接口、服务接口等。定义接口的范围和功能。3.接口命名和版本控制:定义接口的命名规则和版本控制策略。确保接口具有唯一的标识符,并能够支持接口的演进和兼容性。4.接口描述和功能说明:对每个接口进行详细描述,包括接口的功能、输入参数、返回值、异常情况处理等。说明接口的预期行为和使用方法。5.输入和输出数据格式:定义接口的输入和输出数据的格式,如数据类型、数据结构、数据编码等。确保接口的数据交换格式一致和可理解。6.接口调用示例:提供实际的接口调用示例,包括请求的数据、参数设置和响应的数据。帮助开发人员理解接口的使用方法和实际效果。7.接口认证和授权:讨论接口的认证和授权机制,包括身份验证、令牌管理、权限控制等。确保接口的安全性和合法性。8.接口错误处理和异常情况:说明接口在遇到错误和异常情况时的处理方式和返回结果。定义错误码和错误信息的规范。1169.接口依赖和关系:描述接口与其他模块、组件或系统之间的依赖关系。确保接口的正确集成和协作。10.接口文档和工具支持:提供相关的接口文档和工具支持,如代码示例、SDK、文档链接等。帮助开发人员快速理解和使用接口。11.附录和参考资料:提供附录和参考资料,如相关的图表、图示、文档、文献等,以帮助理解和使用接口。12.审查和验证:在完成初稿后,进行内部审查和验证,确保文档的准确性和完整性。B.5B.5 数据流图文档编写数据流图文档编写1.文档概述:在文档的开头,提供对文档的概述和目的的简要描述。说明文档的受众和所关注的重点。2.数据流图类型:明确使用的数据流图类型,如数据流程图(DFD)或统一建模语言(UML)中的活动图。说明数据流图的范围和目的。3.系统概述:对系统进行简要介绍,包括系统的主要功能和数据流。概述系统中数据流图的位置和作用。4.数据流图符号和约定:定义数据流图中使用的符号和约定,包括外部实体、过程、数据流、数据存储和数据转换等。5.上下文级数据流图:绘制系统的上下文级数据流图,描述系统与外部实体之间的数据流动。说明外部实体和系统的交互过程。6.进一步细化:对上下文级数据流图进行进一步细化,逐步展开系统的各个功能模块和子过程。绘制层级逐渐增加的数据流图。7.过程描述和功能说明:对每个过程或功能进行详细描述,包括过程的功能、输入数据流、输出数据流和处理逻辑。说明数据的加工和转换过程。8.数据存储:描述数据存储的类型、内容和用途。说明数据存储与其他过程或功能之间的关系。9.数据流跟踪:跟踪和标识数据流在数据流图中的路径和转换过程。确保数据流在系统中的正确流动和处理。11710.异常处理和错误流:讨论异常情况的处理方式和错误流的流向。描述错误处理和异常处理的过程和逻辑。11.附录和参考资料:提供附录和参考资料,如相关的图表、图示、文档、文献等,以帮助理解和使用数据流图。12.审查和验证:在完成初稿后,进行内部审查和验证,确保文档的准确性和完整性。B.6B.6 详细算法和数据结构描述详细算法和数据结构描述1.1.算法描述:算法描述:(1)算法目的:明确算法的目的和所要解决的问题。(2)输入和输出:描述算法的输入和输出,包括数据类型、数据结构和数据格式。(3)步骤和流程:逐步描述算法的执行步骤和流程。使用适当的结构和语法来清晰地表示每个步骤。(4)循环和条件:处理循环和条件语句时,确保算法的正确性和可读性。使用适当的控制结构和逻辑表达式。(5)变量和数据结构:描述算法中使用的变量和数据结构,包括它们的类型、命名和作用域。(6)时间和空间复杂度:讨论算法的时间复杂度和空间复杂度,以评估算法的效率和资源消耗。2.2.数据结构描述:数据结构描述:(1)数据结构类型:明确数据结构的类型,如数组、链表、栈、队列、树等。(2)结构定义:描述数据结构的定义,包括字段、属性和关联的数据类型。(3)操作和方法:列出数据结构的操作和方法,包括增、删、改、查等。描述每个操作的功能和实现细节。(4)数据存储和访问:讨论数据结构的存储方式和访问方式,如索引、指针等。118(5)使用示例:提供使用数据结构的示例代码,演示数据结构的创建、初始化和使用过程。3.3.清晰可读性:清晰可读性:(1)使用适当的命名:为算法和数据结构中的变量、函数、方法和类选择清晰、具有描述性的命名。(2)代码注释:在关键位置添加注释,解释代码的意图、实现细节和关键步骤。(3)格式化和缩进:保持代码的良好格式化和缩进,以提高可读性和可理解性。(4)图表和图示:使用适当的图表、图示和示意图来解释算法和数据结构的逻辑和操作过程。在完成初稿后,进行内部审查和验证。确保算法和数据结构描述的准确性、完整性和一致性。编写详细的算法和数据结构描述时,需要注重准确性、清晰性和易读性。使用合适的术语和逻辑结构来表达算法和数据结构的思想和实现细节。适当地使用图表和图示来支持文档的可视化和理解。B.7B.7 编码过程文档编码过程文档在软件开发的编码阶段,以下是常见的文档需要维护:1.源代码文档:对于每个代码文件或模块,编写代码注释来解释代码的功能、输入参数、输出结果和实现细节。这些注释可以作为源代码文档的一部分。2.编码规范:虽然编码规范不是直接的文档,但在编码阶段需要遵守和维护团队的编码规范。编码规范确保代码风格的一致性和可读性。3.单元测试文档:记录软件系统的单元测试用例、预期结果和实际结果,用于验证代码的正确性和健壮性。B.8B.8 源代码文档编写源代码文档编写1.1.代码注释代码注释(1)在关键代码块、函数、方法和类的上方添加注释,简要解释其功能和用途。119(2)使用自然语言描述代码的行为和意图,帮助读者理解代码的用途和预期结果。(3)解释输入参数和返回值的含义和格式,以便其他开发人员正确使用代码。2.2.函数和方法文档函数和方法文档(1)对于每个函数和方法,编写文档说明其功能、输入参数、返回值和使用方法。(2)使用规范的注释标记(如 Java 中的 Javadoc、Python 中的 docstring)来定义和格式化函数文档。(3)提供示例代码和使用说明,以帮助其他开发人员正确调用和使用函数。3.3.类和模块文档类和模块文档(1)对于每个类和模块,编写文档说明其功能、设计目的和关键属性。(2)解释类之间的关系和依赖关系,以帮助其他开发人员理解代码的整体结构。(3)提供示例代码和使用说明,以展示类和模块的正确使用方法。4.4.文件头注释文件头注释(1)在源代码文件的顶部添加文件头注释,包括文件名、作者、创建日期和简要描述。(2)提供版权声明和许可证信息,确保代码的合法性和合规性。5.5.变更记录变更记录(1)在源代码中记录对代码进行的重要更改和修复。包括修改日期、作者、变更类型和详细描述。(2)使用版本控制系统的提交消息或注释,或者在代码中添加特定的注释标记(如TODO、FIXME)来跟踪变更。6.6.示例和说明示例和说明(1)提供实际的示例代码,演示如何使用和调用源代码的不同功能和场景。(2)解释示例代码的输出和期望结果,确保其他开发人员理解和验证代码的行为。1207.7.异常处理异常处理(1)对于可能引发异常的代码块,提供注释或文档说明处理异常的方式和逻辑。(2)解释异常类型、错误处理和恢复机制,以帮助其他开发人员正确处理和处理异常。8.8.代码结构和命名代码结构和命名(1)使用清晰、一致的命名约定和代码结构,以提高代码的可读性和可维护性。(2)在注释中解释和说明自定义的命名规则或约定,以帮助其他开发人员理解代码的结构。B.9B.9 编码规范编写编码规范编写1.清晰明确:确保编码规范的规则和指导准确、清晰明确。使用简洁明了的语言和术语,避免歧义和模棱两可的描述。2.统一风格:编码规范应确保代码风格的一致性。规定代码缩进、命名规则、注释规范、代码结构等方面的规则,以确保代码易读、易维护。3.可读性和可理解性:强调代码的可读性和可理解性。建议使用有意义的命名、注释和文档,以及清晰的代码结构和逻辑。4.命名规则:规定变量、函数、类和文件等的命名规则。建议使用有意义的名称,避免使用缩写和不明确的命名。5.缩进和格式化:规定代码缩进的方式和格式化的规则。建议使用一致的缩进风格,如空格还是制表符,并规定代码块的大括号位置和换行规则。6.注释规范:规定注释的格式和使用规则。建议提供函数和方法的注释,解释其功能、输入参数、返回值和使用方法。注释还可以用于解释复杂的算法和处理逻辑。7.异常处理:规定异常处理的标准和实践。建议捕获并处理可能出现的异常情况,以确保代码的健壮性和可靠性。8.最佳实践:推荐使用编程语言和平台的最佳实践。避免已知的编码陷阱和反模式,以提高代码质量和性能。1219.文件组织:规定代码文件的组织结构和目录命名规则。建议按照功能、模块或层次进行文件组织,以便于代码的查找和维护。10.版本控制:规定代码版本控制的策略和实践。建议使用版本控制工具,并定义提交和分支策略。11.可扩展性和可维护性:考虑到未来的需求变化和代码的可扩展性。规定代码模块化、接口设计和可测试性等规则,以支持代码的持续演进和重用。12.静态分析和代码审查:建议使用静态代码分析工具进行代码质量检查。推荐定期进行代码审查,以确保代码符合编码规范和最佳实践。B.10B.10 单元测试文档编写单元测试文档编写1.文档概述:在文档的开头,提供对文档的概述和目的的简要描述。说明文档的受众和所关注的重点。2.测试目标和范围:明确单元测试的目标和范围。描述要测试的模块、函数或类的功能和行为。3.测试用例设计:设计全面而有针对性的测试用例。覆盖不同的测试场景、边界条件和异常情况。确保测试用例具有可重复性和独立性。4.输入和预期输出:对于每个测试用例,明确输入数据、参数设置和预期的输出结果。确保预期结果符合预期行为和预期值。5.测试环境和依赖项:描述测试环境的配置和依赖项。包括测试框架、测试数据和测试工具等。6.执行步骤和方法:提供测试用例的执行步骤和方法。描述如何准备测试环境、执行测试用例和记录测试结果。7.异常处理和错误报告:讨论在测试过程中遇到的异常情况和错误处理方式。描述如何记录和报告错误,以便开发人员进行修复。8.期望覆盖率:明确所需的代码覆盖率目标。根据项目的要求确定满足可靠性和质量标准的最低覆盖率。9.测试结果和统计:记录测试的执行结果和统计数据。包括测试通过的用例数量、失122败的用例数量、覆盖率等。10.维护和更新:及时更新单元测试文档,以反映代码和需求的变更。确保文档与实际代码的一致性。B.11B.11 测试文档分类测试文档分类软件测试文档通常包括以下内容:1.测试计划:描述测试的范围、目标、资源需求、进度安排、测试阶段(单元测试、集成测试等)和测试策略。测试计划还确定测试的方法和技术,例如手动测试或自动化测试。2.测试用例:测试用例是一组明确的步骤和输入,用于验证软件的特定功能或特性。测试用例描述了预期的结果和实际结果之间的差异。3.缺陷报告:缺陷报告用于记录在测试过程中发现的问题或错误。它们描述了缺陷的详细信息,例如缺陷的类型、严重程度、复现步骤和环境条件。4.测试结果:测试结果文档记录了每个测试用例的执行结果,包括通过的用例、失败的用例和跳过的用例。测试结果文档还可以包括非功能性测试,如性能测试,安全测试,压力测试,稳定性测试等的结果。以及测试验证和确认。5.测试环境配置:测试环境配置文档描述了在测试期间使用的硬件、软件和网络配置。它确保测试团队使用相同的环境进行测试,并提供必要的背景信息。6.测试验证和确认:测试验证和确认文档用于记录测试团队和利益相关者之间的讨论和批准。它们可以包括测试计划、测试用例和测试结果的确认。7.测试报告:测试报告用来汇总不同测试阶段/类型的测试整体状态,包括测试的覆盖率,测试通过率,测试进展,失败测试分析以及影响测试进展的重点缺陷等信息。测试报告用于测试团队和利益相关者之间的讨论打合批准。B.11.1B.11.1 测试文档编写测试文档编写测试文档的目的是确保测试过程的可追溯性和透明性。它们提供了对软件质量和可靠性的评估,帮助团队识别和解决问题,并最终改进软件的质量。123编写测试文档时需要遵循一些原则,以确保文档的质量和有效性。通常包括以下编写原则:1.清晰和简洁:测试文档应该清晰明了,使用简洁的语言和结构,以便读者能够轻松理解文档的内容。避免使用过于复杂的术语和技术语言,除非在必要的情况下提供适当的解释。2.完整和详细:测试文档应该提供足够的信息,以便读者能够理解测试的目的、步骤和预期结果。确保测试用例覆盖了所有关键的功能和场景,并描述了预期的结果和实际结果之间的差异。3.可追溯性:测试文档应该具有良好的追溯性,即能够追踪到测试需求、测试用例和测试结果之间的关系。确保每个测试用例都与相关的需求或功能进行关联,以便能够准确地跟踪测试覆盖和测试进度。4.一致性:在编写测试文档时,保持一致性非常重要。使用相同的术语、格式和结构,以便读者能够更容易地理解和比较不同部分的内容。此外,确保测试文档与其他相关文档(如需求文档)之间的一致性。5.可更新性:测试文档应该是可更新的,以反映软件开发过程中的变化。及时更新测试文档,以便与软件的最新版本保持一致,并反映新的需求、改进或修复。6.可验证性:测试文档中的信息应该是可验证的,即其他团队成员或利益相关者可以独立验证测试的结果和结论。提供清晰的步骤、输入和预期结果,以便他人能够重现测试过程并验证测试的有效性。这些原则有助于确保测试文档的质量和可用性,提高测试的效率和准确性。根据具体的项目和团队需求,还可以根据实际情况制定其他适用的原则。B.11.2B.11.2 测试计划编写测试计划编写测试计划一般包括测试目标、测试概要、测试范围、重点事项、质量目标、资源需求、人员组织、测试策略、发布提交、测试进度和任务人员安排、测试开始/完成/延迟/继续的标准、风险分析。1.测试目标:对测试目标进行简要的描述。2.测试概要:摘要说明所需测试的软件、名词解释、以及提及所参考的相关文档。1243.测试范围:测试计划所包含的测试软件需测试的范围和优先级,哪些需要重点测试、哪些无需测试或无法测试或推迟测试。4.重点事项:列出需要测试的软件的所有的主要功能和测试重点,这部分应该能和测试案例设计相对应和互相检查。5.测试沟通:包括测试解脱的沟通汇报机制,关键测试干系人分析,沟通的方式(会议,报告或者数字化工具展现)等.6.质量目标:制定测试软件的产品质量目标和软件测试目标。7.资源需求:进行测试所需要的软硬件、测试工具、必要的技术资源、培训、文档等。8.人员组织:需要多少人进行测试,各自的角色和责任,他们是否需要进行相关的学习和培训,什么时候他们需要开始,并将持续多长时间。9.测试策略:制定测试整体策略、所使用的测试技术和方法。10.发布提交:在按照测试计划进行测试发布后需要交付的软件产品、测试案例、测试数据及相关文档。11.测试进度和任务人员安排:将测试的计划合理的分配到不同的测试人员,并注意先后顺序.如果开发的Release不确定,可以给出测试的时间段.对于长期大型的测试计划,可以使用里程碑来表示进度的变化。12.测试开始/完成/延迟/继续的标准:制定测试开始和完成的标准;某些时候,测试计划会因某种原因(过多阻塞性的 Bug)而导致延迟,问题解决后测试继续。13.风险分析:需要考虑测试计划中可能的风险和解决方法。B.11.B.11.3 3 缺陷报告编写缺陷报告编写缺陷报告是在软件测试过程中记录和报告发现的问题或错误的文档。它用于描述在测试过程中发现的缺陷、缺陷的详细信息以及缺陷的严重程度。缺陷报告通常包括以下内容:1.标题和摘要:缺陷报告应该具有一个清晰的标题,用于概括缺陷的主要问题。摘要部分提供对缺陷的简要描述,通常包括缺陷的现象或错误行为。1252.缺陷描述:缺陷报告应该提供对缺陷的详细描述,包括如何重现缺陷、在何种环境下出现、测试使用的软件版本、影响的范围以及对软件功能的影响。描述应该具体明确,以便开发人员能够理解问题的本质并进行修复。3.复现步骤:缺陷报告应该提供重现缺陷所需的详细步骤。这些步骤应该清晰明了,使开发人员能够在其开发环境中重现缺陷并进行调试。4.环境信息:缺陷报告应该包括相关的环境信息,例如操作系统、浏览器、设备类型等。这些信息有助于开发人员在特定环境中定位和修复缺陷。5.严重程度和优先级:缺陷报告应该评估缺陷的严重程度和优先级。严重程度指的是缺陷对系统功能或性能的影响程度,而优先级表示修复缺陷的紧急程度。6.相关附件:如果有必要,缺陷报告可以包括相关的截图、日志文件或其他附件,以提供更多的上下文和支持信息。缺陷报告的目的是记录和报告软件中发现的问题,以便开发人员能够了解问题并进行修复。良好的缺陷报告能够提供清晰的信息和重现步骤,有助于加快缺陷修复的过程,并提高软件质量。B.11.B.11.4 4 测试结果编写测试结果编写测试结果文档是记录软件测试过程中执行的测试用例及其结果的文档。它提供了关于每个测试用例的执行情况、通过或失败的结果以及相关的详细信息。测试结果文档的目的是提供对测试活动的全面概览和汇总,使团队成员和利益相关者能够了解测试的覆盖范围、执行情况和结果。它还有助于追踪测试进展、确定需要进一步调查或修复的问题,并为软件质量提供评估和决策的依据。测试结果文档通常包括以下内容:1.测试用例标识:每个测试用例都有一个唯一的标识符或编号,以便在文档中进行跟踪和引用。2.测试用例描述:对于每个测试用例,测试结果文档应该提供清晰的描述,描述了测试的目的、输入、预期结果和任何特定的测试条件。3.测试结果:记录每个测试用例的执行结果,包括通过、失败或跳过。对于失败的测试用例,还应该提供详细的错误信息和相关的日志。1264.错误分类和严重程度:对于失败的测试用例,可以将错误进行分类,并指定其严重程度。常见的分类包括功能缺陷、性能问题、安全漏洞等。5.环境信息:记录测试用例执行时使用的测试环境的相关信息,包括操作系统、浏览器版本、设备类型等。这有助于后续的环境复现和问题定位。6.备注和附加信息:在测试结果文档中,可以提供任何其他相关的备注、问题描述、重要观察或附加信息,以增加文档的完整性和可读性。B.11.B.11.5 5 测试环境配置编写测试环境配置编写测试环境配置文档是记录和描述测试环境配置的文档。它提供了关于测试环境的详细信息,包括硬件、软件和网络配置,以及其他必要的设置和准备工作。测试环境配置文档的目的是确保测试团队使用相同的环境进行测试,并提供必要的背景信息和指导,以确保测试的准确性和可重复性。它还有助于解决测试环境相关的问题,并为测试团队和开发团队提供清晰的环境配置说明。测试环境配置文档通常包括以下内容:1.硬件配置:记录测试环境中使用的计算机、服务器、网络设备等硬件的详细配置信息。这包括处理器、内存、存储容量等硬件规格。2.软件配置:描述测试环境中所需的软件组件和版本。这包括操作系统、数据库、应用服务器、浏览器等软件的名称、版本号和安装路径。3.网络配置:记录测试环境中的网络拓扑和配置,包括 IP 地址、子网掩码、网关、DNS服务器等。这对于测试涉及网络通信的功能非常重要。4.测试工具和框架:列出在测试环境中使用的测试工具和框架,例如自动化测试工具、性能测试工具、代码覆盖工具等。提供它们的名称、版本和安装路径。5.数据配置:描述测试环境中所需的数据设置和准备工作。这包括数据库配置、测试数据集、数据文件路径等信息。6.环境变量和配置参数:记录测试环境中的环境变量、配置参数和设置。这包括任何需要在测试环境中设置的参数或选项。7.其他设置和要求:在文档中提供任何其他测试环境设置和要求的相关信息,例如访127问权限、安全设置、许可证配置等。B.11.B.11.6 6 测试验证和确认编写测试验证和确认编写测试验证和确认文档是用于确认和验证软件测试活动的文档。它提供了关于测试执行、结果和确认过程的信息,以确保测试的有效性和准确性。测试验证和确认文档的目的是提供对测试活动的确认和验证的记录。它确保测试过程和结果的正确性,并提供准确的信息和证据,以支持软件质量评估和决策。这些文档对于项目团队和利益相关者了解测试活动的情况、测试结果的可信度以及进一步的测试计划和改进提供重要的参考。测试验证和确认文档通常包括以下内容:1.测试执行结果:记录每个测试用例的执行结果,包括通过、失败或跳过。这些结果可以通过执行自动化测试脚本或手动测试来获得。2.验证测试覆盖:确认测试用例是否覆盖了软件需求或功能的各个方面。验证测试用例是否全面、恰当地涵盖了所需的测试范围。3.缺陷处理状态:跟踪已发现的缺陷并记录其处理状态。这包括缺陷的修复情况、验证缺陷修复的结果以及缺陷的关闭状态。4.验证测试环境:确认测试环境的正确配置和准备情况。验证测试环境是否符合测试要求,并确保测试环境的可用性和稳定性。5.确认测试数据:确认测试数据的准备和使用情况。验证测试数据是否符合需求,以及测试数据的正确性和完整性。6.验证测试工具和框架:确认所使用的测试工具和框架的有效性和正确配置。验证测试工具是否准确地执行测试,并提供准确的结果和报告。7.验证测试报告和文档:确认测试报告和文档的准确性和完整性。验证测试报告是否包含正确的测试结果、统计信息和相关的补充信息。

    浏览量13人已浏览 发布时间2024-06-13 131页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 奥美:2024人工智能时代的创意、商业和社会:闪络效应报告(41页).pdf

    闪络效应人工智能时代的创意、商业和社会OGILVY1封面/提示词 只提到夜晚。这是一张在夜晚燃起火焰的坡地图像。从高处拍摄下这一景象,再将照片放大,形成一幅抽象的图画。从某些角度来看,这幅画面好似在高峰时段被山火笼罩的洛杉矶。这幅画面不应让人感到恐惧,也不应让人心生愉悦。它应该让人察觉到,在一个不确定的环境中,有某种事物正在迅速的蔓延和升温这个事物无关善恶。由 DALLE 生成 执行摘要4 初次接触 引言9 AI是人工智能(Artificial Intelligence)还是末日 日来临(Apocalypse Incoming)?人工智能初识15 人工智能到底是什么?19 理解人工智能24 人工智能的采用26 人工智能的发展 创意复兴33 是创造力的终结?还是黄金时代的开启?34 利用人工智能生成创意45 利用人工智能扩大规模48 利用人工智能制定策略 加速产业的发展53 你准备好将你的业务托付给人工智能了吗?54 颠覆来临增长接踵而至60 让人工智能为你的企业服务 紧跟时代步伐69 人工智能的未来是什么希望、危机,还是两者 见 兼有?74 棘手的问题76 富有前景的解决方案78 人工智能时代的原住民 目录闪络效应:人工智能时代的创意、商业和社会 OGILVY23初次接触人工智能将从根本上改变广告和营销领域,改变垂直行业,乃至整个社会。在今天,无论是私营的、大学的还是公共的研究机构,都为人工智能的稳步发展做出贡献。但随着一些生成式人工智能工具登场,公众开始认识到生成式人工智能的潜力。这推动了该技术的快速应用,速度比以往任何技术的应用都要快,同时也明确了个人、企业和社会都必须正视生成式人工智能的影响。最新的人工智能工具是概率引擎,可生成类似人类处理的语言、图像和视频。它们与分析式人工智能以及机器学习的其他应用一样,使用训练有素的神经网络进行操作。由于它们只在特定领域表现出色,因此它们属于狭义人工智能(ANI),而不是通用人工智能(AGI)。通用人工智能的特点在于复制了人类的智能水平,这种技术或许即将登场。尽管人工智能存在局限性,但它们的宝贵价值已在许多领域得到证明,尤其是科学、编码、商业和媒体领域。鉴于人工智能可以生成艺术作品、文案和代码,广告业必须与这些引擎展开合作,而奥美目前则处于这一领域的前沿。为了更好地服务我们的客户,我们探索了一系列生成式和分析式人工智能。我们认识到,将其融入广告和营销领域并不意味着广告公司的消亡,或人类创造力的衰落。相反,人工智能将带来创意与战略的复兴。通过加快创意迭代、机械化执行和生产环节,人工智能将激发更好的创意和更深刻的洞察,从而解放创意,释放战略思维,使人类的思想更多地专注于大创意和针对客户问题的解决方案简而言之,就是想象力。/提示词这是一个代理机构的工作场景,但我们将它放在了意大利文艺复兴时期的画作风格和背景中。这与画家提香的风格尤其相似,呈现出强烈的色彩、对比和阴影。这个画面会让人产生一种矛盾感,就像提香的圣殇(Piet)一样。由 Midjourney 生成执行摘要 闪络效应:人工智能时代的创意、商业和社会 OGILVY454闪络效应:人工智能时代的创意、商业和社会 然而,由于围绕人工智能的法律和道德问题尚未解决,因此奥美将始终谨慎行事;我们将尊重艺术家的权利和客户信息的保密性。分析式人工智能已经嵌入到效果营销和营销技术堆栈中。随着它的发展以及与生成式人工智能的结合,代理公司和客户将迎来精度、速度和效率的提升,以支持个性化和规模化营销。要从人工智能中获得收益,就必须加强机构内部以及机构与客户之间的合作。幸运的是,人工智能也将在这种合作上带来助力。进入人工智能的新时代,虽然工作岗位可能发生变化甚至流失,但行业的发展和新职业的诞生最终将为员工带来更好的结果。人工智能带来的颠覆将冲击整个社会,很少有企业能够幸免。全球预计有 3 亿个全职岗位将受到自动化的挑战,三分之二的现有职业可能在某种程度上与人工智能融合或被人工智能取代。然而,随着生产率的提高,那些被人工智能取代的劳动者将获得新的就业机会,并成为经济发展的重要推动力。人工智能的迅猛发展伴随着重大的变革,因此企业需要建立一个将人工智能融入其业务的框架。人工智能可以在解释、互动、创造、运营和决策活动中发挥作用。有鉴于此,各个企业将通过比较潜在的商业价值和解决方案的可行性,并从营销、技术和组织动态三个方面管理变革,探索其中的哪些功能最符合企业的自身需求。要研究如何整合人工智能的应用,社会也必须贡献一份力量。如今,技术的发展速度超出人们的适应能力,尤其是在立法、政策和治理层面,人工智能社区被迫走向自我监管,并围绕监管问题展开讨论这种做法并不妥当。随着人工智能领域的创新和活力从学术界延伸到产业界,我们见证了几大巨头的诞生谷歌、微软和Meta。至少在目前看来,这项强大的技术和它的发展方式,以及我们与这种技术的互动方式,将由这些巨头掌控。但值得关注的一点是,由于商业公司是逐利的,他们将促使人工智能的安全发展走向复杂化。/提示词首先呈现一个毫无生机的场景,就像一颗荒芜的星球,但它毗邻着一片郁郁葱葱的区域,而且这片区域显然还在不断延伸。现在,将其向抽象表现主义的方向发展,但也不要太过刻意。由 Midjourney 生成 执行摘要 人工智能如果违背了人类的价值观、欲望和优先事项,那么可能对人类的生存构成威胁。然而,人工智能也能带来巨大的好处。它可以帮助人类缓解气候变化(或许我们甚至可以期望由它来解决这一问题),改革医疗方式,帮助数十亿人摆脱贫困,改善粮食安全,等等。只要有问题,人工智能都能帮助我们解决,哪怕是棘手的问题。在这个过程中,我们将培养出新一代的人类在人工智能的陪伴下成长的人类。这些人工智能时代的原住民最终将向我们展示,人类能够如何适应我们所释放的这股强大力量。闪络效应:人工智能时代的创意、商业和社会 OGILVY6767OGILVY闪络效应:人工智能时代的创意、商业和社会 简介/提示词呈现一个边缘空间一种状态和另一种状态之间的过渡但要避免门廊、缝隙或海边这样容易把握的图像。应从一种状态与另一种状态混合的角度来考虑。它应该让人感觉有些不安,但仍然不失美感。边缘应该模糊,但不要显得陌生。想象一条严重淤积的河流与一条清澈见底的河流的交汇处。从坐在皮划艇上的摄影者的视角沿着混合线来拍摄,不要留下任何可以从时间或空间上确定观众方位的外部标记。由 Midjourney 生成AI是人工智能(Artificial Intelligence)还是末日来临(Apocalypse Incoming)?“人工智能的发展与微处理器、个人计算机、互联网和手机的诞生一样重要。它将改变人们工作、学习、旅行、获得医疗保健和相互沟通的方式。整个行业将围绕它重新定位。掌握人工智能应用的企业将脱颖而出。”比尔盖茨01闪络效应:人工智能时代的创意、商业和社会 OGILVY898闪络效应:人工智能时代的创意、商业和社会 9OGILVY人工智能(AI)就像创造它们的人一样,是光明与黑暗的交织。人工智能是具有强大力量和潜力的,它们可以帮助人类,也可以提升人类能力。今天,ChatGPT 和 Stable Diffusion 这样的生成式人工智能已经席卷了教育、创意产业和媒体领域,它们的产出更像是一种魔法。关于这一主题的文章多达成千上万篇,在其中以明显方式标注一段由人工智能生成的文字就好像是一种新颖的表达方式和那些由人工智能特意生成 的广告图片一样,在目前看来很是新潮。随着人工智能度过了笨拙的早期应用阶段,接下来它将与我们的个人和职业生活无缝融合,以平实而深刻的方式帮助我们。从管理收件箱、简化日常生活,到改善物流、实现医疗和科学突破,人工智能将重塑我们的世界。这些新兴工具的采纳比历史上任何技术的推广都要迅速,部分原因在于它们的优势显而易见,且适用范围广泛。然而,它们所带来的危险也不容忽视。在大众的想象中,人工智能可能会摆脱其创造者的控制,利用我们的新陈代谢机制获取能量,或者将世界变成一个巨大的工厂。02 抛开这种虚幻的想象,一些客观现实的担忧不容忽视。例如,失业和转型;虚假信息和虚假宣传扩散;以及人工智能在超越我们的能力之后将掌控我们的世界,甚至视我们人类为“多余之物”。我们还必须努力应对随时可能爆发的智能风险,处理我们的道德责任和隐患。正如无节制复制的纳米机器可能会将世界变成灰色粘稠物,无节制的人工智能可能会产出大量毫无品质的内容,淹没真正的原创的东西这是对平庸的大幅回归,将吸干文化的生命。今天,ChatGPT 和 Stable Diffusion 这样的生成式人工智能已经席卷了教育、创意产业和媒体领域,它们的产出更像是一种魔法。用带有偏见的思维进行人工智能的输入培训将可能永久固化人类社会中长期存在的偏见。这些担忧并非危言耸听,因此人工智能和数字技术领域的顶尖专家于 2023 年 3 月发表了一封公开信,建议暂停巨型人工智能开发实验,并重新聚焦于“使当今强大的、先进的系统更加准确、安全、可解释、透明、稳健、一致、可信和可靠。”对可能影响人类生存的技术保持谨慎态度这种做法不无道理。然而,我们正在进行一场影响整个人类文明的人工智能实验。对这一领域的投资已经从学术界过渡到私营领域。03随着这些私营组织的参与,人工智能的持续发展将获得商业根基,同时摆脱机构研究的束缚。总而言之,我们都在谈论它、授权它、使用它,并围绕它重新规划我们的业务。正如WPP 首席执行官 Mark Read 在卫报上所说,人工智能“是WPP未来业务的根本”。这一点毋庸置疑。人工智能将彻底改变创意,成为与数字图像和视频处理一样重要的工具。同样改变的还有创意人才结构,它将提高原创和创新的溢价,淘汰更多的机械执行流程,同时衍生出新的创意子技能,如提示工程和模型培训。人工智能将改变战略和客户管理,也将使企业更容易在充分研究的基础上得出突破性战略,同时将缓解代理公司和客户之间的摩擦。人工智能将为生产、媒体和超个性化交付带来效率上的飞跃。它将颠覆整个搜索经济,让利用人工智能抢占数据先机的竞赛也许就是 AIEO(AI Engine Optimization)?成为一个全新的子行业。引言闪络效应:人工智能时代的创意、商业和社会 OGILVY1011广告公司和客户都必须深入思考人工智能及其使用所带来的道德问题,以及我们对消费者的责任。/提示词逐帧拍摄一个人正在爬楼梯的景象,就像胶片一样,每一帧与相邻帧略微重叠。在每一帧中,人物从明显的手工绘制转变到矢量艺术,再到逐格帖合的重复动画动作,最终呈现一种真实感风格。人物从一个标准的形体转变为一个具有强大力量的神话人物。由 Midjourney 生成引言不止这些。这只是其中一个行业。在其他领域,IBM 沃森(Watson)等先锋人工智能引擎已经开始重塑一切,从编码、备忘录写作到医疗保健和法律。广告公司和客户都必须深入思考人工智能及其使用所带来的道德问题,以及我们对消费者的责任。尽管领先的人工智能公司正在恳求政府推出监督机制,但政府无法跟上技术发展的步伐,因此在专业法规颁布之前,我们必须维护我们的荣誉。在不断发展的人工智能法律环境中,我们还必须预见到我们的义务。这并非易事,我们将难免犯错。而我们的竞争对手和客户也会犯错。如果我们在使用人工智能时坚持做到合乎道德、机敏明智、深思熟虑,我们将获益匪浅,并找到我们的竞争优势但前提是我们必须谨慎行事。艺术诞生于它所处的时代,它的一部分力量在于它所引发的艺术理念与文化之间的对话。有时,这种对话是永恒的,但随着世界演变的加速,艺术也在快速转动的新闻周期中占据一席之地。这就是伍兹艺术学院的作用所在。在奥美的协助下,该学院于 2022 年 9 月发起了一项实验,将艺术与当下的话题联系起来。这项活动名为“趋势的艺术”,旨在利用推特的热门话题,促使 DALLE 2 创造出最具当代特色的当代艺术作品。这是一场完全由社交媒体用户策划,由人工智能执行,通过户外广告展示的展览,揭示了人工智能将在艺术和文化中扮演的角色。趋势的艺术伍兹艺术学院(Woods Art Institute)闪络效应:人工智能时代的创意、商业和社会 OGILVY1213提示词绘制一幅德基里科(de Chirico)风格的,并呈现更大景深效果的家庭合影由 Midjourney 生成人工智能初识人工智能到底是什么?“你可以疯狂地思考所有的可能性,因为这些都是非常非常强大的技术人工智能是人类有史以来最深奥的技术我认为它将触及人类的本质。”桑达尔皮查伊(Sundar Pichai)04亲身探索人工智能是深入了解其变革性的最佳途径,但对于那些早已涉足人工智能领域工作的人来说,这种感觉已经是老生常谈了。他们指出,人工智能技术一直在发展,而大多数人才刚刚意识到这一点。毕竟,自然语言处理技术的壮举可以追溯到2011年,IBM的人工智能沃森在游戏节目 危险边缘(Jeopardy!)中击败了人类冠军。人工智能在集体意识中的爆发是由于可使用性的突破,而非该领域的革命性创举。计算机就是一个很好的比喻。在计算机突然走入千万家之前,很长一段时间里,它一直在后台默默地为人类提高效率;而计算机最终得到普及,要归功于图形用户界面。图形用户界面将一项需要调用大量专业知识的技术变成了一种人人都能使用的技术。今天,这样的革新又在生成式人工智能上重演,而它所推动的是机器学习的普及。闪络效应:人工智能时代的创意、商业和社会 OGILVY141515OGILVY14闪络效应:人工智能时代的创意、商业和社会 人工智能初识人工智能是人类发明的众多辅助工具中十分复杂的一种。无论利弊,它很可能走入我们生活的方方面面,成为我们的伙伴。“生成式人工智能可以想象出我们大脑现在无法形成的新事物。”尽管这些新工具给我们带来了便利,但要理解人工智能如何融入我们的世界,首先需要理解什么是人工智能。人工智能将庞大的数据集与计算机处理技术相结合,创造出能够解决复杂问题的无机系统。这些系统处理和解决问题的方式有时(但并不总是)与人类相似。在很多情况下,它们能力比拟甚至超越人类解决问题的能力。为了避免陷入关于智商、自我意识或认知的哲学争论,我们将它们称为智能体,因为它们的行为类似于智能实体:它们从输入(“环境”)中进行学习、推理、概括、感知、交流和进化有时会采取人类意想不到的方式。人工智能是人类发明的众多辅助工具中十分复杂的一种。无论利弊,它很可能走入我们生活的方方面面,成为我们的伙伴。正如奥美执行创意总监兼欧洲、中东和非洲地区消费者体验创意领导人 David Raichman 所说:“我们将看到的第一个社会单元将是人类和具有生成能力的人工智能伙伴作为社会单元,它甚至将先于家庭的诞生。”但是,如果我们将所有任务都交给人工智能,我们将成为文化的被动接受者,而不再是创造者。而人工智能将成为我们的“陪练对手”,正如 Raichman 的那句发人警醒的概括,“它将诱使我们以一种新的方式进行创造,创造出一种新的艺术形式和新的广告形式,”这在以前是无法想象的。Raichman 的奥美同事、西班牙首席创意官兼全球创意体验负责人 Roberto Fara 这样说道:“生成式人工智能可以想象出我们大脑现在无法形成的新事物。”Fara 和Raichman 都认为,这一切的核心在于创意,而至少在现在,创意仍然是人类的专利。“机器目前还不具备创造力,”Fara 说。“它们无法评判一件事情的好坏。它们不知道旅行会带来什么感觉,不知道品尝西红柿是什么感觉。”用专业术语来解释,那就是它们缺乏“感质”(qualia),即可以内省的主观的、有意识的体验。那么既然我们人类有这种体验,那就想象一下这些工具能够为我们的业务和我们客户的业务带来哪些潜力。奥美全球首席数据和技术官、Verticurl 创始人 Ab Gaur 说:“作为一家创意公司,我们面临的一项最大挑战就是如何扩展最有才能的员工和他们的工作领域。如果可以,我们希望帮助我们的客户为世界产生更大的影响,创造品牌体验和高光时刻。而这些,将由人工智能帮助我们实现。”混合街区绝对伏特加每个社区都有自己的氛围,就像一种由人、地点和文化组成的鸡尾酒,使其独一无二。在人工智能生成技术的帮助下,绝对伏特加找到了一种方法,将加拿大社区的独特元素转化为带有强烈社交属性的饮品鸡尾酒。要求当地人找出他们所在地区所独有的元素,然后人工智能将这些元素转化为提示词,再由人工智能平台利用这些提示词变出充满活力、令人惊叹的鸡尾酒艺术品。还没完!绝对伏特加与调酒师合作,将这些虚拟鸡尾酒转化为呈现各地区特色的真实饮品。这就是“风土”!闪络效应:人工智能时代的创意、商业和社会 OGILVY1617/提示词用不超过 20 个单词来描述大型语言模型的工作原理,然后以威廉德库宁(Willem de Kooning)的风格画出你所描述的图像。然后用不超过 20 个单词来描述潜在扩散模型的工作原理,再用同一个艺术家的风格画出你所描述的图像。最后将两幅图画组合起来。由 Chat GPT-4,Midjourney 生成大型语言模型是使用数据中的统计模式来生成类人文本响应的模型。潜在扩散模型通过扩散和去噪过程来迭代完善潜在表征,从而生成逼真的数据。科学家们利用机器学习来创造人工智能,尤其是在人工神经网络中进行的深度学习。从本质上讲,这些系统利用模仿人脑的算法分析大量数据,从而做出预测或决策,它们大致分为狭义人工智能(ANI)、通用人工智能(AGI)和超级人工智能(ASI)。狭义人工智能是一种弱人工智能,可以执行特定任务。通用人工智能是一种强人工智能,其能力与人类相似;而超级人工智能将超越人类。虽然成果显著,但目前人类所采用的人工智能还集中在狭义人工智能上。05人工智能分为几种类型。目前备受关注的生成式人工智能包括文本到图像模型和大型语言模型(LLM)。大型语言模型以文本、图像或二者兼有的形式“喂养”,输入了庞大人类知识数据集。Midjourney 或 Stable Diffusion 等文本到图像模型使用成对的图像和文本描述来预测给定的自然语言提示应产生的图像类型。理解人工智能人工智能初识闪络效应:人工智能时代的创意、商业和社会 OGILVY1819/提示词绘制一幅鹦鹉的图像,包含随机确定或通过概率而非意图确定的元素。以奥杜邦(Audubon)的风格完成。由 DALLE 生成人工智能在营销和广告领域的应用已有多年历史然后,它将一些数据噪声应用到这个概率引擎中,从而生成原始的高质量图像。大型语言模型的工作原理与此类似。它们在数十亿个单词上进行训练,可能出现的所有偏见、不兼容、劣性表现和不具代表性的情况均以编制在程序里,通过这样的设置来预测一个系列中下一个最有可能出现的单词这远远超出了人类的能力范畴。正如语言学家 Emily M.Bender 所说,它们是“随机鹦鹉”与意义无关的概率内容生成器。这些系统旨在模仿人类可能做出的反应,并说服我们相信它们。很多人说,大型语言模型是 A 级“胡说八道家”。也正因如此,它们在人类眼中才如此有知觉。我们将自己的心智理论应用到它们 身上,正如 Bender 对纽约时报 记者 Elizabeth Weil 所说06:“我们已经学会了制造可以无意识地生成文本的机器但我们还没有学会如何停止想象其背后的心智。”尽管如此,大型语言模型仍会表现出其设计者没有预料也无法预料的突发行为(也称为代理行为),这使得情况变得更加复杂。尽管最近生成式人工智能吸引了所有媒体的关注,但人工智能的类型远不止这些。从专业的专家系统到推荐引擎,从欺诈检测到物流负载平衡,神经网络和机器学习的应用越来越广泛。它们已经与机器人技术、计算机视觉、面部、语音和音频识别以及人们最熟悉的自然语言处理(NLP)融合在一起。其中一个专业人工智能系统 AlphaFold2 仅用了 18 个月就破解了生物学领域难解的问题之一07预测科学界已知的几乎所有蛋白质的结构。这一突破将为人类带来新的药物,改善治疗效果,并为基础科学做出巨大贡献。如今在资源分配、个性化营销、提高效率,甚至战略制定领域,人工智能已经为人类带来了助力。/提示词绘制一幅人工智能描绘自画像的图像,采用 Rockwell 的风格。作画者应为一个机器人。图像上应该是一个人类画家的样貌。由 Midjourney 生成闪络效应:人工智能时代的创意、商业和社会 OGILVY2021人工智能应用分析式人工智能分析式人工智能能够比人类更高效地处理和分析大量数据。这是人类迈向其他类型人工智能的第一步。自然语言处理自然语言处理是计算机理解自然语言(如英语)的能力,而不是对其进行编码的能力。生成式人工智能生成式人工智能是能够生成音频、图像和文本等各种数据的人工智能。语音识别人工智能语音识别人工智能是将口头语言转换为文本的过程,就 像 Siri 或 Alexa 所采用的程序。对话式人工智能它将自然语言处理与自然语言理解(NLU)及其他技术相结合,以模拟人类的认知和互动。机器人人工智能机器人人工智能包含两个不同领域,但这两个领域经常被捆绑在一起,即人工智能模拟人类智能和机器人模拟人类机械。计算机视觉人工智能计算机视觉是人工智能的一个领域,它训练计算机从图像和视频数据中捕捉和解读信息无程式码开发平台无程式码开发平台允许任何人在不编写代码的情况下创建应用程序。人工智能正在掀起这些平台的新浪潮。文本生成人工智能这是使用人工智能生成书面文案的软件类型。图像生成人工智能图像生成人工智能是使用人工智能和机器学习技术生成图像的程序。视频生成人工智能视频生成人工智能是使用人工智能和机器学习技术生成视频的程序。截至2023 年 3 月,这些技术尚未达到图像生成人工智能的先进水平。音频生成人工智能音频生成人工智能是使用人工智能和机器学习技术生成音频的程序。与视频生成人工智能一样,这项技术也处于起步阶段。人工智能在营销和广告领域的应用已有多年历史,例如通过分析人工智能引擎增强销售支持、客户关系管理、大规模个性化、客户行为预测等。正如奥美全球创新领导人Dickon Laws 所说,要想在这一领域有所突破,可以将人工智能分为三大类。第一大类是生成式人工智能,它将掀起创意表达的黄金时代,并加速个性化甚至原子化资产的生产。然后是分析式人工智能。它为营销自动化和销售赋能提供动力,使我们能够在个人层面上将沟通与上下文联系起来,并在丰富的触发因素和行为背景下开展工作。第三大类围绕 Laws 所指的人工智能新颖性。人工智能将由此遁形。当它为我们提供一种整体体验时,就会消失在背景中。用亚瑟查尔斯克拉克(Arthur Charles Clarke)的话说,“与魔法无异。”这些系统旨在模仿人类可能做出的反应,并说服我们相信它们。很多人说,大型语言模型是A 级“胡说八道家”资料来源:Ogilvy Social.Lab/提示词蛋白质可以非常美丽,而且它的折叠也非常复杂,因此请绘制一幅从折叠蛋白质内部看到的非同寻常的蛋白质图画,其风格应类似 于 NatGeo 自 然类别的获奖照片。由 Midjourney 生成人工智能初识闪络效应:人工智能时代的创意、商业和社会 OGILVY2223人工智能的采用过去几年间,人工智能引发了数以千计轮次的思考,但直到 OpenAI 推出基于聊天的生成式人工智能 ChatGPT 发布以后,人工智能的使用达到了爆发性的增长。ChatGPT现已嵌入微软的必应搜索引擎,不久将在更大范围内得到应用,它让公众开始关注生成式人工智能的潜力(以及危险)。这股热潮将人工智能的发展推向了公开化,也将其变成了一场竞赛。随之而来的是大规模的应用。ChatGPT 发布后短短两个月,就收获了多达 1 亿个用户,增长速度超过了历史上任何一项技术。44%的组织致力于将人工智能嵌入当前应用和流程。/提示词请描绘硅谷初创公司的现代工程师们在办公室里的典型场景,采用了太空竞赛早期的新闻和公关照片的风格。由 Midjourney 生成33%IT 流程自动化28%业务流程自动化26%业务分析或商业智慧22%人工智能监控和治理22%对话式人工智能或虚拟助理29%安全和威胁检测26%市场营销和销售23%欺诈检测22%传感器数据分析22%财务规划与分析今天的组织如何使用人工智能 2021年人工智能采用所带来的成本降低和收入增加(按职能划分)据保守预测,到从 2023 年到 2030 年,人工智能市场08将从不到 2000 亿美元增长到 1.8 万亿美元。虽然公众的想象力尚未跟上人工智能发展的步伐,但企业已经开始将其作为业务的重要组成部分。IBM2022 年全球人工智能采用指数09中指出,全球人工智能采用率继续稳步增长,目前已达到 35%。这一数字相对温和,但却掩盖了一个事实,“在一些行业和国家,人工智能几乎已经无处不在。”10人工智能正在渗透企业的方方面面,从撰写备忘录到流程自动化,等等。事实上,继网络安全和合规性之后,人工智能治理将成为董事会的又一新议题。Forrester 的数据显示,46%的数据、分析、业务和技术决策者正在寻求合作伙伴,以实施对业务至关重要的人工智能11。尽管如此,麦肯锡公司12在其企业年度调查中发现,人工智能的采用率自 2017 年以来翻了一番,但很大程度上已趋于平稳。然而,已经采用人工智能的公司正在“实现富有成效的降本增收。”13相比之下,埃森哲则更为大胆,声称人工智能将在未来二十年内将发达经济体的生产率提高 50。服务运营制造人力资源市场营销和销售服务运营风险供应链管理产品和/或服务开发所有活动的平均值受访者百分比减少 10%减少 10-19%减少 20%增加 10%增加 6-10%增加 5%资料来源:麦肯锡 2022 年调查|图表:2023 年人工智能指数报告资料来源:IBM2022 年全球人工智能采用指数人工智能初识闪络效应:人工智能时代的创意、商业和社会 OGILVY2425比尔盖茨对 ChatGPT 的开发者 Open AI 下达了一项任务。他本以为这项任务将耗费两三年的时间,但出乎意料的是,他们只花了几个月就完成了任务。这股人工智能的热潮席卷了整个行业,燃起了公众的想象力。要衡量大型语言模型的复杂性和潜力,一个不完美标准是参考模型中的参数数量。GPT-4 的模型有 170 万亿个参数,比上一代产品高出 100 倍,且功能也更加强大。它在 Advanced Placement 测试和律师资格考试中取得了亮眼的成绩,并一次又一次地在基准测试中取得优异成绩。大型语言模型已经开始进入人们日常使用的大多数应用程序。微软也开始将人工智能引入其 Office 套件产品。谷歌也不落下风,无数开发人员开始使用大型语言模型作为各种人工智能应用程序的支柱。与此同时,人工智能还在向另一个方向发展。OpenAI 已经推出了一项插件服务,使其大型语言模型立即转变为一个平台,承载 Expedia 的旅游推荐、OpenTable 的餐厅预订和 Klarna 的购物功能而这仅仅是一场旅程的开始。人工智能的发展/提示词绘制一幅表达复杂性的图像,如韦伯望远镜拍摄的详细的宇宙图像。由 Midjourney 生成人工智能初识闪络效应:人工智能时代的创意、商业和社会 OGILVY2627主要大型语言模型的规模资料来源:1.Julien Simon,“Large Language Models:A New Moores Law?”Hugging Face,20212.Open AI3.Google.亚马逊也参与了这场平台游戏,旨在为客户赋能,使他们能够在一系列不同的模型上构建和扩展生成式人工智能应用。最新一代的人工智能显示出更高的灵活性,这意味着它们可以执行多种任务,加速科学研究,并像任何优秀的超人一样自我完善。今天,像Stable Diffusion、Midjourney和 DALLE-2 这样的图像生成器已经足够精良,能够制作出具有专业水准的作品。ChatGPT-4、Jasper 和 Hemingway 等工具在文案方面也毫不逊色。Codex、CoPilot 和CodeWhisperer 等人工智能编码助手的受欢迎程度正随着它们的复杂程度不断提升。根据 Forrester Research 的预测,到 2023年,全球 10%的代码将由人工智能编写。15艺术。文案。代码。不可忽视的重要一点是:许多企业的主要职能,包括广告和营销等创意职能,现在都可以借助人工智能达到合格水平,这意味着要想脱颖而出,我们将面临前所未有的困难。随着人工智能引擎逐渐成为标准商品,16客户将要求广告公司生成更具突破性且独特的创意。如果仅仅依靠机器,将只能大规模生成平庸的作品。只有将人类独有的能力与一套强大的人工智能工具相结合,我们才能产生更丰富(更卓越)的创意。2021 年,意大利非营利组织 Emergency 的创始人 Gino Strada 逝世,但他毕生的追求仍未达成。Strada 希望看到一个没有战争的世界,他留给世界的不仅是一个致力于帮助战争受难者治愈创伤的组织,还有建立和平世界的号召。Emergency 与奥美意大利合作,由人工智能艺术家、演讲者和作曲家组成的团队制作影片,将 Strada 的愿景变为了现实。对于这部电影来说,媒介在某种程度上就是信息,因为要创造一个没有战争的世界,就必须首先想象出这个世界,而人工智能非常适合帮助人类将想象力延伸到人们认为不可能的领域。埃森哲更为大胆,声称人工智能将在未来二十年内将发达经济体的生产率提高 50%让和平成为现实Emergency人工智能初识闪络效应:人工智能时代的创意、商业和社会 OGILVY2829人工智能的图景ANTLER生成式人工智能投资组合公司生成式人工智能投资者生成式人工智能独角兽图像文本代码视频音频DAY ZEROPRE/SEEDA 轮投资B 轮成长投资生成式人工智能初创企业格局资料来源:Forsyth,Ollie,“The Antler Gen-AI Report,”2022 年 12 月 20 日图像文本代码代码聊天机器人视频机器学习平台搜索游戏数据201920202022闪络效应:人工智能时代的创意、商业和社会 OGILVY3031创意复兴是创造力的终结?还是黄金时代的开启?人工智能不是创造力的丧钟。而是一种复兴。一位名叫Boris Eldagsen的德国艺术家赢得了2023年索尼世界摄影奖的创意开放类别优胜奖。但他却公开表示,这幅作品与评选的要求不符,因此拒绝接受该奖项。这幅从 415,000 件参赛作品中脱颖而出的作品其实是由人工智能生成的。Eldagsen 在一份声明中表示:“它看起来有点不对劲,对吧?”是的,的确不对劲。这充分证明,如果连世界顶级摄影专家小组都无法区分照片和人工智能作品,那么人类的创造力已经走向终结。这是一个显而易见的答案而且是一个错误的答案。Eldagsen 作为一位世界级摄影师,他创作这张图片的目的是在摄影界引发一场讨论讨论人工智能的影响,以及什么是摄影,而什么不是摄影。他不仅很好地达成了自己的目的,还证明了创意世界并不掌控在人工智能手中,而是掌握在天才艺术家和作家的思想和专业知识中。现在,他们还获得了一个强大的新工具,可以扩展他们的创造力。人工智能不是创造力的丧钟。而是一种复兴。闪络效应:人工智能时代的创意、商业和社会 OGILVY3233想象你身在 15 世纪末的一间缮写室,或是20 世纪 80 年代的一家广告公司创意部门,当印刷机或是 Photoshop 这种功能强大的新工具问世时,你一定感觉到你的世界发生了变化。这两种工具都使人类的创造力进一步开枝散叶,拓展了人类的能力范围。现在,生成式人工智能也在走上同样的道路。生成式人工智能有可能取代人类成为创造力之王,但请记住Elizabeth Bender所说的。这些系统经过训练能够产生类似人类的反应,虽然它们的工作看起来很有创造力,但其实它们产生于脱离实际意义的扩散和概率。它看似富有创造性,实则并非如此,因为创造性源于意义。但孰是孰非,有谁在乎呢?只要能完成工作,何必在意机器是否具备实际的认知呢?人类的创造过程中同样包含机械的部分,比如想法的试运行、主题的变化、激发创造力的刺激因素。而在这些方面,意义一点也不重要。在创造过程的末期,最终交付的创意作品会在多种环境或超个性化的情况下进行调整,而此时,意义同样毫不重要。虽然这些工作现在由人来完成,但它们可以,也许应该由机器来完成。那么人的作用在哪里?这正是我们将要讨论的问题。不过首先,让我们看看哈佛商业评论认为人工智能可能为创意世界带来哪三种不同的未来。利用人工智能生成创意/提示词以中世纪插图手稿的风格绘制一幅与伊甸园相似的花园图像。更具体一点来说,将“创造力”一词呈现在以伊甸园为主题的插图手稿中。由 Midjourney 生成创意复兴人工智能成为人类的合作伙伴。“人工智能将支持人类完成当前的工作。”人工智能让我们的生产工作更高效、更轻松、成本更低。提示工程(一种从人工智能中获得你想要的结果的艺术)将成为唯一的关键技能。由人工智能生成的艺术作品、文案和代码将像尼罗河水一样流淌,滋养着创意部门,甚至所有广告和营销部门。人工智能超越人类成为主宰。在这种情况下,“不公平的算法竞争和不完善的治理策略”将挤压人类的创造力,导致大量工作竞相吸引者市场的注意力,并使创作成本大幅下降,以至于人类工作者因为高成本、低效率而被淘汰。2.1.闪络效应:人工智能时代的创意、商业和社会 OGILVY343535OGILVY人类成为精雕细琢的工作坊。由于算法生成的内容不够精良,市场转而选择人工制作的内容。这个场景并非不可能发生,而人类将保持机器无法比拟的创造活力。我们相信,未来可能远不止于此。我们正在深入研究各种形式的人工智能,而近期的前景似乎已经明朗:人工智能将极大地增强人类的创造力,但有机思维仍然是突破性创意、创造性飞跃和摆脱混乱的源泉。正如David Raichman 所说:“机器将赋予人类创造力,而不是取代人类的创造力。”如果你盯着一幅伟大的画作观摩足够长的时间,你就会发现各种意想不到的惊喜,因为艺术就是在观者的凝视下慢慢显现的。有时,策展人还会更进一步,通过扫描来发现画作中底层的场景、隐藏的草稿,甚至是艺术家覆盖在画作之上的整幅作品。在 La Laitire 项目中,奥美巴黎利用人工智能,不仅参考了品牌的标志性油画作品,还将目光投向了油画之外,揭示了一个生机勃勃且充满想象力的场景,让人感觉它真的出自维米尔(Vermeer)之手。这幅作品表明,当生成式人工智能的技术复杂性与人类的创造力相结合时,即使是最有天赋的画家也能获得提升的空间。3.它看似富有创造性,实则并非如此,因为创造性源于意义。倒牛奶的女工La Laitire人工智能时代的艺术代表着一个旧世界的消亡和一个新世界的诞生。上一次出现这样的转折是在第一次世界大战前后的几十年间新技术摧毁了现有秩序,且大多是以暴力方式展开的。这种变化激发了艺术界的新思路,其中许多都围绕人类与机器之间的建设性和破坏性关系,同时也引发了一系列运动,包括工艺美术、建构主义、达达主义、超现实主义、未来主义、现代主义,等等其实质都是机械化与人类创造力之间的对话。如今,这一问题又重新摆在了我们面前。人工智能时代的艺术生成式人工智能可以让任何人将其想法转化为文案、图像、视频、音频和代码,只需输入文字即可。它可在数小时内将一个剧本转化为一部模拟电影。现在,新一代工具已经能够根据视觉参考资料生成新的图像和视频,而不再局限于文字参考资料。而令人哭笑不得的是,这种新一代工具的出现距离上一代工具的诞生还不到一年。奥美正在利用生成式人工智能技术超越人类所能达到的极限。来自 WPP 的 Stephan Pretorius表示:“当你把人类的洞察力以及文化洞察力与机器创造内容的能力结合起来时,魔法就会显现。”我 们 遵 循 的 正 是 大 卫 奥 格 威(David Ogilvy)曾经所提出的理念:“在这里,有了所有简洁的教条主义。”/提示词以达芬奇手稿中的一幅画为蓝本,以计算机为媒介,描绘一个能够移动天体的人类。由 Midjourney 生成/提示词制作杜尚(D u c h a m p)的 照 片 喷 泉(Fountain),但将 签 名 换 成“AI,2023。”Ogilvy创意复兴闪络效应:人工智能时代的创意、商业和社会 OGILVY363721自创意革命之初,我们就一直依赖创意团队,但今天的创意团队已不再是艺术总监和文案人员的组合。在创意团队基础上,我们增加了人工智能,以及更多元素。这些团队将根据项目的需求不断扩大或收缩,并将无缝纳入传统创意领域之外的人员,如策略人员、编程员、客户负责人以及组织中任何能够做出贡献的人。为了让这些团队释放人工智能的力量,他们“需要探索、研究、摆弄和学习人工智能。他们要学习一种新的语言,”Robert Fara 如是说。那么这种新语言是什么?提示工程(Prompt Engineering)。创意的产出成果可以是一件视觉艺术作品、一段文字、一段代码,或是一项策略。Fara 说,用非常具体的词汇向机器描述一项任务,“犹如一场噩梦。”有些人可以将自己的创意过程解构为机器可以遵循的说明性文字。他们以及那些有能力学习这种技能的人,将成为创意人才队伍的重要组成部分,也就是创意提示工程师。这些人可以像演奏乐器一样运用人工智能生成器,用机器显现他们心中的美妙构想。他们需要学习和发挥的空间,至少对于第一代实践者来说,他们需要定义自己的职业。建立新的团队/提示词描绘一个俄罗斯建构主义风格的提示词气泡Ogilvy原则 1生成式人工智能的七项创作原则人工智能没有创造性。它只能按照我们提供的信息开展工作。如果我们需要一张苹果的图片,我们将得到一些可用的结果。而如果我们要求得到一张以Summilux 镜头拍摄、以颗粒胶片呈现、采用曼雷(Man Ray)的超现实主义风格的苹果照片,我们就会得到更有趣的结果。更进一步,如果将这个创意概念搭配上细致的描述,比如“这般美味的水果如此稀有,简直如虚幻一般”,再加上一个能够让品牌焕发最佳活力的策略,那么我们就会得到品牌所追求的理想结果。换句话说,人工智能和我们一样,需要遵从“大创意”。/提示词呈现一张以 Summilux镜头拍摄、以颗粒胶片呈现、采用曼雷(Man Ray)的超现实主义风格的苹果照片。由 Midjourney 生成尊重想法原则 2创意复兴闪络效应:人工智能时代的创意、商业和社会 OGILVY383939OGILVY43奥美广告全球首席执行官 Antonis Kohelis说:“正如互联网带来了信息民主化一样,生成式人工智能将带来灵感民主化。”不难想象这意味着什么。互联网为我们提供了海量的去中介化信息,其中很多信息是原始的、无关的或完全错误的。生成式人工智能将把文化淹没在平庸之中。它基于现有的信息进行训练,而不是尚未被想象出来的信息,因此其输出结果将不断向平均值倒退。这一点已经初显端倪。在博客文章和 PowerPoint 内 容 中,由 Midjourney 或Stable Diffusion 生成的图像似乎已经成为一种新颖的表达方式。为了应对这种情况,我们必须制定一项人才战略,在企业的创意、客户和策略等各个环节都推崇人工智能的鉴别力。在奥美,“永不自满”(Divine Discontent)的价值观不再仅仅约束我们自己的表现,它也约束着我们与人工智能共同创造的结果。由于这些引擎总能输出制作精良的成果,我们可能会难抵诱惑,一味地推崇这种没有灵魂的内容,而忘了去努力发掘有待激发的戏剧性构想。成为鉴赏家原则 3人工智能和我们一样,需要“大创意”的灵感激发。/提示词在图形空间中让色彩和创意的万花筒稳定过滤成最安全、最平淡的图像或色彩,这个图像的斜率大概就像图像从密集、混乱、创造性、美丽的状态过渡到平淡状态的进程。由 Midjourney 生成“人工智能是创意表达的助推器。”这是 David Raichman 的名言,他说得没错。让这些无机智能带领我们通向无限可能,我们可以发现以前根本没有时间或精力去探索的创意维度。这不是懒惰,而是我们作为生物所具有的一项功能。人的大脑就是一台模式识别机器,它能无情、高效地剪除与手头任务无关的东西。富有创造力的人善于从偶然中汲取灵感,但即使拥有这样高端的思维硬件,他们的大脑也会在无数可能性浮现于脑海之前就将其剪除掉。人工智能不受意义或判断的束缚,可以提出人类大脑从未发现过的迭代方案。迭代原则 4我们必须制定一项人才战略,在企业的创意、客户和策略等各个环节都推崇人工智能的鉴别力。/提示词描绘一幅茂密的森林图像,其中几乎看不到一只伪装得很好的美洲虎,如用于发现涂在古代大师画布上的图像的 X 射线照片一样。由 Midjourney 生成创意复兴闪络效应:人工智能时代的创意、商业和社会 OGILVY404165人工智能将给创意人士带来经济动荡。随着广告公司将越来越多的版本控制、个性化和生产等机械性工作纳入自动化流程,整个创意输出层可能会被抹去。工作岗位将发生变化,这是毋庸置疑的,一些人将会失业,但新的机会也将出现。我们将加强对这些机会的把握,并培养相关的艺术家。人工智能经由训练而实现的无偿内容输出,对于我们来说是一大禁区。这不仅会给我们和我们的品牌带来法律问题,还会窃取创作者的利益。我们将在自己的作品上训练人工智能,我所使用的引擎也应基于由合理报酬的作品(如来自收藏机构和个人艺术家的作品)组成的数据集。这种做法乍看起来难度较高,但实际上更加棘手,因为所有大型语言模型都是从互联网上抓取数据集并进行训练的,其中自然包括受版权保护的作品。即使是对生成式人工智能进行微调和训练,也可以对现有的不确定来源进行的分层。由于法律和伦理问题尚未解决,我们将采取最保守的方法。我们还将谨慎处理我们向人工智能生成器输入的内容。目前,许多引擎都会抓取并存储提示内容,我们决不会因为大意而泄露客户机密。保护艺术家和品牌原则 5/提示词描绘一张一群孩子在幼儿园做手工的场景。其中一个孩子显然是摄影师的孩子,他的身上闪耀着中世纪艺术中基督之子的微弱光环和光芒。由 Midjourney 生成工作岗位将发生变化,这是毋庸置疑的,一些人将会失业,但新的机会也将出现大部分生产工作将进入自动化。生产工作将从生产公司转移到代理公司,和越来越多的版本控制及个性化工作一样,它们将由机器完成。市场调研也将如此。其中一些工作根本不会涉及代理公司,而是由客户直接完成。这意味着效率的提升和成本的降低。Ogilvy Social.Lab 布鲁塞尔首席执行官 Rob Hill 回忆说,“为了面向非洲 18 个国家呈现合适的包装,我们拍摄了 19 天。”而有了人工智能,“你可以根据需要轻松地改变标识、包装。”市场调研在人工智能的支持下,将加快对创意刺激因素的响应和作品的验证。它还可帮助创意人员汇总大量市场反馈,加快微调速度,减少审查的轮次。这样,奥美可以自由地将精力集中在我们的创意和技能上;而在人工智能的助力下,我们可以在整个创意领域(从战略到资产)创造切合实际的价值。以加速的生产和个性化助推创意发展原则 6/提示词描绘一幅图像,向Warhol 的 Brillo 系列作品致敬,只使用一个虚构品牌,或者 Ogilvy。不只是改变颜色,还要定制不同的迭代标志、设计、颜色和语言。由 DALLE 生成闪络效应:人工智能时代的创意、商业和社会 OGILVY42437生成式人工智能能够助力我们扩大人才规模。这些新工具可以减少我们在重复性工作上消耗的时间,使更多时间得以投入到工艺利用人工智能扩大规模工作上,正如 Photoshop 等程序可以将设计师从机械的粘贴工作中解放出来,让他们有更多时间来探索创意。什么时候人工智能才能成为创意过程中的合法补充?当它被公开时。当它不会剥夺创作者的权利时。当它不会给我们或我们的客户带来法律风险时。当它不存在欺骗时。我们立志成为一座行业灯塔,指引如何利用人工智能开拓新的创意领域,发掘更深层次的人际联系,并以合乎道德的方式实现这些目标。宣传你的道德规范原则 7/提示词在食品或美容产品包装上绘制一个标识。不要显示“无动物测试”或“公平贸易”等字样,而 要 显 示“100%无 剥削人工智能制造”。Ogilvy/提示词描绘一个未来主义雕塑的图像,一个人正在进行讲演,风格应该像一个 波 丘 尼(Boccioni)式的雕塑。由 Midjourney 生成闪络效应:人工智能时代的创意、商业和社会 OGILVY4445“如果我能在不到一小时的时间内尝试 100张图片,那么我就可以花更多的时间来考虑客户提案,”Fara 说。他接着说道,“以奥美和我们客户的规模来看,这可是一项不小的资金和时间成本。”它可以让文案人员在更短的时间内发现更多途径,拓宽探索过程。事实上,生成式人工智能也可以扩大整个组织的产能,如同提高创意人员的工作效率一样,它也可以提高客户经理和策略师的工作效率。正如 Gaur 所说,“它让聪明的员工得以完成更多聪明的工作。”例如,如果将人工智能植入 Photoshop 和 Illustrator等常用工具中,可以显著加快创意产出,尤其是在制作阶段。这就好比伟大的资产遇上了伟大的数据,会迸发出不可思议的火花。人才实现这一目标的一个方法就是,在合适的背景下将相关内容大规模地传递给合适的人这种模式在营销界讨论已久,但迄今为止尚未完全实现。这是营销自动化和销售赋能的真正潜力所在,而人工智能引擎的组合将使这一切成为可能。个性化“一些相邻领域的技术正在跃入我们的领域,以一种全新的方式装备我们的行业,”Hill说,广告业拥有许多创意工具,“可以创建精美的图片、内容和模板等,”Gaur 说。这个链条的另一端是产出,包括电视广告、品牌体验、网络渠道、移动、社交等。中间是数据。人工智能对它们进行组合(再搭配强大的工作流程工具),可以帮助我们实时制作个性化资产。分析式人工智能可以在这一方面找到用武之地。Adobe 一款名为 Sensi 的人工智能应用可根据类似活动的表现向营销人员提供建议,以帮助他们确定细分市场、目标和参与对象。各自孤立的系统和团队正在成为历史。这让广告公司能够在更短的时间内向客户提出更好的建议。在销售方面,例如Salesforce 的 人 工 智 能 Einstein,它 可 以限定销售线索、管理销售机会,甚至为销售人员提供相似目标。无论是哪种辅助人工智能,“它都能降低广告公司的运营成本,”Gaur 指出,这将提升我们的效率,降低客户的成本。随着所有环节的加速运转,优化协作也是必不可少的,而人工智能也能在这一方面提供帮助。由人工智能支持的工作流程管理方案将数字资产管理、分析智能以及相关操作人员连接到一个统一的环境中,实现实时合作。协同合作传播团队、营销团队、社交团队和数字团队可以汇聚在一个平台上,从而简化工作,更便利地接收客户反馈,最终团队收获的是周转的加快,效率的提升,以及功效的优化。各自孤立的系统和团队正在成为历史。然而,媒体对这种自动化带来的人力成本充满担忧。Gaur 指出,“自动化淘汰了从事重复性工作的人员。”但在他看来,这并不意味着大量裁员。他认为,企业不仅需要投资技术,还需要培养面向未来的人才。“未来还会出现很多我们从未想到的工作机会,”他说。作为一个服务行业,其增长将足以抵消任何干扰。新冠疫情对小企业的打击尤为严重,对他们来说,恢复业务也更具挑战性。没有大品牌的预算,他们如何让客户回头?宝莱坞的大明星一定可以帮到他们。奥美印度公司借助一个人工智能引擎制作了以沙鲁克汗(Shah Rukh Kahn)为主角的吉百利(Cadbury)广告,在广告中为小企业进行了推广。该广告通过数字化映射再现了沙鲁克汗的脸庞和声音,发挥了大品牌广告的媒体影响力和制作价值,同时促进了当地商业与吉百利品牌的发展。超本地化定位使个性化达到了一定高度,但如果没有人工智能的支持,这一切都是不可能实现的。小企业主甚至可以自己注册一个广告位,剩下的事情都可以交给机器。这证明了在合适的条件下,人工智能创意也可以转化为甜蜜的享受。沙鲁克汗这远不止是一支吉百利广告创意复兴闪络效应:人工智能时代的创意、商业和社会 OGILVY4647利用人工智能制定策略“未来还会出现很多我们从未想到的工作机会。”“这之中有许多工具在分析方面都很有趣:它们能归纳文章、研究和提取关键主题,”对于规划人员来说,“人工智能带来了生产力的飞跃,”Hill 如是说。战略和规划是我们业务中研究和分析较多的部分,而这种学习能够增强灵感,帮助公司获得品牌建设工作所需的洞察力。生成式人工智能将推动战略和规划领域的快速变革,就像互联网在上世纪 90 年代掀起的大变革一样。它所带来的改进主要体现在两个方面:生产力和质量。Hill 说:“人工智能可以帮助我们的行业提高效率,更快地完成基础工作。”他指的是品类、消费者、受众和旅程的研究工作。无机智能可以将策划人员引向关键资源,并通过有用的归纳来解答案头研究问题,从而克服其中的困难。转录是许多策划人员和客户经理的一项重要的常规工作,而现在人工智能可以帮助他们省去数小时的机械劳动。人工智能仅仅通过自动化来收集和分析基本信息,就能让人类将更多时间转移到思考性工作上,同时还能提高生产率,降低成本。这对于备受利润压力困扰的企业来说至关重要。Hill 相信,只要我们拥抱人工智能,奥美就能提高基本盈利能力。我们将“更聪明地工作,用更少的人力完成同样的工作。”当然,颠覆也将接踵而至,但也许这正是广告业提高其未来生存能力的必经之路。Hill和 Gaur 都希望,广告业的增长将抵消这些变革对职位与就业的影响。随着奥美将人工智能整合到规划和战略中,广告质量将大幅提升。随着人工智能将策划人员从机械化工作中解放出来,他们将会投入更多的时间来产出更好的创意这是显而易见的事实。除此之外,人工智能还开辟了通往灵感的新道路。通过富有想象力的提示,它们可以提出新的受众、主题或表达方式。它们也可以解释复杂的主题,使策划人员能够将以往相互封闭的领域连接起来。人工智能可以帮助人们摆脱困境,将他们引向他们可能从未考虑过的新途径,并帮助他们整理思路。在生成式人工智能公开发布后不久,出现了一个非常明显的趋势:人类开始对与他们聊天的人工智能引擎产生真正的感情。对于这一点,Luiza杂志早已发觉。在可用技术的背景下,Luiza杂志与奥美圣保罗公司合作,将其虚拟助理 Lu 演化成一个完全实现的数字影响者 Magalu。Magalu 出现在电视直播、音乐视频、大型品牌制作的内容中,甚至登上了Vogue封面。来自 Magalu 的 Lu一路走来,她推动了销售,赢得了数百万粉丝。这表明,正如我们与小说和电影中的伟大角色建立联系一样,我们也可以迷恋虚拟人物,与它们建立联系。人类具有深刻的联系能力,超出我们的想象。创意复兴闪络效应:人工智能时代的创意、商业和社会 OGILVY4849/提示词首 先 描 绘 摩 登 时代 中 查 理 卓 别林 被 齿 轮 夹 住 的 形象,然后再用娜塔丽娅冈察洛娃(Natalia Goncharova)的风格来表现。由 Midjourney 生成无论我们在何处或以何种方式使用无机智能,奥美都遵守 WPP 关于使用人工智能的六项原则:“人工智能带来了生产力的飞跃,”Hill 如是说。我们认为充分了解人工智能的局限性和可能性是我们的责任。生成式人工智能是对人类创造力的支持和补充,而不是替代。我们了解我们所选择的生成式人工智能平台的学习数据的出处以及它们所使用的模型。我们向客户、员工和更广泛的社区开放地展示我们使用人工智能的方式。当员工对我们使用生成式人工智能的方式存有疑虑时,我们鼓励他们坦诚地表达。我们认识到这项技术正在不断发展,评估这些原则将是一项持续性任务。1.2.3.4.5.他们可以提出改进写作的建议,从而使我们与彼此、与客户的沟通更加清晰。只要使用得当,人工智能必将大放异彩:它可以帮助我们寻找恰当图像以表达我们的想法;设计精美的演示文稿;甚至为一首歌曲作曲、表演和制作视频,使原本枯燥乏味的话题变得生动活泼。需要时间来探索人工智能的不仅仅是创意人员,还有策略师、策划师和客户经理,他们也需要时间来掌握这项新技术。当人工智能重新定义了行业流程并带来了定制化的人工智能工作流程时,接下来就要展开正式培训。但在此之前,人们还需要实验的空间,并且为了满足好奇心,还需要留有冗余时间和成本。通过这种方式,我们将培养出专业的人工智能用户,并学习更高效、更低成本地讲述更好的故事。创意复兴闪络效应:人工智能时代的创意、商业和社会 OGILVY5051你准备好将你的业务托付给人工智能了吗?/提示词梵高有一幅著名的作品名为克利 希 的 工 厂(Factories at Clichy),表现了新旧世界之间的紧张关系。针对人工智能时代重新诠释这幅画。用数据中心代替工厂。用隔间代替田地。由 Midjourney 生成一家消费电子公司的员工在一个编码项目中向 ChatGPT 寻求帮助,而他们的这一行为泄露了公司的机密信息。他们的经历并不是市场中的个例。事实上,员工在 ChatGPT 提示中使用的数据有 11%的数 据 为 机 密 信 息。19 OpenAI 利 用 人 们 与ChatGPT 的交互来更好地训练模型,这意味着公司的数据不仅会暴露给 OpenAI,还可能被纳入模型本身。加速行业发展闪络效应:人工智能时代的创意、商业和社会 OGILVY525352闪络效应:人工智能时代的创意、商业和社会 53OGILVY颠覆来临增长接踵而至随着越来越多的员工使用生成式人工智能,类似事件也将层出不穷。Kizen 最近的一项调查发现,90%收入超过 10 万美元的员工表示他们在工作中使用了人工智能20。如果你还不清楚这其中的含义,那么这意味着人工智能正在向白领工作领域进军你将在下一节中了解更多相关信息。人工智能采用者掌握着大量的信息,告诉他们如何借助人工智能来完成工作任务,从提示模板和人工智能工作技巧,到令人窒息的人工智能工具列表和数据库。人工智能不再是 IT 领域的专业分支,需要大量的培训和投资,现在它只需通过平台和公共界面即可进入工作场所。为了推广人工智能,技术企业开始建立合作伙伴关系。口音不仅仅是一种说话方式。它也带有强调的意味是一个可以引起所有人注意的标志。它既是热情的象征,也是热情的表达,至少对西班牙传奇歌手和演员 Lola Flores来说它是如此。Lola Flores 在她的女儿们的帮助下,与先进的人工智能、奥美,以及西班牙知名啤酒公司 Cruzcampo 合作,重新演绎了她的口音,她国家的口音,以及所有能与其口音共鸣的一切事物及人群。随着人工智能为我们所有人带来更大的创造力和机会,Lola Flores的事迹引起了人们的共鸣:我们都应该为孕育自己的故土感到骄傲。重口音Cruzcampo2014-2022 年人工智能职位招聘,按地理区域划分(占所有招聘职位的百分比)1.45%,加拿大1.33%,西班牙1.23%,澳大利亚1.23%,瑞典1.16%,瑞士1.16%,瑞士1.01%,荷兰0.98%,德国0.89%,奥地利0.86%,比利时0.84%,法国2.05%,美国0.45%,新西兰各行业人工智能人才去向北美新增人工智能博士毕业生数量工业政府学术界资料来源:2022 年 CRA Taulbee 调查,2023 年人工智能指数报告加速行业的发展闪络效应:人工智能时代的创意、商业和社会 OGILVY5455制药和医疗产品人工智能每年可能为各行各业创造总计 3.5 万亿美元的价值,占所有分析技术潜在影响的 40%人工智能的影响(单位:10 亿美元)资料来源:人工智能前沿笔记,麦肯锡全球研究院,2018 年人工智能占分析技术总影响力的百分比公共和社会部门消费品包装医疗保健系统和服务基础材料银行业保险电信农业媒体和娱乐先进电子半导体化学品石油与天然气高科技产品汽车和装配运输和物流零售旅游先进电子半导体60%的工作者从事以前不存在的工作人工智能对各行业的影响0-10%无自动化10-49%人工智能作为补充50% 人工智能作为替代这些工作大多来自工业领域,而不是政府或学术界。其他经济领域可能就没那么幸运了。全球有3 亿个全职岗位将受到自动化的挑战,三分之二的现有职业可能在某种程度上与人工智能融合或被人工智能取代。25幸运的是,高盛预计,“许多被人工智能自动化取代的工作者最终将获得新的就业机会,并实现更高的总产出。这些新职业要么直接来自人工智能的采用,要么是由于非失业工作者提高生产率而产生了更高的综合需求或劳动力需求。”26如果你不认可这种“乐观”的想法,那么请看一看,目前有60%的工人所从事的工种在 1940 年根本不存在。加速行业的发展建筑和地面清洁与维护 安装、维护和维修 建筑和采掘 生产 运输和材料搬运 食品准备和服务 个人护理和服务 医疗保健支持 所有行业 艺术、设计、娱乐、体育和媒体 医疗保健从业人员和技术人员 农业、渔业和林业 保护服务 办公室和行政支持 生命、物理和社会科学 管理 建筑与工程 销售及相关业务 法务 社区和社会服务 商业和金融业务 教育和图书馆 计算机与数学资料来源:高盛全球投资研究部闪络效应:人工智能时代的创意、商业和社会 OGILVY5657换句话说,“在过去的 80 年间,85%以上的就业增长来自由技术驱动的新职位。”27颠覆性技术的积极影响也有大量先例。高盛指出,电气化和个人计算都带来了生产力的大幅提升。也许 Hill 和 Gaur 没有误判。虽然人工智能对 GDP 的影响将是巨大的,但其分布并不均匀。从人工智能的投资来看,私人投资的最大回报将来自医疗和保健;数据管理、处理和云计算;金融科技;网络安全和数据保护;以及零售。28但实际受益的行业不止这些。/提示词描绘一个图像,将两个神经元之间的突触间隙想象成一种无法把握的东西。它总是遥不可及。就像一个你知道但无法定义的词汇,或是不可描述的概念。由 Midjourney 生成加速行业的发展闪络效应:人工智能时代的创意、商业和社会 OGILVY5859计算机视觉和自然语言处理这两项基础技术的结合为人类提供了几乎无穷无尽的可能性。我们已经拥有的人工智能将发挥更大潜力。无论是这一承诺本身还是即将到来的生产率和 GDP 增长,这之中将涉及许多问题,遗憾的是,其中许多问题仍然没有答案。正如 Ogilvy Consulting 奥美咨询品牌创新与洞察领导人 Ashley Wood 所提到的,最重要的问题是:“人工智能是否真正为企业做好了准备?你的企业真的信任它吗?”那么,你会如何做出这些判断呢?你如何在你的企业和产品中使用它?你的员工如何使用它来更好地工作?你会采用什么政策?你在现在和未来几年的投资方向是什么?等等。然而,有一条路可以带领我们穿过迷雾:虽然人工智能在我们尚不了解的方面具有颠覆性,但它仍然是一个人类熟悉的框架。人工智能是 20 世纪末大规模数字化转型之后翻看的一个新篇章。因此,如果采用一些适用于变革的方法,或许有助于企业明智地采用人工智能。第一步是思考人工智能现在能做什么,以及未来会做什么,由此来审视你的业务需求。机器翻译的核心层已经发展成熟(甚至在不断进步)。交互虽然稍微先进一些,但也已经得到了长足的发展。人工智能创造,正如围绕生成式人工智能的狂热讨论一样,也令人感到震惊,尽管这些工具还有巨大的发展空间。在较为简单的领域,自主操作已初见端倪;但在复杂环境中,未来的趋势仍然是发展可靠的、完全由人工智能驱动的移动方案。同样,人工智能决策也没有达到成熟水平,不过它正在迅速改善。BloombergGPT是一款专为金融业打造的包含 500 亿参数的大型语言模型。它可谓是特定领域模型中的佼佼者,这些模型将帮助商业领袖面向未来更好地管理企业。不过,能够在这一领域独立出资的公司并不多见。培养大型语言模型的成本非常高昂,包括资金成本和碳成本。让人工智能为你的企业服务经过专门训练的大型语言模型将为商业决策带来巨大助力。辅助决策自主决策高效推理 字过程控制(如投资算法)操纵物体(实物)移动指导(汽车、吸尘器、机器人)完全移动(汽车、吸尘器、机器人)生成文本创建图像或视频创建音频 创造想法和提供信息自然语言处理(NLP)语言生成互动式实时推荐和指导计算机视觉:手势和表情理解自然语言处理(NLP)通用计算机视觉图像和面部识别关系学习 知识和规则完善智能数据分析 物体检测音频和语音识别4.决策3.操作2.创建1.互动0.解释资料来源:Ogilvy Consulting突破 高级 通用按类别划分的人工智能能力人工智能是 20 世纪末大规模数字化转型之后翻看的一个新篇章。如果从零开始构建一个大型语言模型可能会冲破企业的预算,同时也会影响企业的可持续发展。然而,这对企业来说却是一个难抵的诱惑,因为经过专门训练的大型语言模型将为商业决策带来巨大助力。此外,还有一种富有潜力的做法从大公司拥有的海量数据集中产生的洞察力,再进行出售。每个垂直行业都将拥有专属的大型语言模型,它们将超越通用模型。尽管如此,现有的生态系统仍为公司提供了大量机会,对于 Salmenkivi 来说,这些机会可分为三类分销、捕捉和创造。分销企业可以授权现有的人工智能技术,然后以中间商模式来发挥其潜力。他们将其纳入核心产品,或基于这种技术来创造服务或产品。1.加速行业的发展闪络效应:人工智能时代的创意、商业和社会 OGILVY6061捕捉在开放市场上提供人工智能服务可以降低成本、改善产品或服务,或提高客户满意度。在适当的保障措施下,员工可以直接使用现有平台。或者,企业可以购买定制的人工智能解决方案,或者在现有的 API 上建立人工智能代理,以实现自动化的研究、营销、客户服务或电子商务操作。人工智能甚至可以帮助企业增强他们的 API。创建这是最昂贵的方案,企业可以使用部分已创建的内容,也可以从零开始构建,或者融合这两种模式。这为企业带来了开发定制化大型语言模型、神经网络和算法的机会,可促进决策制定和洞察。其开发成果,也就是配套培训项目和底层硬件,可以作为人工智能特定产品的一部分进行销售。Amazon Web Services(AWS)正是通过这种方式从亚马逊内部IT系统中脱颖而出。/提示词绘制一幅立体主义的会议桌静物画(风格更偏向布拉克,而不是毕加索)。桌上堆满了零食和午餐的残渣、笔记、打印纸、咖啡杯。由 Midjourney 生成有了这种广阔的视野,企业可以更深入地研究哪些人工智能应用可以提供服务及最佳的可行方案。2.3.加速行业的发展闪络效应:人工智能时代的创意、商业和社会 OGILVY6263增强现有技术堆栈新技术1.需求/收入预测2.异常和错误检测3.决策支持4.POC 收入预测5.现金回流1.价格优化2.销售线索评分3.交叉销售和追加销售4.需求生成5.地区优化6.顾客终身价值分析7.销售线索发现8.销售内容个性化9.知识管理10.销售预测11.引导式对话12.机会评分13.客户智能14.关系情报1.顾客洞察2.相似受众3.潜在顾客预测4.价格制定5.规划6.交叉/追加销售7.营销自动化8.目标市场选择9.媒体规划10.欺诈/虚假检测11.品牌管理12.战略13.创意14.互动15.广告/竞价16.分析/细分17.营销活动18.内容创建19.内容策划20.影响者营销21.叙事1.价格优化2.关键词搜索3.产品推荐4.UI 优化5.顾客细分6.分类优化7.需求预测8.补货优化9.欺诈检测10.产品个性化11.聊天机器人12.虚拟顾客助理13.身份验证优化14.商务运营优化15.产品评论分析16.产品分类17.顾客查询路由18.可视化产品搜索19.可视化购买助手20.图片分类21.自然语言搜索财务 销售(B2B)营销 商业 资料来源:Gartner 2022(金融)Gartner 2022(销售(B2B))Peter Gentsch 教授 ISBN:978-3-319-89957-2:2019(营销)Gartner 2021(商务(数字)价值与可行性大部分即将实现回报的商业价值都并非出自人工智能的主流课题。科技市场营销组织实现人工智能转型与所有转型一样,人工智能并非一触即发,必须从多个维度进行考量利用人工智能能力的转型战略转变营销流程和决策新决策权(人工智能支持、增强、自动化)和责任新服务、新主张在人工智能使用的竞争中脱颖而出的人才费用新技能组合新思维新工作方式资料来源:Ogilvy ConsultingChristopher Brewer 是 Ogilvy Consulting奥美咨询亚洲总裁,他时常在想“这种颠覆是否会改变领导者的世界,或者是否会带来更长久的影响。”为了确定这一点,他建立了一个框架,并用营销、B2B 销售和财务这三个垂直领域的实例加以充实29。放眼望去,有几件事情正在悄然兴起。Brewer 总结道:“洞察顾客、寻找受众、寻找线索这些都是当今推动业务发展的因素。人工智能的直接影响将会出现在这些方面。”现在是你获得先发优势的契机,而不是面向人工智能调整整个企业的时候。在 CLV 分析、财务决策支持和战略等其他方面,也可能隐藏着巨大的业务潜力,但还有待进一步开发。Brewer 认为,秘诀就在于专注于金字塔尖,同时等待技术跟上步伐,以支持其他具有较高商业价值的任务。加速行业的发展营销自动化(营销)价格优化(商务)价格优化(销售)客户洞察(市场营销)需求/收入预测(财务)区域优化(销售)交叉销售和追加销售(销售和营销)产品推荐(商务)用户界面优化细分市场内容个性化内容个性化媒体规划产品个性化聊天机器人产品评论分析师低可视化购买助手分类优化中高非常高中高非常高商业价值为企业创造多少价值商业可行性大规模业务用例的准备程度和可行性闪络效应:人工智能时代的创意、商业和社会 OGILVY6465“洞察顾客、寻找受众、寻找线索这些都是当今推动业务发展的因素。人工智能的直接影响将会出现在这些方面。”要提取这种价值,需要在三个领域进行变革管理:营销、技术和组织动态。在你陷入恐慌之前(如果你没有感到一丝紧张,那就说明你还没有抓住要点),请记住:现在还处于这场变革的早期阶段,而它的实际进展也比表面看起来要慢。当然,人工智能比互联网发展得更快,但自互联网问世 30 年以来,电子商务仅占消费总额的 15%。十多年来,人们一直在面向人工智能的未来进行规划。例如,IBM Watson 于2010 年首次亮相。毫不夸张地说,人工智能要在商业领域达到成熟,还需要十年左右的时间。现在是你获得先发优势的契机,而不是面向人工智能调整整个企业的时候。尽管如此,可能不久之后,人工智能就能帮助你的企业与合作伙伴建立更紧密的合作关系。在两个组织之间建立合作关系是一项复杂的任务,无论是为了收购企业,还是仅仅建立客户-供应商关系,如广告和营销关系。系统合并、共享指标、个人指导、文化融合、设定期望,不胜枚举但这正是人工智能的用武之地。广告公司与客户之间最具挑战性的一个时期是合作的第一阶段。这期间会发生很多摩擦,但这些摩擦并非来自不良情绪。究其原因,正如 Dickon Laws所说:“一群互不相识的人走到了一起,要彼此磨合。”改善企业间关系并不是所有客户都会参与到推销中,他们需要看到公司做出了正确的决定。对于广告公司来说,人们需要“快速了解品牌是什么”,Laws 非常生动地道明了这一点。但是,如果有一个人工智能系统,能够根据推销的具体情况、客户的需求以及广告公司的信息缺口进行训练,就可以大大简化合作流程。Laws 认为,这样的愿景表明,人工智能也可以用于确定哪些广告公司与客户的需求、文化和人才相匹配(反之亦然),而且它的数据化水平高于任何未经强化训练的推销顾问。人工智能甚至可以预测每个组织,即客户和广告公司,最终结成联盟的概率,从而更好地分配资源。读到这里,相信读者们都已发现,生成式人工智能看起来非常人性化,但它缺乏情感和意义。那么,我们为什么要利用它来进行最真挚的交流呢?因为在这个时代,爱的表达已经被简化为铿锵有力的文字、三个字母的缩写,甚至是即时消息的回复,即使是不完美的人工智能生成的情书也比这些方式感性得多。这就是为什么 Lacta(在希腊,Lacta 巧克力被作为爱情的象征)和奥美希腊一起开发了一款智能情书生成器,将技术的还原力转化为情感的力量。更妙的是,该品牌利用 AR 技术让接收智能情书和生成情书一样有趣。收件人只需扫描 Lacta 包装哇!甜蜜的感觉瞬间爆棚。也许,人工智能还不能像人类那么聪明,但它能够让人类更加聪明。智能情书(AI Love You)Lacta加速行业的发展闪络效应:人工智能时代的创意、商业和社会 OGILVY6667人工智能与人类的协调人工智能的未来是什么希望、危险,还是两者兼有?/提示词首先,从上空描绘一个废墟景观的特写,可以看到化学物质和废弃物的漩涡在光线的照射下反射出美丽、闪烁的图案。现在,像野兽派画家那样将其渲染出来。由 Midjourney 生成人工智能的快速应用表明,人类作为一种文化已经确定,这项技术在目前和未来的益处大于其潜在的危害。颠覆即将来临,它将席卷几乎所有行业。随着人工智能与机器人技术的融合,这种颠覆将蔓延到那些在最初的动荡中幸免于难的垂直行业。尽管生产率预测表明,就业岗位的减少和流失将被后来的增长所吸收,但对那些被淘汰出局的人来说,也并不能带来任何安慰。不过,预测也可能是错误的。毕竟,人们曾预期互联网将带来生产率的大幅飙升,但事实上,它根本没有改变劳动生产率的曲线。闪络效应:人工智能时代的创意、商业和社会 OGILVY6869而这还不是唯一令人担忧的问题。我们正在削弱信息共享、信息可靠和信息真实所赖以存在的基础,这令人工智能的隐患雪上加霜。然而,建议它对经济的刺激,我们不太可能很快停止这项技术的发展。尽管 HuggingFace 和 Stability 等开源人工智能引擎已经进入市场,但正如纽约时报专栏作家 Ezra Klein 所说,“人工智能的发展将在于谷歌、微软和 Meta 30之间的竞争 30。”各国政府和政策制定者正在觉醒,他们意识到人工智能也可能是一股破坏稳定的力量。中国出于对国内安全和社会稳定的考虑,已颁布法规草案,将人工智能技术纳入国家审查制度之内。31相比 2016 年,通过法律体系得到解决的人工智能作品版权问题和训练数据使用权问题增长了 7 倍;32由此产生的决策将对我们使用人工智能的方式产生重大影响。33立法机构和议会也热情地参与其中。人工智能的发展速度及其惊人的模仿能力将轻松超越政府的响应步伐。从创意广告公司的角度来看,我们担心人工智能将很快掀起平庸的浪潮,但从社会的角度来看,高质量、有魅力、有说服力,甚至是深度伪造的错误信息所带来的风险更令人担忧。回想一下,人工智能经过设计呈现出人类的面貌,并让人类信以为真。允许那些肆意操纵人类的公司有效控制这项技术,是一种非常鲁莽的做法。各国政府和政策制定者正在觉醒,他们意识到人工智能也可能是一股破坏稳定的力量。127 个国家中,通过人工智能法案的国家数量尽管生产率预测表明,就业岗位的减少和流失将被后来的增长所吸收,但对那些被淘汰出局的人来说,也并不能带来任何安慰。在所有关于人工智能的讨论中,都忽略了计算机芯片设计和生产的特殊性,而这是一个受地缘政治影响的问题。大范围的芯片短缺表明,现代世界几乎在方方面面依赖着计算机芯片。芯片供应的中断阻碍了许多行业的发展,从汽车等主导行业到软饮料生产等隐蔽行业。人工智能不仅依赖于计算机芯片,还需要以图形处理单元或 GPU 为核心的专用芯片。这些芯片只有极少数公司能够设计和制造。事实上,绝大多数人工智能都是在一家芯片设计公司的 GPU 上运行的英伟达(Nvidia)45。芯片问题这些芯片大多由台积电(TSMC)46 在其台湾代工厂生产。(美国工厂正在建设中。)制造这些最先进的芯片非常困难,需要训练有素的劳动力来操作机器,而这些机器本身也只由一家公司制造。这种限制增加了中美关系以及高端计算机芯片出口管制的复杂性;当然,也使台湾自身的未来陷入了更加复杂的境地特别是因为建立高端芯片设计和制造能力非常困难,不仅耗时且成本高昂。随着人工智能应用的增长,企业也需要考虑受地缘政治影响的 GPU 供应风险。/提示词以 马 克 斯 恩 斯 特(Max Ernst)的新娘的长袍(Robing of the Bride)为蓝本,描绘两个正在争论、但徒劳无益的人。由 Midjourney 生成我们需要恐惧的不是千篇一律的海洋,而是谎言的海洋。人工智能不仅会败坏公众的品味,还将削弱人类本已脆弱的鉴别能力。加速行业的发展资料来源:2023 年人工智能指数报告,IEEE Spectrum闪络效应:人工智能时代的创意、商业和社会 OGILVY7071我们知道人工智能的构建方式,但不知道在其冰冷的“硅芯”中发生了什么。这就是引出了可解释程度及能力的问题。简而言之,Klein 所强调的,对于微软,meta 和谷歌在说服和操控人类的能力上越强,其财务表现就会越好。34因此,他们将对这一变量进行优化。现在想象一下,两极分化的意识形态格局和无处不在、不可抗拒的虚假信息。我们需要恐惧的不是千篇一律的海洋,而是谎言的海洋。人工智能不仅会败坏公众的品味,还将削弱人类本已脆弱的鉴别能力。在人工智能生成流行歌曲的领域,Drake 和 TheWeeknd 的伪造歌曲对知识产权带来的灾难。35更甚的是,如果人工智能生成了虚假的总统视频,它可能会对公民秩序构成威胁。人工智能的环境成本也不能忽视。运行大型语言模型的训练对电力、冷却系统和电子设备的消耗巨大。即使是最高效的模型BLOOM,其碳排放量也比从纽约飞往旧金山的航班高出 25 倍。36人工智能的日常使用对环境造成的损失甚至更大。据估计,ChatGPT 仅在 2023 年 1 月的能耗就相当于 17.5 万人口所消耗的能源。37在训练过程中,生成式人工智能深深汲取了人类在出版物和互联网上宣泄的所有偏见和仇恨。Klein 说:“它将复制这些偏见,并将它们藏在一个黑匣子里,让人难以察觉。”38即使这些偏见是隐蔽的,它们也会潜入生成式人工智能为我们生成的答案中。随着人工智能的普及,它的回复将塑造关于种族、性别、性取向和代表性的规范观念。当社会刚刚开始应对这些问题时,有害的偏见还在进一步得到巩固。企业针对人工智能的过滤和保护措施会有所帮助,但也不尽完美。一些狡猾的提示工程师已经开始诱使过滤后的人工智能编写色情内容且引发了混乱局面。未经过滤或过滤不严的人工智能可能更具破坏性。但我们还不了解它们。为什么不了解呢?答案就在Klein提到的“黑匣子”中。我们知道人工智能的构建方式,但不知道在其冰冷的“硅芯”中发生了什么。这就是引出了可解释性问题。研究人员坚持说,他们不知道自己的算法为什么会这样做。由此可以看出,人工智能发展出了设计者从未想象过的技能。在我们能够看到模型内部之前,我们永远无法充分预测它们的能力,相应地,也不能对它们的结果充满信心。如果人工智能要进行人力资源决策、网络安全改进、金融交易、资源分配等工作,我们需要看到它们得出结论的方式,这样我们才能判断其行为的公正性或正确性。人类需要承担这样的责任。那为什么人工智能不能承担?Klein 认为,建立可解释性是减轻人工智能的一些风险(如经济崩溃、安全崩溃、招聘偏见等)的有效方法。这可能符合公众利益,但不一定符合人工智能公司的利益。/提示词就“黑匣子”这个词 描 绘 一 幅 抽 象印 象 派 作 品。风格 更 倾 向 于 罗 斯科(Rothko),而 不 是 波 拉 克(Pollack)。由 Midjourney 生成加速行业的发展闪络效应:人工智能时代的创意、商业和社会 OGILVY7273/提示词根据詹姆斯乔伊斯(James Joyce)的 尤 利 西 斯中,斯 蒂 芬 德 达鲁斯(Stephen Deadalus)的这句话制作一张恐怖谷照片:“海卵和海藻,临近的潮水,锈迹斑斑的靴子。涕绿、蓝银、铁锈:彩色的标志。”由 Midjourney 生成我们知道,即使是当今杰出的专业人工智能(如狭义人工智能 ANI)也存在广义上的一致性问题人工智能的行为与人类的价值观、目标、意图、偏好和原则之间存在差距。这是一种相当可怕的局面。如果我们实现了通用人工智能,即人类级别的无机智能,会发生什么呢?不协调的通用人工智能会对人类的生存构成威胁对于这一点,人工智能企业的领导者和研究人员深有感触。这就是为什么他们于 2023 年 5 月 30日发布了一份联合声明。该声明称:“降低人工智能的灭绝风险,应当与流行病、核战争等其他大规模风险放在同一高度,一起纳入全球优先事项。”这也不仅仅是一种公开的姿态。“P-Doom”是硅谷派对上的一个新话题。P-Doom 是指个人认为人工智能会给人类带来灾难的概率。正如 Casey Newton 在最近一期的Hard Fork栏目中所说:“在人工智能研究界,有人认为这个概率达到了 10%或是更高。”人工智能是一个散发着魔力的技术问题,而且它有很大的潜在好处。但我们不禁要问:既然这项技术有 10%或更高几率征服或消灭人类,那么专家为什么研究它呢?或许我们暂时不必担心P-Doom。即使是 ChatGPT 的创造者、OpenAI 的首席执行官 Sam Altman 也承认,训练更大的大型语言模型所获得的收益较少,而专注于“快速提高能力”能获得较多的收益。39 或许,我们可能需要通过不同的模式来实现它,如全脑仿真、增强网络或脑机界面。要看到通用人工智能的出现,我们可能还需要数十年的等待。但也许只是几年、几个月。正如 Nick Bostrom 所说,专家们对此的预测各执一词40,但我们最好在它诞生之前尽早解决人工智能与人类的协调问题。通用人工智能的递归自我完善可能会导致智能的快速爆炸,从通用人工智能发展到超级人工智能的速度将远远超出我们的反应能力。可以想象,一个与人类不协调的超强智能将给人类带来多大的风险。这是一个巨大的难题。OpenAI 表示:“如果通用人工智能与人类不协调,可能会给人类带来巨大风险,解决这一协调问题可能非常困难,需要全人类共同努力。”41这是一个令人警醒的问题。OpenAI 建议让人工智能承担这项任务,以解决这一问题:“建立一个系统,并将其与人类协调,这样它能比人类更快更好地在协调研究中取得进展。”42我们可能在哪些方面出错?棘手的问题加速行业的发展闪络效应:人工智能时代的创意、商业和社会 OGILVY7475如果能够实现人工智能与人类的协调,再加上与之相匹配的政治调整举措,人工智能将在消除资源匮乏方面大有作为,这将是人类可以想象的最深刻的变革。来到最后一个章节,我们希望能够引起人们的警醒。人工智能将继续存在,通用人工智能也即将到来。如果我们在实验中对已经存在的威胁不加控制,这会是非常愚蠢的。即使是原子弹的发明者,在战争最激烈的时刻,也采取了一切可能的措施来保持世界的完整。这也是我们必须采取的行动:监督我们对人工智能的使用;加速安全研究,超过模型研究的进展;倡导健全的监管体系;为合理的人工智能发展提供经济激励;并减轻这项技术对人们的负面影响。这都是我们必须要做的,不仅仅是为了我们的安全,也是为了我们的直接利益。人工智能可能成为人类历史上无与伦比的福祉之源。它可以设计新药,监测海洋哺乳动物,绘制社会在可再生能源方面取得的进步。它正在帮助我们检测深度伪造,更好地进行跨语言交流,并优化能源使用。43美国国家航空航天局(NASA)和欧洲航天局(European Space Agency)的合作项目也得到了人工智能的支持,该项目旨在收集和分析有关地球的重要数据,帮助世界实现联合国可持续发展目标。人工智能解决方案对于核聚变商业化44、改善全球粮食安全以及降低公众的健康保健成本至关重要。这样的例子不胜枚举。可以肯定,人工智能将在这些问题的解决中发挥作用,包括恢复地球生态健康这样的重大问题。正如 Dickon Laws 将这些应用称为“新奇事物”。在这些领域人工智能逐渐退居幕后。富有前景的解决方案这是不是天方夜谭?也许吧。保持怀疑总是好的,最好的是保持警惕。毕竟,人工智能并不是非黑即白的。然而,正如 Klein 所说,“一些相当深刻的变革正在发生”,而这还仅仅是我们今天所拥有的技术。如果能够实现人工智能与人类的协调,再加上与之相匹配的政治调整举措,人工智能将在消除资源匮乏方面大有作为,这将是人类可以想象的最深刻的变革。众所周知,狗狗很容易满足。吃点鸡肉、揉揉肚皮、遛遛狗就能让它们开心。但是狗也喜欢玩具。只是并不是所有的玩具都能勾起他们的兴趣。有时,当你把精心挑选的毛茸玩具放在它们面前时,却发现自己并没有取悦到它们。宠物电商与奥美合作,找到了一种方法,确保最挑剔的狗狗也能找到最合适的玩具。秘诀就在于 Petz,这是一个强大的人工智能应用。它在零售商网站的后台运行,向你的爱犬展示各种选择,通过分析其目光和表情来判断你的它们的反应。人工智能甚至会根据狗狗的感官使用专门的颜色和声音频率,以确保任何秉性的狗狗都能得到它们梦寐以求的玩具而你则会得到一个让你的心都融化的感谢之吻。那么,谁才是优秀的人工智能?宠物电商 Petz/提示词以 勒 内 马 格 利 特(Ren Magritte)的风格绘制窃火者普罗米修斯。由 Midjourney 生成人工智能与人类的协调闪络效应:人工智能时代的创意、商业和社会 OGILVY7677 人工智能时代的原住民如果这还不够明显的话,那么下面的内容会让你看得更加清晰:在未来,我们所有人都需要与人工智能合作无论是日常生活还是职场生活。对于许多人来说,这将是一个艰难的适应过程,正如当年计算机进入职场和家庭时,那些未曾在计算机环境中成长的人所经历的那种困境。即使是数字时代的原住民也必须习惯一个现实,即他们与技术的关系将转变为一种更加双向的关系。这是一个根本性的变化技术将成为人类的合作伙伴,甚至是平等的合作伙伴。在某种程度上,人工智能将成为 David Reichman所说的创意团队中的一个成员,并将帮助我们创造自己的生活叙事。但是,有一个群体不会经历任何调整,那就是过去几年出生的一代人,以及那些尚未出生的人。他们将是人工智能时代的原住民,与之前的 Z 世代一样,他们将决定人工智能如何融入人类文化。他们将向我们展示人类如何适应这股由其自身释放出来的强大新力量。希望我们为他们创造的人工智能符合他们的兴趣、价值观和愿望。希望人工智能将成为他们的伙伴,而不是主人。希望人工智能能够像农业、工业化和电子技术曾经带来的范式转换技术一样,激发人类的另一层潜能。也希望,人工智能能与那些在这种奇迹和危险中长大的一代人形成独特的伙伴关系,因为这样才能证明我们这一代人,虽然未能等到这个新世界的诞生,但我们为子孙后代的更美好世界奠定了基础。人工智能时代已经来临,盖茨笔记:比尔盖茨的博客,2023 年 3 月 21 日。有关深入讨论,请参阅超级智能:路线图、危险性与应对策略,Nick Bostrom著,牛津大学2014年出版。Nestor Maslej,LoredanaFattorini,Erik Brynjolfsson,John Etchemendy,Katrina Ligett,Terah Lyons,James Manyika,Helen Ngo,Juan Carlos Niebles,Vanessa Parli,Yoav Shoham,Russell Wald,Jack Clark 和Raymond Perrault,2023年人工智能指数报告,人工智能指数指导委员会,人文智能中心,斯坦福大学,斯坦福,加州,2023年4月。Roose,Kevin 和 Newton,Casey,谷歌首席执行官桑达尔皮查伊谈 Bard、人工智能“Whiplash”与ChatGPT 的竞争,Hard Fork,纽约时报,2023 年 3 月 31 日。Kavlakogul,Eda,人工智能、机器学习、深度学习、神经网络:有何区别?IBM Cloud 博客,2020 年5 月 27 日。Weil,Elizabeth,你不是随机鹦鹉,纽约,2023年 3 月 1 日。Sparkes,Matthew,DeepMind 蛋白质折叠人工智能破解生物学最大难题,新科学家,2022 年 7 月 28 日。人工智能市场规模与趋势分析报告,Grand View Research,2023 年。0102030405060708IBM2022 年全球人工智能采用指数,IBM 和Morning Consult,2022年。同上。Curran,Rowan,预测2023:人工智能将成为企业不可或缺、值得信赖的同伴,Forrester,2022 年10 月 27 日。麦肯锡 2022 年调查,摘录于人工智能指数,斯坦福大学,2023 年。同上。Buchholz,Katharina,生产力在人工智能下受益最大的国家,世界经济论坛,2020 年 12 月 21 日。Curran,Rowan,预测2023:人工智能将成为企业不可或缺、值得信赖的同伴,Forrester,2022 年10 月 27 日。2023 年人工智能趋势报告,今日未来研究所,2023 年。Eldagsen、Boris,博客,2023 年 4月 13 日。De Cremer,David,Branzino,Nicola Morini,Falk,Ben,生成式人工智能如何颠覆创意工作,哈佛商业评论,2023 年 4月 13 日。Coles,Cameron,员工在 ChatGPT 中使用的数据有 11%为机密信息,Cyberhaven,2023 年 4 月19 日。Kizen 团队,新调查显示,低薪和缺乏灵活性是工作不满意度最高的领域,较2022 年大幅上升,Kizen,2023 年 4 月 3 日。今日未来研究所,同上。Hatzius,Jan,Briggs,Joseph,Kodnani,Devish 和Pierdomenico,Giovanni,人工智能对经济增长的潜在巨大影响,高盛全球经济展望,2023年3月26日。斯坦福大学,同上。同上。高盛,同上。同上。同上。斯坦福大学,同上。Christopher Brewer 框架的资料来源如下:Gentsch,Peter,面向营销与传播的人工智能,.Hetu,Robert,零售业的 23 个人工智能用例,Gartner博客,2021 年 3 月 11 日。客户服务的人工智能用例棱镜,Gartner,2021 年。Gartner 确定人工智能在企业财务领域的 5 大应用案例,新闻稿,2022 年10 月 13 日。Roose,Kevin,Newton,Casey,与 Ezra Klein 一起进行人工智能氛围检测,Kevin 尝试电话正向激励,Hard Fork,2023 年 4 月 7日。Che,Chang,中国称聊天机器人必须服从党的路线,纽约时报,2023 年 4 月 24 日。斯坦福大学,同上。Appel,Gil,Neelbaur,Juliana,Schweidel,David A.,生成式人工智能存在知识产权问题,哈佛商业评论,2023年4月7日。人工智能氛围检测,同上。Veltman,Chloe,如果你发现你最喜欢的新歌是由人工智能创作和演唱的,NPR Morning Edition,2023 年 4 月 21 日。斯坦福大学,同上。Groes,Kasper,Ludvigsen,Albin,ChatGPT 的电力消耗,Medium,2023 年3 月 1 日。人工智能氛围检测,同上。Miller,Ron,Sam Altman:未来大型语言模型的规模将不再那么重要,TechCrunch,2023 年 4 月14 日。Bostrom,Nick,超级智能,牛津大学出版社,2014 年。Leise,Jan,Schulman,John,Wu,Jeffrey,我们的协调研究方法,OpenAI 博客,2022 年 8 月 24 日。同上。斯坦福大学,同上。同上。McBride,Stephen,英伟达芯片推动几乎所有重大人工智能突破,福布斯,2020 年 12 月 15 日。Castellano,Robert,台积电制造芯片,英伟达坐享荣耀,Seeking Alpha,2023 年 2 月 24 日。09211022112312241325142615271628172918301931203233343537383940454641434244人工智能与人类的协调注释闪络效应:人工智能时代的创意、商业和社会 OGILVY7879作者:Jeremy Katz以下人士为本报告贡献了资源:Christopher Brewer奥美咨询亚洲总裁Roberto Fara奥美西班牙首席创意官兼全球创意体验领导人Ab Gaur奥美全球首席数据与技术官Rob Hill奥美 Social.Lab 布鲁塞尔首席执行官Dickon Laws奥美全球创新领导人David Raichman奥美欧洲、中东及非洲执行创意总监兼消费者体验创意领导人Nikolaos Tsakonas奥美希腊社交业务领导人Ashley Wood奥美咨询品牌创新与洞察全球领导人设计:Luis Vilches贡献者闪络效应:人工智能时代的创意、商业和社会 OGILVY8081

    浏览量28人已浏览 发布时间2024-06-13 41页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 人工智能行业深度报告:“元年”之后再看大模型应用商业化进展-240611(21页).pdf

    计算机计算机|证券研究报告证券研究报告 行业深度行业深度 2024 年年 6 月月 11 日日 强于大市强于大市 公司名称公司名称 股票代码股票代码 股价股价 中科创达 300496.SZ 53.6.

    浏览量0人已浏览 发布时间2024-06-13 21页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 中移智库:弈衡人工智能大模型评测平台白皮书(2024年)(21页).pdf

    弈衡弈衡人工智能大模型人工智能大模型评测平台白皮书评测平台白皮书(2022024 4 年)年)发布单位:中移智库发布单位:中移智库编制单位:中国移动通信研究院编制单位:中国移动通信研究院.1.32.1 应用需求.32.2 评测内容.4.63.1 业界典型大模型评测平台.63.2 各平台的优劣势分析.8.104.1 设计原则和思路.104.2 平台整体架构.114.3 平台特色及创新点.124.4 平台主要功能.134.5 平台主要优势.164.6 成功案例与应用实践.17.191人工智能技术的迅猛发展带来了AI大模型的广泛应用,这些模型在自然语言处理、图像识别、数据分析等领域展现出巨大潜力。然而,随着模型规模和复杂性的增加,如何发现模型的长短板并开展针对性优化,如何在实际应用场景中选取合适的模型,已成为大模型评测领域亟待解决的新挑战。目前的人工评测方法存在效率低下、评测组织有效性不足、结果管理无序和评测体系更新缓慢等问题,这些问题制约了AI技术的健康发展和创新应用。为了解决这些挑战,我们确立了构建一个高效、系统化且可信赖的AI大模型评测平台的愿景。该平台将通过自动化和智能化技术,提升评测效率,确保流程的组织性和管理的有序性,并支持评测体系的持续拓展和演进。具体愿景如下:1.提高评测执行成效为了提升AI大模型的评测成效,评测平台必须适应模型规模和复杂性的增加,能够细致分析和处理大量的测试案例,并考虑到多样化的数据集和应用场景。同时,由于不同应用领域对AI大模型的评测标准和方法有着不同的需求,评测平台应提供多样化的评测方式以满足这些需求。此外,通过提升自动化程度,可以降低人工测试成本,实现常态化的评测。自动化评测平台通过预设的流程和算法能够快速评估模型性能,这不仅加快了研发和迭代过程,而且也便于集成最新的评测技术,进而缩短整个评测周期。2.加强评测全面客观性为了加强AI大模型评测组织的效率和有效性,首先需要实现评测流程的标准化,这有助于减少人为差异和错误,同时模块化设计确保了评测流程的定制性和灵活性。其次,确保评测结果的一致性和可重复性至关重要,这可以通过消除人为不一致性来实现,从而保证每次评测都能得到相同的结果,并且评测过程可以无限次地重复。此外,集成多样化的评测体系是提高评测全面性的关键,这不仅包括准确率,还应涵盖伦理考量等多个维度。最后,提供动态和实时的反馈机制,可以帮助开发者迅速了解模型性能,从而实现快速迭代和优化。通过这些措施,可以显著提升评测组织的效率和有效性,为AI大模型的持续改进和创新提供坚实的基础。3.增强结果管理规范性为使AI大模型评测平台的结果管理更加规范,首先,平台应能够自动记录和存储评测结果,这不仅能减少错误率,而且确保了数据的完整性和可追溯性。其次,它配备强大的查询2功能,使得用户可以轻松地查询和比较不同评测周期的结果,从而提高结果分析的效率,并快速识别出模型性能的变化趋势。第三,平台支持对模型的表现进行长期跟踪与评估,使用户能够全面评估模型的稳定性和泛化能力,同时监测性能退化,及时发现并解决潜在问题。最后,集成工具使用户能够更直观地理解复杂数据,并通过图表等形式把握关键信息,从而辅助决策过程。综合这些特性,AI大模型评测平台为结果管理提供了一个有序、高效且易于操作的平台,极大地促进了模型的深入分析和持续改进。4.保障评测体系演进性AI大模型评测平台致力于保障评测体系的持续演进,首先,平台能够快速响应市场变化,及时吸收最新的研究成果和技术突破,以此来更新评测框架,确保评测体系的时效性和前沿性。其次,它支持持续的研发创新,可通过全面而深入的评估,精准地识别出潜在的问题和改进空间,为模型的迭代和优化提供指导,从而激发创新思路。第三,平台促进技术标准迭代,通过建立统一的评测标准和流程,减少不同技术之间的差异,推动整个行业的标准化和规范化,降低技术应用的门槛。通过这些措施,AI大模型评测平台不仅保障了评测体系的持续改进,也为AI技术的健康发展和广泛应用奠定了坚实的基础。通过实现这些愿景,我们旨在构建一个能够适应AI大模型技术快速发展的评测平台,为AI技术的持续进步和应用提供坚实的支撑。我们号召整个产业链参与进来,共同构建一个开放、协作的环境,加速AI技术的创新和应用。一是快速响应市场变化,及时整合最新的研究成果和技术突破,确保我们的评测框架始终处于行业前沿。二是支持持续的研发创新,全面评估AI模型的性能,发现问题,为模型的迭代和优化提供科学指导,激发更多的创新思路。三是致力于促进技术标准的迭代,建立统一的评测标准和流程,减少技术差异,推动整个行业的标准化和规范化,降低技术应用的门槛。通过产业链的共同努力,我们不仅能够保障评测体系的持续演进,还能推动AI技术更广泛、更高效的应用,为社会的发展贡献更大的价值。3AI大模型以其庞大的参数数量、卓越的学习能力和广泛的应用潜力,正在引领AI技术的新一轮革命。AI大模型的参数规模是其最显著的特点之一。庞大的参数量使得模型能够捕捉和学习数据中的细微特征和复杂关系,从而在各种任务上实现优异的性能,不仅能够理解自然语言、识别图像和视频内容等,还能在复杂的策略游戏中与人类玩家竞争,甚至超越人类的表现。但在某些领域中,模型的准确性和安全性还有待提升。大模型的“黑箱”特性使得理解和解释其行为变得困难,这对于需要高度透明度和可解释性的应用场景构成挑战。2.1 应用需求随着大模型技术在实际应用中的广泛应用,如何全面、准确地评估这些模型的性能、安全性、合规性以及其对社会的影响,成为一个迫切需要解决的问题。在大模型研发和应用过程中,面临着一系列挑战,在技术验证、质量控制、风险管理以及合规性等多个层面提出评测需求。一是在技术验证方面,人工智能大模型评测验证及应用是企业引入大模型以支持其业务流程的关键环节。首先需要验证模型的性能是否能够满足特定应用场景的技术要求,这包括但不限于模型的预测准确性、处理速度、以及在特定数据集上的表现。技术验证是确保大模型能够在实际应用中发挥预期作用的基础步骤,对于企业来说,这一步是不可或缺的,它使企业可以更有信心地将大模型集成到其业务流程中,从而实现技术升级和业务增长。二是在质量控制方面,大模型的输出质量直接关系到其应用的效果和企业的声誉。因此,通过定期的评测来确保大模型的输出质量和决策的准确性变得尤为重要。质量控制旨在减少或消除可能由模型引起的错误信息传播,保障用户能够获得可靠和准确的服务。这对于提升用户信任和满意度至关重要,同时也有助于企业及时发现并修正模型的潜在问题。三是在风险管理方面,大模型可能带来的安全风险是业界关注的焦点。这包括但不限于数据偏见、性别或种族歧视、隐私泄露等问题。风险管理需求推动对大模型进行深入评测的需要,以便及时发现并解决这些问题,确保模型的公正性和安全性。随着AI技术的广泛应用,这些风险管理措施变得尤为重要,它们有助于构建一个更加安全、公正的AI生态系统。四是在合法合规方面,随着各国对AI技术的法律法规日益完善,确保大模型的应用符合法律法规和伦理标准成为企业必须面对的挑战。合规性需求促使企业必须对大模型进行评测,以验证其是否遵守相关的法律法规,从而避免潜在的法律风险。这不仅是法律的要求,也是4企业社会责任的体现,有助于提升企业的社会形象和公众信任。2.2 评测内容在人工智能领域,大模型的评测是一个多维度、多目标的复杂过程,它涉及到模型的功能、性能、安全性、可解释性、可靠性、经济性等多个方面。评测内容的广泛性要求我们不仅要关注模型在特定任务上的表现,还要考虑其在不同环境和条件下的稳定性和泛化能力。随着AI技术的快速发展,大模型在各个领域的应用日益广泛,对大模型的评测需求也日益增长。在功能性方面,大模型评测集中在三个核心领域:任务特定性能、多任务能力以及交互能力。对于任务特定性能,大模型在执行如语言翻译或图像识别等特定任务时,必须展现出色的表现。这涉及到模型的准确度、处理速度以及对不同数据集的适应性。多任务能力则强调大模型在广泛任务类型上的泛化能力,评测时需综合考量模型在多样化任务上的表现,包括其对未知任务的适应性和表现。此外,交互能力评测关注于大模型与用户交互的流畅性和有效性,包括模型对用户输入的理解、回应的自然性,以及对话上下文的关联性,这些都是提升用户体验的关键因素。综合这些功能性需求的评测,可以全面地评估大模型在实际应用中的性能和潜力。在性能方面,大模型的评测集中在准确度、效率和可扩展性等关键维度。准确度是评测的核心,它直接决定模型输出的可靠性,尤其在医疗和法律等高风险领域,准确度的水平直接影响着决策的质量。效率则涉及模型处理输入并提供输出的速度,以及在整个计算过程中所消耗的计算资源和能源。一个高效率的模型能够在维持性能标准的同时减少用户的等待时间,并有效降低运行成本。可扩展性是评测模型是否能够适应未来业务需求的变化,例如处理更大数据集或更复杂的任务。这要求模型具备通过增加资源投入或参数调整来提升性能的能力,从而保障其长期的实用价值和适应性。综合这些性能指标的评测,可以确保大模型在满足当前需求的同时,也具备未来技术发展和业务扩展的潜力。在安全性方面,大模型的评测覆盖数据隐私、系统安全和伦理合规这三个基本而关键的领域。数据隐私强调在处理敏感信息时,模型必须实施有效的保护措施以防止数据泄露,评测过程中需要严格检查模型是否具备健全的隐私保护机制。系统安全则关注模型对于恶意攻击的防御能力,包括对抗性攻击和模型滥用等风险,确保模型在面对这些潜在威胁时的安全性和稳定性。伦理合规要求模型在设计和应用过程中遵循社会伦理标准和法律法规,防止产生歧视或不公平的结果,确保技术应用的社会影响正面且负责任。综合这些安全性指标的评测,旨在为大模型提供一个安全、可靠且稳定的运行环境,保障其在实际部署和应用中的安全性和可信赖性。5在可靠性方面,大模型的评测着重于鲁棒性和一致性两个关键指标。鲁棒性指的是模型对于输入噪声和异常情况的抵抗能力,这确保即使在面对不完美或有敌意的输入数据时,模型也能够维持其性能,稳定地输出结果。而一致性则评价模型在不同时间点、处理不同输入时是否能提供连贯且一致的响应,这对于建立用户对模型的信任至关重要。如果模型的输出表现不稳定,或者在类似情境下产生大相径庭的结果,可能会导致用户对模型的不信任,影响其长期的可用性和用户满意度。因此,一个高度可靠和稳定的大模型,需要在各种条件下都能提供可预期且一致的性能表现。6针对上述大模型评测需求,诸多科研机构和头部公司已经开展了广泛的相关研究与实践。我们调研了业界典型大模型评测平台,充分掌握平台能力以及它们在实际应用中的表现,并分析了这些平台的优势和不足。3.1 业界典型大模型评测平台OpenCompassOpenCompass是由上海AI实验室精心打造的一个开源、全面且高效的大模型评测平台。该平台的评测框架完全开源,使用户能够自由访问和修改评测代码,以满足不同的评测需求,同时保证评测过程的透明性和可复现性,便于学术界和工业界的研究人员进行结果的验证和比较。OpenCompass支持包括零样本、小样本和思维链在内的多样化评测方式,构建一个多维度的评估体系,全面反映模型在知识、语言、理解、推理等方面的能力。为应对大规模参数量模型的评测挑战,OpenCompass提供分布式评测方案,支持单机或集群上的并行处理,显著提高评测效率。通过巧妙的任务分割与合并策略,实现计算负载的均衡,充分利用所有可用的计算资源,使得在资源充足时,千亿参数量级模型的全面评测可以在极短时间内完成。此外,OpenCompass不仅支持开源模型的评测,还为开发者提供简洁的模型接口,方便接入API模型,已经支持OpenAI、Claude、PaLM等众多API模型的评测。OpenCompass的设计灵活性允许用户通过预留接口轻松添加新的评测数据集和模型,自定义数据划分策略,甚至接入新的集群管理后端,极大地拓展了评测模型的类型和范围。作为一个公开的评测平台,OpenCompass向技术社区全面开放,支持的数据集及各数据集的多版本提示词都可以供用户一键下载,确保了评测结果的可复现性。在多模态能力评测方面,OpenCompass覆盖从感知到认知能力的多个细粒度评估维度,如目标检测、文字识别、动作识别、图像理解、关系推理等,为多模态大模型提供全面的能力评估。同时,OpenCompass提供公开的评测榜单,降低评测门槛,鼓励技术社区提交评测申请,评测结果将实时更新在榜单上,为用户提供直观的模型性能比较。7AgentBenchAgentBench是一个创新的多维演进基准测试平台,专为评估大语言模型(LLMs)在复杂的多轮次开放式生成环境中的推理和决策能力而设计。该平台通过模拟真实世界的场景和任务,提供一个全面的性能评估框架,旨在推动大语言模型在理解、推理、学习和适应性方面的进步。AgentBench的评估体系是多维的,它不仅关注模型的语言生成能力,还包括对模型在复杂情境下的推理、决策、学习能力和适应性等方面的综合评估。这种多维的评估方法可以更准确地反映模型在现实世界任务中的性能,为研究者和开发者提供一个更为全面的模型能力视图。AgentBench模拟多轮次的开放式对话环境,考察在连续的交互中保持上下文的连贯性和逻辑的一致性。这种环境对模型的记忆、注意力和长期策略规划能力提出更高的要求,是对模型综合能力的考验。推理和决策是AgentBench评估的核心。平台设计一系列任务,旨在挑战模型的推理能力,包括归纳推理、演绎推理、因果推理等。同时,AgentBench还评估模型在面对复杂决策时的表现,包括风险评估、成本效益分析和多目标优化等。AgentBench提供高度的定制化和扩展性,允许研究者和开发者根据自己的需求设计和添加新的评估任务。这种灵活性使得AgentBench可以适应不同的研究领域和应用需求,促进评测方法的创新和发展。AgentBench鼓励社区合作和共享。平台的设计允许不同的研究团队和开发者共享他们的评估任务和模型,从而形成一个开放和协作的研究环境。这种合作精神有助于推动大语言模型评测技术的发展,并加速模型性能的提升。OpenEvalOpenEval是一个专注于中文大模型评估的多维度、全面、开放的评测平台。该平台由大模型基准评测专家委员会研制开发,旨在探索前沿模型评测方法,建立大模型评测标准与协议,并建设高质量的大模型评测基准数据。通过综合评估大模型的知识、能力、对齐及安全级别,OpenEval发布详细的评测报告,以助推中文大模型能力与安全协同发展。OpenEval平台从四大维度出发进行评估,包括知识能力、价值对齐、安全可控和专业领域。每个维度下又细分为多个子维度,并收录相应的数据集。这种细分不仅有助于全面评估模型性能,也进行针对性的优化和改进。OpenEval平台提供自动化的评测流程,支持本地评测和平台评测两种方式。用户可以在本地完成模型推理后,生成待评测文件并在平台上提交,以获得评测结果。此外,平台还支持API评测方式,用户提交模型API信息后,结果将以邮件形式发送。OpenEval平台收录多种数据集,如GaoKao-bench、TGEA和CSNLI等,这些数据集覆盖高考题目、文本错误检测、自然语言推理等多个领域,为大模型的评估提供丰富的基准。8百度大模型内容安全评测平台百度大模型评测平台是一个专为大语言模型(LLMs)设计的综合性评测系统,提供内容安全等多维度的评测服务。该平台的建立和运作严格遵守国家法律法规,如 网络安全法和互联网信息服务管理办法,确保大模型输出的内容合法合规,避免不当内容的产生,保护用户隐私安全,防止模型被滥用。内容安全评测在AI领域尤为重要,因为大语言模型强大的生成能力可能带来包括色情、暴力、歧视或虚假信息在内的风险,对社会和个人造成不良影响。百度大模型评测平台通过标准化的评测流程,确保模型的安全性和可靠性。平台的评测服务基于科学严谨的流程设计,结合自动化工具和专业团队,对模型内容进行深度审查。这一流程涉及数据预处理、规则匹配、深度分析、人工审核以及结果反馈等环节,确保评测的全面性和准确性。此外,评测不仅限于内容安全,还涵盖性能、功能及应用场景适应性等,构成一个全面的模型评测体系,使开发者能够全方位了解模型表现。3.2 各平台的优劣势分析业界的大模型评测平台在多个方面展现出显著的优势,这些优势共同推动大语言模型评测技术的发展,并为用户提供高效、可靠的服务。首先,这些平台在评测的全面性方面做得非常出色。多数平台在评估模型时,不仅重视其语言生成能力,还综合考虑了模型在复杂情境中的推理、决策、学习以及适应等多方面的能力。例如,百度大模型评测平台依据国家相关法规和标准,包括网络安全法和互联网信息服务管理办法,进行安全评测,确保大模型的输出内容合法合规,避免生成违法违规信息,保护用户隐私,防止模型被用于不良目的。这种全面的评估方式为研究人员和开发者提供一个更为全面的模型能力视图,有助于他们深入理解模型的性能。其次,多样化的评测方式是这些平台的另一大特色。平台如AgentBench支持零样本评测、小样本评测和思维链评测等,能够更全面地评估模型性能。零样本评测衡量模型在未经特定任务训练时,面对新任务的理解与执行能力;小样本评测则检验模型在仅提供少量样本后,对新任务的快速学习与适应水平;而思维链评测通过模仿人类思维过程,对模型处理复杂问题的推理及解决能力进行评估。这种多样化的评测方式使得平台能够适应不同类型的模型和应用场景,为用户提供更加精准的评测服务。另外,分布式高效评测是这些平台的显著特征。一些平台如OpenCompass提供分布式评测方案,支持在单机或集群上并行处理计算任务,显著提高评测效率。通过分割大任务、合并小任务等策略,实现计算负载的均衡,充分利用所有可用的计算资源。在资源充足的情况下,OpenCompass能够在短时间内完成千亿参数量级模型的全面评测。这种分布式的评9测方案不仅大幅提升评测效率,也使得大规模的评测任务变得可行。开源可复现性是这些平台的另一个重要优势。平台如OpenCompass开源评测框架,允许用户自由地访问和修改评测代码,以适应不同的评测需求。开源的特性也确保评测过程的透明性和可复现性,允许学术界和工业界的研究人员对评测结果进行验证和比较。这种开源的精神极大地促进评测技术的发展,并且增加平台的可信度。平台在发展过程中也面临着一系列挑战和局限性,这些问题的存在可能会影响到评测的准确性和泛化性。首先,缺乏统一的评测标准是业界平台面临的一个重要问题。不同的评测平台可能会采用各自的评测标准和方法,这导致不同平台之间的评测结果难以进行横向比较。由于缺少一个共通的参考框架,研究者和开发者可能难以准确判断模型在不同平台下的相对性能。这种标准的不一致性也可能阻碍跨平台、跨模型的公平比较和性能分析,限制学术交流和知识共享。其次,评测平台自身的安全性和公正性问题也不容忽视。评测平台需要保证其评测过程的安全性,避免恶意攻击和不正当竞争行为。因此,评测平台需要建立严格的安全机制和审计流程,确保评测的公正性和透明性,从而为用户提供可信的评测服务。数据集局限性是另一个挑战。一些评测平台可能受限于特定的数据集,这使得它们难以全面评估模型在多样化场景下的表现。不同的应用场景和语言环境需要不同的数据集支持,如果平台的数据集覆盖范围有限,就可能无法充分测试模型在特定场景下的性能。因此,评测平台需要不断扩大和丰富其数据集,以适应不同模型和应用的评测需求。技术门槛是评测平台面临的另一个问题。对于非专业人士来说,使用某些评测平台可能存在一定的技术门槛。复杂的操作界面、繁琐的评测流程和专业的术语可能会阻碍非专业用户的有效使用。为了提高平台的普及率和可用性,评测平台需要提供更加友好的用户界面和简化的操作指南,降低用户的使用难度。最后,分布式评测虽然能够提高评测效率,但其对计算资源的高需求也可能限制部分用户的使用。分布式评测需要大量的计算资源支持,这对于一些资源受限的用户来说可能是一个不小的负担。此外,分布式评测的设置和维护也需要专业的技术支持,这可能会增加用户的操作成本。10为了全面解决人工智能大模型评测在技术验证、质量控制、风险管理和合规性等多个层面上的需求,同时克服当前评测过程中存在的多种局限性问题,我们提出构建一个高效智能的大模型评测平台。该平台能够确保评测流程的标准化、安全性、公正性,并提升数据集的多样性和代表性。同时,通过降低技术门槛和优化分布式评测系统的维护,我们致力于提供一个更加高效、经济、且易于接入的评测平台。4.1 设计原则和思路在“弈衡”大模型评测平台构建过程中,我们采取一系列设计原则和实现思路,确保平台的高效性、用户友好性和未来的可持续发展。设计原则主要包括以下三点。一是强化“智能化自动化”的原则。通过自动化流程,我们显著降低了对人工干预的需求。同时,采用人工智能和机器学习技术不仅提升了评测的效率和精确度,也使得平台能够根据历史数据不断学习和优化评测策略,以实现评测过程的持续改进和自我完善。二是保障“灵活可扩展性”的原则。“模块化设计让我们能将复杂的评测流程分解为独立的功能模块,不仅提升了平台的灵活性,也便于未来的扩展和升级。每个模块都能独立运作,同时与其他模块有效协同,保证了平台的长期适用性和前瞻性。三是坚持“交互体验设计”的原则。这意味着每项设计和功能决策都以用户体验为核心。为了确保用户能够迅速地掌握平台的使用并高效执行评测任务,我们提供了直观易操作的用户界面和流程。此外,通过详尽的帮助文档和在线客服支持,我们进一步降低了用户的学习门槛。基于以上原则,提出以下设计思路。一是“全流程自动化”,利用了人工智能与机器学习技术,实现了从数据整理到评测报告生成的自动化,同时通过智能分析提升了评测的准确性。二是“模块化架构”,增强了平台的灵活性和可扩展性,使平台功能可分解为独立却能协同工作的模块。三是专注于“交互体验设计”,通过深入研究用户习惯与需求,打造出简洁而直观的用户界面和交互流程。通过这些原则和思路的指导,我们可以有效地构建一个高效智能的大模型评测平台,旨在满足在技术验证、质量控制、风险管理、合规性等多个层面的评测需求。同时该平台也致力于克服当前评测过程中面临的诸多局限性,提供标准化、公正、安全且易于操作的评测服11务,从而推动大模型技术的持续创新和应用拓展。4.2 平台整体架构“弈衡”大模型评测平台整体架构采用分层与模块化的设计理念,主要由底层能力层、评测管理层、评测执行层、结果分析层和行业应用层五大部分构成,确保了评测过程的高效性、准确性和安全性。平台整体架构如图所示:底层能力层是整个评测平台的基石,确保了平台的架构稳定和高效运行。平台本身具备强大的计算能力和稳定的架构,能够支撑起大规模数据处理和复杂模型的运算需求。该层融合了容器化编排技术,深度学习和大模型技术,以及自动执行、数据处理和爬虫技术,这些能力共同构建了一个高效、智能的评测环境,为大模型的性能评估提供了坚实的后盾。评测管理层由数据管理层和模型管理层共同组成。数据管理层专注于数据的存储、清洗和构建,通过高可靠性数据库系统支持大规模数据集的存储与快速检索,自动去除噪声和异常值,并提供数据版本控制与访问权限管理,确保数据安全与完整性。模型管理层则支持模型接入、版本控制和安全性维护,支持多种大模型接入,记录模型变更历史,便于性能比较和模型重用,提升评测效率。评测执行层作为自动化评测流程的关键,负责任务分发、进度监控和结果收集。它智能调度评测任务,提供实时进度监控,确保任务顺利执行,并具备异常检测与处理能力,保障任务连续性和稳定性。此外,执行层详细记录评测过程日志,便于问题诊断和策略优化。12评测分析层则深入分析数据,提供全面评估。它进行数据预处理,利用AI技术自动判定和分析评测结果,评估模型性能指标,并提供数据可视化工具帮助用户理解模型性能。同时,该层严格遵守数据安全和隐私保护标准,确保评测活动的安全性和合规性。通过这些层次的协同工作,平台为大模型的评测提供了一个坚实、高效和智能的环境。行业应用层作为大模型评测的应用领域,覆盖了工业、农业、医疗、交通、市政等多个关键行业领域。该层利用评测平台提供的全面评估能力,针对各行业特点定制评测方案,充分挖掘模型优劣势,确保大模型在实际应用中发挥出最大价值。同时,平台不断收集各行业数据,持续优化评测算法,以满足日益复杂的行业需求。4.3 平台特色及创新点评测平台主要特色1.对标国际一流的大模型评测体系本平台构建了多维度的“2-4-6”评测体系,该体系将评估场景划分为基础任务和应用任务,明确评测指标、评测数据等四项主要评测要素,并制定涵盖准确性、可靠性、安全性等六大维度 50 余个评测指标。在数据集方面,基于中国移动人工智能领域评测数据积累,充分融合斯坦福、微软等国内外权威评测数据基准,构建全面客观的通用大模型专属评测数据集,涵盖科学常识、逻辑推理、阅读理解、程序编写等两百多类典型场景,确保充分评估大模型综合能力。对标业界主流大模型评测体系,在分档一致性和排名一致性评估均处于业界一流水平。2.基于大模型技术的智能化结果评判基于大模型技术的智能化结果评判是“弈衡”平台的核心优势之一。平台的智能化评判不仅减少了人工干预,还提高了评测的一致性和可复现性。平台利用“大模型评测大模型”的理念,通过对主流开源大模型的评判能力进行针对性调优,集成自动化评测结果判别能力,提升评测结果判别准确性。“弈衡”平台还采用了多模型融合技术,结合了多个模型的评估结果来提供综合的评判。这种方法利用了不同模型之间的互补性,提高了评测结果的鲁棒性和可信度。3.基于自组织的端到端自动化流程“弈衡”大模型评测平台通过自组织技术实现了评测流程的全面自动化,从而显著提升了评测工作的效率。在整个评测流程中,平台能够自动部署评测模型,根据评测任务匹配针对性的评测数据集,并独立执行整个评测任务,无需人工干预。任务完成后,系统不仅可以13自动统计和汇总结果,还能进行深入的性能分析,利用智能化评判算法评估模型在各项评测指标上的表现,并生成详细的分析报告。此外,平台还能自动检测和处理评测过程中的异常情况,确保流程的连续性和稳定性。实时进度跟踪功能和详尽的日志记录使得用户能够随时了解评测状态,同时便于问题诊断和策略优化。整体而言,“弈衡”平台的自动化全流程设计极大地简化了用户的操作复杂度,让用户可以更专注于模型优化和决策分析,而不必关注评测的具体执行细节。平台创新点1.用大模型测试大模型“弈衡”平台的一个显著创新之处在于其采用了“大模型测试大模型”的评测方法,即利用经过针对性训练的大模型来测试和评估其他大模型的性能。通过针对性调优主流开源大模型的评判能力,提升平台评测结果的准确性,同时集成了自动化评测结果判别能力,减少了人为因素的干扰,大幅提升评测结果判定智能化比例。相较于传统的以小模型或固定规则为基础的测试方法,随着经验的积累,评测大模型能够不断优化评测策略,适应多样化的大模型和不断演进的评测需求,为大模型的迭代优化提供了更加深入的洞察。2.自动化智能评测引擎“弈衡”平台的另一个创新点是其实现了一套全自动化智能评测引擎。从用户上传模型和数据开始,到最终评测报告的生成,整个过程无需人工干预,平台可以独立完成。这一流程包括但不限于任务的自动下发、实时进度监控、结果的自动收集与分析,以及评测报告的智能生成。全自动化的评测流程不仅极大地提升了评测的效率,减少了人为错误的可能性,而且也使得评测结果更加客观和一致。4.4 平台主要功能“弈衡”大模型评测平台的功能逻辑图如下所示。“弈衡”平台的功能覆盖了从数据和模型管理到评测流程的自动化,再到结果的分析与展示,形成了一个完整的评测系统。每个类别内部的功能相互支持,共同构成了一个高效、自动化的AI大模型评测解决方案。14平台首页下图为“弈衡”大模型评测平台访问入口。数据管理数据管理提供标准化的数据存储、访问和预处理功能,包括数据清洗、去重、去噪和异常值处理等功能,以帮助用户更好地构建和选择数据集,确保数据集的质量,从而更好地评测大模型。模型管理模型管理提供了全面的模型接入支持,能够实现自动化模型配置。它不仅涵盖了对官网发布模型的接入,同时也兼容部署的开源模型,确保了平台的开放性和灵活性。通过一站式的启停管理,用户可以轻松地对模型进行启动、暂停或终止操作,从而优化资源利用率并提高工作效率。15评测数据构建评测数据构建允许用户根据特定评测任务自主设计数据集和选择评测指标。这一功能通过提供数据预处理和多样化的指标模板,适应多变的评测需求,确保了评测的针对性和准确性,支持从基础到复杂的多场景应用,增强了评测的灵活性和实用性。评测任务下发评测任务下发是AI大模型评测平台的高效自动化特性之一。用户无需深入了解不同模型的接口细节,只需在平台上选定评测对象和相应的数据集,即可通过一键式操作快速下发评测任务。这种设计极大地简化了评测流程,减少了人工设置和干预,显著提升了评测工作的效率和准确性。同时,自动化的下发机制确保了评测任务的一致性和可复现性,为大规模和高频次的模型评测提供了强有力的支持。评测任务监控评测任务监控为大模型评测提供了直观的进度跟踪能力。用户可以通过用户界面实时监控评测任务的执行状态,包括当前的进度、已处理的数据量等。这种透明化的监控机制不仅增强了用户对评测流程的掌控感,而且有助于及时发现并解决评测过程中可能出现的问题,从而确保评测任务的顺利进行。评测任务审核评测任务审核功能允许专业人员对自动生成的评测结果进行人工核查,以确保评测结果的准确性。通过自动判卷和人工核查双重保障机制,提供更为真实和有效的评测结果。人工审核的介入,尤其是在处理复杂或关键性的评测任务时,为评测的精确性和权威性提供了额外的保障,增强了评测结果的可信度和实用性。专家评分“弈衡”平台支持专家评分,对于模型主观评价问题,允许领域内的专家对模型的性能进行打分和评价。这一功能结合了人工智能的自动化评测和专家的深入洞察,提供了更为全面和权威的评测结果。16榜单生成榜单生成功能允许用户通过简单的操作,一键生成模型性能排名榜单。平台根据模型的评测结果和专家评分,自动整理并展示每个模型在不同性能指标上的表现,从而为用户提供了一个快速便捷了解模型性能水平的途径。这种自动化的榜单生成方式很大程度上节省了用户整理数据的时间,极大地提升了用户体验。大模型排行榜大模型排行榜是“弈衡”平台的一项直观展示工具,它通过图形化界面清晰地展示各个模型的综合排名。用户可以迅速了解不同模型在关键性能指标上的相对位置,从而对模型的整体表现有一个直观的认识。这种图形化的展示方式不仅使复杂的数据信息变得易于消化,而且帮助用户快速识别顶尖模型和发现性能瓶颈,为模型选择和优化提供了有力的视觉支持。智能分析与报告智能分析与报告功能通过人工智能技术,对评测数据深度挖掘,精准捕捉并归纳模型能力,自动化编制评测报告。报告不仅呈现了模型的性能指标,还提供了模型间的比较排名,为用户提供了一个全方位的视角,以全面评估和比较不同模型的性能表现。4.5 平台主要优势弈衡大模型评测平台凭借其核心优势为用户提供了一个全面、高效、智能的评测解决方案,这些优势包括创新的2-4-6多维度评测体系,业界领先的自动化评测能力,用户友好的一键测试功能,高度的可拓展性等。首先,平台的核心自研“2-4-6”多维度“弈衡”评测体系已达业界一流水平。采用“基于一致性的大模型评测体系量化评估方法”对标业界大模型评测体系,结果表明,在分档一17致性和排名一致性两类指标上,中国移动“弈衡”大模型评测体系,已经与国际主流评测体系如微软、斯坦福等实现了对标,其整体能力已达到国际一流水平。其次,“弈衡”大模型评测平台具备“一键测试”的功能,显著提升了用户体验,该功能简化了人工操作流程,用户能够轻松地上传模型,并等待评测自动化执行完成即可。这一创新设计极大地降低了用户执行模型评测的难度,使得非技术背景的用户也能便捷地完成专业级别的评测。此外,平台可自动化生成详尽的评测报告,为用户提供模型功能和性能情况的全面视图,使得用户能够迅速掌握模型的强项与改进空间。平台的另一大特色是其高度的可拓展性,评测模型、指标等内容均可灵活配置、调整。“弈衡”允许用户根据具体的评测需求,轻松添加或修改评测模型和指标,无需复杂的编程或系统调整。这种设计哲学赋予了平台强大的适应性,能够快速响应技术进步和市场变化,支持新兴模型和指标的集成。同时,开放的 API 接口进一步增强了平台的可拓展性,鼓励第三方开发者和服务提供商参与到平台的生态建设中,共同推动大模型评测技术的发展和应用。与传统手动评测相比,“弈衡”平台显著提升了效率,将大模型评测周期从三周以上缩短至一周以内,并以其出色的实时响应能力,确保评判平均响应时间控制在 5 秒以内,满足了用户对实时性的要求。平台的自动化评测成功率稳定在 90%以上,证明了其高可靠性。通过容器化技术和资源调度优化,平台提升了硬件资源利用率并降低了运营成本,同时已成功适配 50 余款业界主流大模型,展现了强大的兼容性。4.6 成功案例与应用实践“弈衡”大模型评测平台在不同层面上展现了其深远的影响力和专业评测能力,具体体现在如下几个方面:在国家层面,中国移动已多次为政府部委提供大模型评测支撑,通过专业的评测,深入分析了人工智能的发展趋势和风险,获得高度认可。在政务领域,该平台与北京市大数据中心合作,参与政务大模型能力评测,科学支撑了北京市政务应用的决策过程,受到相关部门和客户的一致好评。为国家部委等递交近 10 篇专报,得到各级领导批示。在产业层面,基于“弈衡”大模型评测平台,开展多领域行业大模型评测,根据不同行业的特点和需求,“弈衡”平台能够提供定制化的评测方案。同时能够对不同领域的大模型进行跨领域的性能比较,帮助企业识别各模型在特定任务上的优势和局限性,从而做出更合适的技术选型决策。根据评测结果,企业可以了解到模型在实际应用中的表现,并据此进行模型的优化和迭代,提升模型的实用性和有效性。此外通过成立行业学会大模型评测工作组、18举办全国性大模型评测竞赛等多种方式,推动建立完善的评测体系,研发高效的审核评估工具,助力国产大模型技术成熟,促进产业生态繁荣。19展望未来,“弈衡”大模型评测平台将致力于深化、扩展评测能力,以适应不断演进的大模型技术。在评测需求的扩展与深化方面,随着大模型技术的不断进步,平台将面临从传统文本处理向多模态领域扩展的挑战。这意味着评测需求将不限于语言模型的文本理解与生成能力,还将涵盖图像、视频、音频等多种模态的交互与融合能力。为了全面评估模型在这些领域的能力,平台必须开发新的评测指标和方法,构建相应的多模态数据集,并设计能够模拟真实应用场景的复杂评测环境。在评测技术的创新与应用方面,“弈衡”平台将持续升级评测平台架构,优化资源管理,并增强并发处理能力,以高效应对大规模的评测任务。同时,进一步改进资源分配策略,提升运算效率,并加速整个评测流程。此外,随着评测领域的扩展,通过各行业数据不断学习和优化评测策略,增强评测大模型的评判能力,通过模型调优提升判别的准确性和稳定性,实现对大模型全方位智能化评测分析。在评测数据构建与共享方面,“弈衡”大模型评测平台将着重于构建高质量、多样化的评测数据集。这些数据集将涵盖多个模态,如:文本、图像、音频和视频,并注重数据的真实性和代表性。平台还将积极推动数据的共享与开放,鼓励研究者们共同贡献和使用这些数据集,以促进大模型评测领域的快速发展。通过数据的共享与协作,我们将共同推动评测技术的进步,为大模型的持续优化提供有力支持。未来“弈衡”大模型评测平台将进一步构建并完善大模型评测生态,并推动各方深度合作。为此,“弈衡”平台将倾力打造一个开放且包容的评测生态系统。积极携手学术界、工业界、政策制定者及其他相关利益方,共同研讨并制定权威的评测标准,研发先进的评测工具,并汇聚多元化的数据集,进一步提升评测的公信力与实用性,促进大模型技术的稳健进步,从而为人工智能技术的广泛落地奠定扎实的基础。

    浏览量38人已浏览 发布时间2024-06-12 21页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 电子行业AI系列之苹果WWDC 2024:苹果开启AI新纪元引入个人化AI系统Apple Intelligence-240611(22页).pdf

    分析分析师:师:王芳 S0740521120002,杨旭 S0740521120001,张琼 S0740523070004联系人:联系人:洪嘉琳证券研究报告证券研究报告报告日期:报告日期:2024年年.

    浏览量14人已浏览 发布时间2024-06-12 22页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 电子行业苹果WWDC2024点评:Apple Intelligence重磅推出无感接入ChatGPT-240611(10页).pdf

    行业及产业 行业研究/行业点评 证券研究报告 电子-2024 年 06 月 11 日 Apple Intelligence 重磅推出,无感接入 ChatGPT 看好苹果 WWDC2024 点评 相关研.

    浏览量10人已浏览 发布时间2024-06-12 10页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 电子元器件行业AI端侧系列推荐之七:Windows on Arm步入AI PC新时代-240610(33页).pdf

    请务必阅读正文之后的免责条款部分请务必阅读正文之后的免责条款部分 股票研究股票研究 行业公司更新行业公司更新 证券研究报告证券研究报告 Table_Industry 电子元器件电子元器件 2024.

    浏览量5人已浏览 发布时间2024-06-12 33页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 机器人行业人形机器人系列报告:3D视觉可应用于AR、VR、机器人等下游迎千亿蓝海-240607(22页).pdf

    有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。机器人专题 行业研究|深度报告 3D3D 视觉采集深度信息.

    浏览量20人已浏览 发布时间2024-06-11 22页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 消费电子行业深度报告:AI+3D拍摄赋能智能影像新时代影像设备整机及配件迎高增机遇-240607(19页).pdf

    证券研究报告行业深度报告消费电子 东吴证券研究所东吴证券研究所 1/19 请务必阅读正文之后的免责声明部分请务必阅读正文之后的免责声明部分 消费电子行业深度报告 AI+3D 拍摄赋能智能影像新时代,影.

    浏览量19人已浏览 发布时间2024-06-11 19页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 消费电子行业AI端侧深度报告之AI手机:受益端侧智能体落地驱动人机交互新范式-240607(58页).pdf

    消费电子消费电子|证券研究报告证券研究报告 行业深度行业深度 2024 年年 6 月月 7 日日 强于大市强于大市 公司名称公司名称 股票代码股票代码 股价股价 评级评级 蓝思科技 300433.S.

    浏览量26人已浏览 发布时间2024-06-07 58页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 罗森伯格:2024面向 AI 智算数据中心网络架构与连接技术的发展路线展望白皮书(20页).pdf

    白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 1/19 页面向 AI 智算数据中心网络架构与连接技术的发展路线展望白皮书白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 2/19 页1 AIGC 及智算网络简述.3 1.1 AIGC 市场前景.31.2 AI网络架构对于AIGC应用发展的重要性.31.3 传统云计算数据中心网络架构.41.4 智算中心网络架构.51.5 AI网络架构所能容纳的最多GPU数量.51.6 AI计算网络中对于GPU与CPU的权衡.62 AI智算网络两大主流架构介绍及差异.72.1 InfiniBand网络架构.72.1.1 InfiniBand 网络流控机制.72.1.2 InfiniBand 网络特点:链路级流控与自适应路由.82.2 RoCEv2网络架构.82.2.1 RoCEv2网络流控机制.82.2.2 RoCEv2网络特点:强大兼容性与成本优化.92.3 InfiniBand与RoCEv2的技术差异.93 AI智算网络800G/1.6T主流传输方案.93.1 800G主流传输方案与1.6T传输方案展望.93.2 实际应用环境对传输带宽的影响.103.3 单模传输创新解决方案:基于EBO(Expanded Beam Optical)的扩束技术.113.4 室外超大芯数传输安全可靠解决方案:预端接技术.134 AI智算网络降耗增效解决方案.154.1 创新光模块LPO与其他光模块的技术差异.164.2 应对AI数据中心高能耗高热量的问题液冷解决方案.164.2.1 罗森伯格液冷解决方案灵活安装的配线架.174.2.2 罗森伯格液冷解决方案半浸没式 RJ45 跳线.174.2.3 罗森伯格液冷解决方案即插即拔防水连接器.185 结语.19参考文献.19目 录白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 3/19 页1 AIGC 及智算网络简述 2024 年以来,全球 AI 市场热度不衰。Open AI 旗下 Sora 的发布,再次拔高了 AI 内容创作的上限。同时,国内人工智能领域也迎来了新的焦点Kimi,这款 AI 大模型产品凭着高达 200 万字的上下文窗口技术,将国产 AI 大模型“卷”出了新高度。业界普遍预测,2024 年将成为 AI 大模型应用的爆发之年。1.1 AIGC 市场前景IDC 的数据显示,全球企业对生成式人工智能(下文简称:“AIGC”)解决方案的投资热情不断上升,预计到 2024 年投资额将达到 200 亿美元,而到 2027 年,这一数字预计将激增至超过 1400 亿美元。这一趋势不仅凸显了 AIGC 技术的商业潜力,也预示着 AI 将引领一个创新与增长的新时代。在这样的背景下,AIGC 的未来增长需要坚实的支撑而 AI 网络架构正是这一增长的“骨骼”,它正逐渐成为推动 AI 发展的关键力量。1.2 AI 网络架构对于 AIGC 应用发展的重要性 AI网络架构的重要性在AIGC应用的发展中显得尤为突出。在AIGC工具方面,厂商正通过深度技术投资,挖掘大量数据并提升算力,使得这些工具从基础应用转变为强大的生产力工具。而在AI社交领域,大模型的发展重点在于融合AI技术与用户互动,创造富有情感和温度的互动体验,旨在重塑用户体验并探索新的商业模式。其中,自主研发能力和丰富的训练数据成为了打造有竞争力产品的关键。我们不难发现,这两个赛道的发展都依赖高效、可靠的网络架构,以支持AI大规模训练集群的算力和显存需求。白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 4/19 页LLM(大规模语言模型)进化树(来源:Harnessing the Power of LLMs in Practice:A Survey on ChatGPT and Beyond)传统云数据中心与 AI 智算中心网络架构对比图 1.3 传统云计算数据中心网络架构 传统的云数据中心网络架构较为成熟,但存在着诸多痛点,导致其无法完美适配 AI 网络架构需求。实际上,传统的云数据中心网络的设计基于对外提供服务的流量模型,以南北向流量为主导,云内部东西向流量作辅。承载智算业务时,传统云计算数据中心面临着如下挑战:带宽收敛比较高:Leaf 交换机上下联带宽收敛比设计,导致上下联带宽比约为 1:3;互访高时延:云内部服务器间互访都需经过 Spine 交换机,增加转发路径,提高时延;网卡带宽低:单台物理机通常只有一张网卡,带宽不超过 200Gbps,限制了整体带宽。这些问题共同影响了智算业务的高效运行,需要通过构建新的网络架构来应对需求。白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 5/19 页AI 网络架构图(来源:锐捷)1.5 AI 网络架构所能容纳的最多 GPU 数量 AI 网络的性能和扩展性与其网络架构和交换机端口密度紧密相关,随着网络层次的增加,可接入的 GPU 卡数量也随之增长。在胖树网络架构中,例如端口数为 P 的交换机最多可连接 P/2 台服务器和其他交换机,其最大容量可达 P/2 张 GPU 卡。在更复杂的三层网络架构中,通过增加汇聚和核心交换机组,网络容量可以进一步扩展至 P/4 张 GPU 卡。随着技术的进步,市场上已经出现了能够支持高达 524k 张 GPU 卡的网络解决方案,这展示了 AI 网络架构在扩展性和性能上的巨大潜力。1.4 智算中心网络架构 AI 智算网络采用 Fat-Tree(胖树)架构,有效解决了传统云数据网络面临的挑战。这种架构通过 1:1 的无收敛配置,确保了网络的高性能和无阻塞传输。其次,为了降低时延,网络设计将 8 台交换机构成一个资源池,池内节点单跳通信,而跨集群通信则通过汇聚交换机,最多实现三跳传输,从而优化数据传输效率。此外,网络采用 RDMA 技术,绕过操作系统内核,允许主机之间直接内存访问,可显著降低同集群内部单跳可达场景的时延,相比 TCP/IP 网络提升了数十倍的时延性能。针对带宽需求,AI 智算服务器通常配备 8 张 GPU 卡和 8 个网卡插槽,以应对多机 GPU 集群中可能出现的超过 50Gbps 的跨机 GPU 通信带宽需求。随着 800Gbps 网卡的商用化,单机对外带宽有潜力达到 6.4Tbps,进一步满足了 AI 应用对高带宽的需求,为 AI 智算网络提供了强大的数据传输能力。白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 6/19 页1.6 AI 计算网络中对于 GPU 与 CPU 的权衡 AI 服务器之所以更倾向于使用 GPU 而非 CPU,原因在于 GPU 在处理 AI 任务时展现出的卓越性能。GPU 拥有大量并行处理核心,能够同步执行众多计算线程,特别适合进行深度学习等 AI 算法中涉及的大规模矩阵和向量运算,这些运算对于 AI 模型的训练和推理过程至关重要。GPU 的并行化特性显著提高了计算速度,而 CPU 虽然在处理复杂逻辑和单线程任务方面表现出色,但其核心数量较少,难以匹敌 GPU 在大规模并行处理方面的能力。此外,GPU 拥有高达 14MB 的寄存器总量和 80TB/s 的高速数据传输能力,这使得 GPU 在处理 AI 应用中的大数据量时更为高效,进一步提升了整体的计算效率。因此,GPU 不仅能够缩短 AI 模型的训练时间,还能提升推理性能,使得 AI 服务器能够处理更加复杂的模型,推动 AI 技术的发展。不同网络架构可容纳的最大 GPU 节点数量(来源:2023 智算中心网络架构白皮书)白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 7/19 页2 AI 智算网络两大主流架构介绍及差异 在深入探究 AI 智算网络的领域时,我们发现市场中主要存在两大主流架构:InfiniBand 和RoCEv2。这两种网络架构在性能、成本、通用性等多个关键维度上展现出各自的优势,相互竞争。我们将细致分析这两种架构的技术特性、它们在 AI 智算网络中的应用场景,以及各自的优势和局限性。通过这一全面的探讨,我们旨在评估并展望 InfiniBand 和 RoCEv2 在AI 智算网络中的潜在应用价值和未来的发展方向,以期为行业提供深刻的洞察和专业的指导。2.1 InfiniBand 网络架构 InfiniBand 网络主要通过子网管理器(Subnet Manager,简称 SM)来进行集中管理,SM通常部署在一台接入子网的服务器上,充当网络的中枢控制器。子网中可能存在多个配置为SM 的设备,但仅有一个被指定为主 SM,负责通过管理数据报文(MAD)的内部下发和上传来管理所有交换机和网卡。每个网卡端口和交换芯片都通过由 SM 分配的唯一身份标识(Local ID,LID)进行识别,确保网络内设备的唯一性和准确性。SM 的核心职责包括维护网络的路由信息和计算更新交换芯片的路由表。网卡内部的 SM Agent(SMA)功能使得网卡能够独立处理 SM 下发的报文,无需所在服务器的干预,而提高了网络的自动化和效率。2.1.1 InfiniBand 网络流控机制 InfiniBand 网络基于信用令牌(credit)机制,在每条链路都配备了一个预置缓冲区。发送端仅在确认接收端有足够的缓冲区后,才会启动数据发送,并且发送的数据量都不可超过接收端当前可用的预置缓冲区的最大容量。当接收端接收完报文,会释放缓冲区,并向发送端通报当前可用的预置缓冲区大小,从而维持了网络的流畅运行和数据传输的连续性。InfiniBand 网络架构示意图(来源:2023 智算中心网络架构白皮书)白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 8/19 页2.1.2 InfiniBand 网络特点:链路级流控与自适应路由 InfiniBand 网络依靠链路级的流控机制,防止发送过量数据,从而避免了缓冲区溢出或是数据丢包的问题。同时 InfiniBand 网络的自适应路由技术可根据每个数据包的具体情况进行动态路由选择,在超大规模的网络环境中实现了网络资源的实时优化和最佳负载均衡利用。2.2 RoCEv2 网络架构 RoCE(RDMA over Converged Ethernet)协议是一种能在以太网上进行 RDMA(Remote Direct Memory Access 远程内存直接访问)的集群网络通信协议。该协议有两个主要版本:RoCEv1 和 RoCEv2。RoCEv1 作为链路层协议,要求通信双方位于同一二层网络内。而RoCEv2 则为网络层协议,它采用以太网网络层和 UDP 传输层,取代了 InfiniBand 的网络层,从而提供了更优的可扩展性。与 InfiniBand 网络的集中管理方式不同,RoCEv2 采用的是纯分布式架构,通常由两层构成,在扩展性和部署灵活性方面具有显著优势。2.2.1 RoCEv2 网络流控机制优先流控制(PFC)是一种逐跳流控策略,通过合理配置水位标记来充分利用交换机的缓存,以实现以太网络中的无丢包传输。当下游交换机端口的缓存过载时,该交换机就会向上游设备请求停止传输。已发送的数据则会存储在下游交换机的缓存中,等到缓存恢复正常,端口将会请求恢复数据包的发送,从而维持网络的流畅运行。显式拥塞通知(ECN)定义了一种基于 IP 层和传输层的流量控制和端到端拥塞通知机制。通过在交换机上向服务器端传递特定拥塞信息,然后服务器端再发送至客户端通知源端降速从而实现拥塞控制的目的。数据中心量化拥塞通知(DCQCN)是显式拥塞通知(ECN)和优先流控制(PFC)两种机制的结合,旨在支持端到端的无损以太网通信。其核心理念是在网络拥塞发生时,优先使用ECN 来通知发送端降低传输速率,防止 PFC 的不必要激活,同时也要避免拥塞严重导致缓冲区溢出的情况。通过这种精细的流量控制,DCQCN 能够在保持网络高效运行的同时,避免因拥塞造成的数据丢失。RoCEv2 网络架构示意图(来源:2023 智算中心网络架构白皮书)白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 9/19 页2.2.2 RoCEv2 网络特点:强大兼容性与成本优化 RoCE 网络利用 RDMA 技术实现了高效的数据传输,不必占用远程服务器的 CPU 周期,从而充分利用带宽并增强了网络的可伸缩性。这种方法显著降低了网络延迟并提升了吞吐量,整体上提高了网络性能。RoCE 方案的另一个显著优势是它能够无缝地融入现有的以太网基础设施,这意味着企业无需额外投资于新设备或进行设备更换,就能实现性能的飞跃。这种成本效益高的网络升级方式对于降低企业的资本支出至关重要,使得 RoCE 成为提升智算中心网络性能的优选方案。2.3 InfiniBand 与 RoCEv2 的技术差异 市场中对网络的多样化需求促成了 InfiniBand 和 RoCEv2 两种网络架构的共同发展。InfiniBand 网络凭借其高级技术,如高效的转发性能、快速的故障恢复时间和增强的扩展性,以及运维效率,在应用层业务性能上展现出显著优势,特别是在大规模场景下,能够提供卓越的网络吞吐性能。而RoCEv2网络则以其强大的通用性和较低的成本受到青睐,不仅适用于构建高性能RDMA网络,还能无缝兼容现有的以太网基础设施,这使得 RoCEv2 在广泛性和适用性方面具有明显优势,能够满足不同规模和需求的网络应用。这两种架构各自的特性和优势,为 AI 智算中心的网络设计提供了丰富的选择,以满足不同用户的具体需求。3 AI 智算网络 800G/1.6T 主流传输方案 在设计 AI 网络的传输方案时,必须综合考虑多个关键因素以满足 AI 应用的需求。首先,带宽必须足够高,以支持高速数据处理。其次,根据服务器与交换机之间的距离,选择适当的连接技术也至关重要。此外,成本效益分析是决策过程中不可或缺的一部分,需要在网络性能和预算之间找到恰当的平衡点。信号的稳定性和抗干扰能力也是保障网络可靠性的关键,而网络的扩展性和升级能力则确保了网络能够适应未来的技术发展和变革。综合这些要素,可以设计出一个高效的 AI 网络物理层架构,为系统的顺畅运行提供坚实的基础。3.1 800G 主流传输方案与 1.6T 传输方案展望 800G 技术正逐渐成为 AI 网络构建的新标杆,以其超越 400G 解决方案的高速数据传输能力,满足了智算中心对速度的严苛要求。800G 多模传输方案,如 800GBASE-SR8 和800GBase-VR8,适合InfiniBand 网络与 RoCEv2 技术对比图(来源:2023 智算中心网络架构白皮书)白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 10/19 页短距离传输环境,但受多模光纤色散和 VCSEL 带宽限制,其应用范围相对单模方案有限。相比之下,800G 单模传输方案,800GBase-DR8 和 800GBase-FR8更适宜于中长距离的稳定数据传输,支持 500 米至 2 千米的传输距离。在智算中心内部,AI 服务器与接入交换机之间可通过 800G DAC 或 AOC 直连,这样既保持了速率也降低了成本。对于跨机房或跨楼层的连接,则仍然依赖于光模块。鉴于单模方案在稳定性和传输距离上的优势,尽管成本较高,它仍然是长距离传输的首选。展望未来,尽管 1.6T 光模块标准尚未发布,预计将继续采用 800G 的多模与单模传输方案,并可能引入850nm/910nm 双波长技术。自 2019 年起,罗森伯格便与互联网领先厂商建立了深入合作关系,并在国内率先成功进行了 400G 高速光纤系统的测试。至今,罗森伯格已经为多家互联网企业项目提供了 800G 产品,并致力于推动新型产品的研发,以满足市场对更高速、更高效、更创新的需求。400G/800G/1.6T 传输方案3.2 实际应用环境对传输带宽的影响 在传输标准的实际应用中,环境因素与实际传输带宽对光纤性能的实际表现有着显著影响。以 800GBASE-SR8 传输标准为例,OM4 光纤理论上可支持长达 100 米的传输距离,但在实际应用中,当最大有效模式带宽(EMB)达到 4700MHz.km 时,会出现波长偏移的现象,即波长从 850nm 偏移到 860nm。此外,当传输距离超过 70 米时,数据丢包率显著增加,严重影响网络的稳定性和性能。针对这一挑战,罗森伯格研发了 OM4 特种光纤,并与行业内知名厂商合作进行了多次对比实验和测试。测试结果表明,OM4 光纤在 860nm 波长下的 EMB 可达 5500MHz.km,在850nm 与 870nm 波长下也可达 5000MHz.km,不仅确保传输 100 米过程中的信息完整性,也同时满足了光纤网络高速率传输的需求。白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 11/19 页EBO 扩束原理 OM4 光纤与 OM4 光纤最大 EMB 对比图 3.3 单模传输创新解决方案:基于 EBO(Expanded Beam Optical)的扩束技术 随着 800G 和未来 1.6T 等高速应用的兴起,单模光纤的应用比例预计将迎来快速增长。罗森伯格正在积极研发基于 EBO 技术的创新方案,旨在解决高密度、大芯数单模光纤应用中的稳定性问题。EBO 技术的核心优势在于其能够通过两个精确匹配的透镜系统,分别位于光纤的两端,实现光纤信号的有效扩束和聚焦。当信号从一端发射并通过透镜扩束成平行光线后,接收端的透镜会将其重新聚焦回光纤,从而显著提高了光纤传输的效率和系统的整体稳定性。这一技术的应用,不仅提升了 AI 智算中心网络的性能,同时也为未来更高速率的网络应用奠定了坚实的基础。罗森伯格公司在 EBO 技术的成熟基础上,通过自主研发,致力于开发将 EBO 与 MPO 技术相结合的解决方案。该方案利用全内反射(TIR)镜技术将光纤信号扩束成平行光,配合 AR 涂层,最大限度地减少了损耗和背反射,从而提升了信号的传输质量和系统的整体性能。白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 12/19 页罗森伯格 EBO Z 字扩束技术经过一系列严格的反复插拔测试,该 MPO 解决方案确保了单模光纤的插损维持在 0.7dB以下,多模光纤的插损控制在 0.3dB 以下。此外,即使在多次插拔操作后,插损的浮动值也能保持不超过 0.1dB。这一结果凸显了 MPO 解决方案的卓越长期稳定性和耐用性,为高速通信网络提供了一个可靠、高效的光纤连接选项。此款新型连接器凭借其简洁而创新的设计,在反复插拔使用中能够保持性能的稳定性。同时,该连接器的设计巧妙避免了光纤端面的直接接触,从而最大限度地减少了端接过程中可能出现的碎裂、划痕和损坏风险,确保了光纤传输的卓越性能。此外,该连接器对环境中的振动和灰尘具有极高的抗干扰能力,具备出色的可靠性,适合在环境多变的条件下使用,为 AI 智算中心网络的稳定运行提供了有力保障。反复插拔性能测试图白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 13/19 页基于 EBO 技术的 MPO 连接器 3.4 室外超大芯数传输安全可靠解决方案:预端接技术 随着 AI 模型规模的持续扩大,园区级跨机房模块的 DCI 超大芯数单模主干线缆成为了满足AI 智算中心对高芯数光缆需求的典型部署案例。AI 技术的高速发展使得传统的 192 芯大芯数光缆已无法满足智算中心的网络需求,市场对能够传输上千芯光纤的高密度光缆的需求日益迫切。国际上成熟的解决方案主要由蜘蛛网丝带(Spider Web Ribbon,SWR)和缠绕管线缆(Wrapping Tube Cable,WTC)组成,例如,一根 200mF 的 WTC 光缆能够支持高达 6912芯的光纤传输,在光纤接入时,通过剥离外护套并分离每组 SWR 光纤,可以迅速建立高密度的光纤传输系统。在安全性方面,在小动物啃咬通信线缆导致的电气事故频发,其中,老鼠啃咬事件约占 60%,因此,室外线缆的外护套还需采取防鼠措施,如施加金属罩进行机械保护、在线缆表面涂上防鼠剂涂料,或使用表面硬度更高的塑料材料,以确保通信安全和可靠性。白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 14/19 页基于对上述解决方案的深刻理解和支持,罗森伯格结合 SWR 和 WTC 技术理念,并融入了自主研发的预连接技术,为 AI 智算中心网络架构中的 DCI 超大芯数单模主干线缆提供了一种高效的部署方案。该方案免除了现场熔接的需要,极大提高了光缆的安装和管理效率,并简化了整个部署流程。并且,通过利用 EBO 扩束技术,罗森伯格实现了盲配解决方案,既有效预防了端接过程中的连接问题,又使得单根光缆支持上千芯的预端接应用,显著提高了光纤传输密度。此外,罗森伯格在防鼠咬解决方案方面进行了创新性的改进,在护套内融入了一种特殊的化学材料。这种材料不仅赋予了线缆持久的防鼠咬性能,而且与线缆护套的原始材质实现了良好的兼容性,确保了线缆的整体性能不受影响。该化学材料在施工和使用过程中不会产生有害或刺激性的气味,从而在保障户外使用环境下线缆的耐用性和可靠性的同时,也提升了施工人员的操作舒适度和安全性。WTC 线缆结构(来源:Innovative Solution Using SWR/WTC for Data Centers)白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 15/19 页DCI 超大芯数主干预端接解决方案4 AI 智算网络降耗增效解决方案 随着光模块技术向 400G 及更高速率迈进,面临的挑战不单是提升数据传输速度,还包括应对由此增加的功耗和成本。从 2007 年的 10G 光模块仅需 1W 功率,到如今 400G 及 800G光模块功耗接近 30W,随着速率的每一次迭代,功耗也相应攀升。在满载状态下,一个交换机可能搭载多达数十个光模块,48 个光模块的总功耗可达 1440W,而光模块通常占整机功耗的 40%以上,导致整个智算中心的能耗可能超过 3000W。这种能耗的显著增长对智算中心的运营成本构成了重大压力,并与通信网络的低碳目标背道而驰。近 12 年里光器件的能耗增长(来源:Cisco)白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 16/19 页4.1 创新光模块 LPO 与其他光模块的技术差异 目前,针对功耗问题,推出一种创新的光模块设计:LPO(Linear-drive Pluggable Optics),它通过取消传统的 DSP 和 CDR 芯片,并在驱动芯片(Driver)和跨阻放大器(TIA)上分别集成连续时间线性均衡(CTLE)与均衡(EQ)功能,实现了低功耗、低成本和低延时的目标。这种设计不仅简化了模块结构,提高了维护的便捷性,而且支持热插拔功能。与侧重于高集成度和性能优化的 CPO(Co-Packaged Optics)技术不同,LPO 更注重成本效益和设计简化。虽然在通信距离和性能集成度方面可能不及 CPO,但它为短距离应用提供了一种经济高效的解决方案。LPO 技术处于标准化的初步阶段,为了未来的发展,LPO需要克服这些技术障碍,以便在多供应商环境中的保障互联互通性,在更广泛的应用场景中实现规模化生产。4.2 应对 AI 数据中心高能耗高热量的问题液冷解决方案 在追求降低网络系统能源功耗的过程中,液冷技术已成为市场上广泛认可的高效解决方案。液冷技术利用液体的高导热性能,其导热能力是空气的 25 倍,能够以远高于空气的效率带走热量,大约是同体积空气的 3000 倍。这一特性使得液冷技术尤其适用于高功率密度数据中心的冷却需求,即便在单机柜配电量达到 50KW 或更高至 150KW 的极端条件下,液冷系统也能够实现比传统风冷技术高出数倍甚至数十倍的运算效率,极大地适合 AI 智算中心的网络部署。然而,冷却液的腐蚀性以及压强差导致的逆流问题,对液冷系统的安全性提出了挑战。针对这些问题,罗森伯格提供了全面的液冷解决方案,旨在最大化提升冷却效率,同时确保数据传输过程的安全性和可靠性,为智算中心的稳定运行保驾护航。传统光模块与 LPO 与 CPO 方案技术对比图 白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 17/19 页4.2.1 罗森伯格液冷解决方案 灵活安装的配线架罗森伯格自主研发的液冷线缆专用配线槽设计灵活,可方便地安装在液冷柜的内部或机体侧面。在应用过程中,通过快速打开每根线缆中间的 Mini-RMC连接器进行线缆的管理、维护和性能检测,避免了对浸没在冷却液中的有源光缆(AOC)两端收发器进行插拔操作,从而减少了潜在的风险。这一创新方法不仅提高了液冷系统的可靠性,而且显著提升了液冷产品的工作效率。4.2.2 罗森伯格液冷解决方案半浸没式 RJ45 跳线 罗森伯格针对半浸没式液冷中存在的压强差问题,研发了专用的液冷 RJ45 跳线,以应对冷却液逆流的挑战。跳线采用创新的防漏结构设计,有效防止了冷却液在跳线中间和两端连接器内部的逆流。产品经过 3M 认证测试,进一步证明了其在液冷环境下的安全性和可靠性。在性能测试方面,液冷 RJ45 跳线在浸泡冷却液前后的表现对比显示,单体与信道的串扰变化值维持在3%的误差范围内,回波损耗变化值大于5%,同时,近端衰减串扰比(NEXT)与远端衰减串扰比(ELFEXT)浸没式液冷解决方案白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 18/19 页4.2.3 罗森伯格液冷解决方案 即插即拔防水连接器 罗森伯格所研发的液冷 AOC 跳线,配备了 Mini-RMC防水连接器,该连接器具备 IP67级 的防水性能,能够在各种恶劣环境下保护连接不受水分侵害。此外,光收发器内部采用了专用的防水设计,这一设计确保了 AOC在整体光学通道上与冷却液的有效隔离,从而在高带宽传输状态下仍然保持了数据传输的可靠性。的变化也控制在 3%以内,这些结果均符合高标准的网络性能要求。罗森伯格还计划进行油类冷却液的兼容性测试,以进一步增强液冷 RJ45跳线在半浸没应用中的安全性和可靠性,为液冷系统提供全面的传输解决方案。白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 19/19 页5 结语 在 5G 和物联网技术飞速发展的当下,AIGC 正开辟市场新机遇并展现巨大潜力,提高了内容创作的效率和个性化水平,为自动驾驶、金融风控、媒体娱乐等行业带来创新解决方案。AIGC 将有望更好地实时处理大量数据,推动服务智能化和自动化。作为 AIGC的骨骼,AI网络架构的迭代升级也同样振奋人心,未来的主流解决方案一定源自于当下的厚积薄发。罗森伯格公司正通过不断的技术创新,为 AIGC应用提供定制化的服务,以支持 AI模型的广泛推广和应用,为未来的主流的解决方案奠定坚实的基础。参考文献:2023 智算中心网络架构白皮书 百度智能云 AIGC 进入应用之争,谁能抢占流量入口?澎湃新闻 人工智能行业专题研究:LPO 光模块 未来智库 800G 高速光模块产业格局梳理 个人图书馆 到底什么是 LPO?LPO 和传统光模块的关键区别 电子发烧友 白皮书白皮书:面向AI智算数据中心网络架构与连接技术的发展路线展望 作者:万雨声,孙慧永,张德胜,何雯思,于素景,鉏丽云,王冬雪,陆友锋,卫嘉杰,邱怀兵第 20/19 页罗森伯格亚太电子有限公司地址:北京市天竺空港工业区B区安祥街3号邮编:101300电话: 86 10 8048 1995罗森伯格亚太电子有限公司上海分公司地址:上海市长宁区虹桥路1438号1幢23楼03-04单元邮编:200336电话: 86 21 5899 5997罗森伯格(上海)通信技术有限公司昆山分公司地址:江苏省昆山市淀山湖镇黄浦江南路229号邮编:215345电话: 86 512 8616 3666-6137罗森伯格(常州)电子科技有限公司地址:江苏省常州市新北区春江镇创业西路2号B1幢厂房1-3层邮编:213000 电话: 86 519 8822 9966罗森伯格(上海)通信技术有限公司地址:上海市青浦工业区新科路303号邮编:201707 电话: 86 21 6921 4567创建日期:2024年5月由于技术原因,我们保留对白皮书内容进行更改的权利。未经罗森伯格亚太电子有限公司同意,不得转让给第三方。保留所有权利。罗森伯格 中国罗森伯格生产和研发基地:请访问我们的网站:www.RosenbergerAP.comwww.R

    浏览量126人已浏览 发布时间2024-06-06 20页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 智慧芽:2024年智慧芽全球科技企业调研之生成式AI赋能研发创新调研简报(19页).pdf

    2024年智慧芽全球科技企业调研之生成式AI赋能研发创新调研简报(基于2024年智慧芽全球科技企业调研结果)来自全球140 研发决策者的声音背景说明2024年4月,智慧芽创新研究中心开展了全球科技企业调研,邀请了全球600 IP决策者和研发决策者,共同探讨知识产权与科技创新领域里的发展趋势和热点话题,其中的IP部分内容汇总成调研报告于426世界知识产权日发布;本次简报为调研的延申内容,聚焦生成式AI赋能企业研发创新的话题,涉及样本为研发决策者(研发总、研发leaderleader、企业C C级高管),样本量为143143份(国内9595份、海外4848份)。话题围绕研发决策者对生成式AI和大模型的态度、在研发团队工作中的应用、对研发工作的功能期待等角度,汇总成本次简报。一、全球研发决策者对生成式一、全球研发决策者对生成式AIAI的态度与认知的态度与认知全球科技企业研发团队对研发工作中应用生成式全球科技企业研发团队对研发工作中应用生成式AIAI的整体态度的整体态度全球研发团队(N=143)24.5F.2!.0%1.4%7.0%我完全支持,生成式AI为研发工作主要带来红利我很乐见其成,生成式AI在研发工作中利大于弊我持保留意见,生成式AI在研发工作中有利有弊我非常反感,生成式AI对研发工作更多带来负面影响不确定70.7).4%乐观中立/消极加和加和选择相应选项的样本占比数据来源:2024年智慧芽全球科技企业调研全球约有七成研发决策者态度乐观,认为生成式全球约有七成研发决策者态度乐观,认为生成式AIAI为研发工作带来的主要是红利或者利大于弊为研发工作带来的主要是红利或者利大于弊七成研发决策者态度乐观。全球调 研 样 本 中,70.7%抱以乐观态度,其中24.5%完成支持,认为生成式AI为研发工作主要 带 来 红 利,46.2%认为生成式AI利大于弊。仅三成研发决策者保持中立或者态度消极。21.0%的研发决策者持保留意见,认为生成式AI在研发工作中有利有弊。仅有1.4%持反对意见,认为生成式AI带来的更多是负面影响。仍然有7.0%的研发决策者表达了不确定,对生成式AI在研发工作中应用没有明确的立场。15.4.65.0%2.8%6.2%全球科技企业研发团队对未来两三年内研发工作中生成式全球科技企业研发团队对未来两三年内研发工作中生成式AIAI落地应用的整体看法落地应用的整体看法全球研发团队(N=143)生成式AI会极大程度上颠覆我们的工作内容和工作方式生成式AI很大程度上改变我们的工作内容和工作方式生成式AI会带来一些改变,但并不多完全不会不确定56.0D.0%未来两三年内会落地应用未来两三年内不会落地应用加和加和选择相应选项的样本占比半数以上全球研发决策者认为,生成式半数以上全球研发决策者认为,生成式AIAI将在近两三年内改变研发的工作内容和工作方式将在近两三年内改变研发的工作内容和工作方式全球56.0%的研发决策者认为,未来两三年内生成式AI就将在研发工作中落地应用。15.4%研发决策者认为生成式AI将对研发工作带来颠 覆 性 改 变,40.6%认为未来两三年生成式AI会很大程度上改变研发工作的内容和方式。44.0%则表示生成式AI可能不会在未来两三年内真正落地应用。35.0%认为生成式AI会带来一些改变,但 并 不 多。仅2.8%认为未来两三年生成式AI完全不会改变研发工作。6.2%表达了不确定。数据来源:2024年智慧芽全球科技企业调研中国不同规模研发团队对未来两三年内研发工作中生成式中国不同规模研发团队对未来两三年内研发工作中生成式AIAI落地应用的整体看法落地应用的整体看法生成式AI会极大程度上颠覆我们的工作内容和工作方式生成式AI很大程度上改变我们的工作内容和工作方式生成式AI会带来一些改变,但并不多完全不会不确定未来两三年内会落地应用未来两三年内不会落地应用选择相应选项的中国样本占比在中国,研发团队规模更大的研发决策者对生成式在中国,研发团队规模更大的研发决策者对生成式AIAI的颠覆性影响更有感知的颠覆性影响更有感知在中国,规模越大的研发团队决策者对生成式AI给研发工作带来的颠覆性影响更有感知。在研发人员=100人的这些研发团队中,有20.8%的团队决策者表示“生成式AI将在极大程度上颠覆我们的工作内容和工作方式“。而在研发人员=100人(N=26)研发人员=100人(N=26)研发人员100人(N=69)52.68.8%1.2%7.4g.3.9.4%3.4.8%加和1.2倍8.6%加和4.5倍在中国,小规模研发团队更灵活,更容易将生成式在中国,小规模研发团队更灵活,更容易将生成式AIAI在研发专业任务中予以应用的想法真正落地在研发专业任务中予以应用的想法真正落地选择相应选项的中国样本占比中国不同规模研发团队将在研发专业场景中应用生成式中国不同规模研发团队将在研发专业场景中应用生成式AIAI的想法予以落地的程度的想法予以落地的程度相比规模更大的研发团队,小规模研发团队更容易将生成式AI应用在研发专业任务中的想法真正落地。在人员规模小于100人的研发团队中,17.9%正在内部讨论这些想法,14.8%已经实现了小规模试点或者大规模运用,前者是后者的1.2倍。而在100人以上的研发团队中,高达38.8%还在内部讨论阶段,仅有8.6%已经把这些想法真正予以实现,前者是后者的4.5倍之多。暂不考虑正在内部讨论已经小规模试点已经大规模运用暂无想法已有想法数据来源:2024年智慧芽全球科技企业调研48.06.0.08.35.0&.7%海外研发团队(N=48)中国研发团队(N=95)基于垂直大模型的工具才是最佳我们希望训练自己的定制大模型基于通用大模型的工具就已经够用选择相应选项的样本占比在研发专业场景中,研发领域的垂直大模型是第一选择,企业定制大模型次之,通用大模型最末在研发专业场景中,研发领域的垂直大模型是第一选择,企业定制大模型次之,通用大模型最末在适用于研发专业场景的生成式AI选择上,国内外研发决策者达成共识,研发领域垂直大模型是最佳,企业定制大模型次之,最后是通用大模型。综合成本、安全、可靠性等考量,国内外研发决策者均认为垂直大模型才是研发专业任务的最佳选择,国内有38.3%的研发决策者表达了偏好,海外有48.0%,均占到各自样本总量的最多数。第二选择是为企业的研发工作定制训练的大模型,虽然成本高,但安全性能最好且更契合企业的个性化研发需求,所以国内外均有1/3以上研发决策者希望训练定制大模型。也许是在研发专业任务中,通用大模型可提供的帮助有限,国内外只有少数研发决策者认为通用大模型基本已经够用,国内尚有26.7%,海外仅有16.0%的研发决策者对通用大模型表达了支持。国内外科技企业研发团队对研发专业场景中生成式国内外科技企业研发团队对研发专业场景中生成式AIAI工具的偏好工具的偏好数据来源:2024年智慧芽全球科技企业调研海外研发团队(N=48)中国研发团队(N=95)18.4.8Q.3.5%还没看到市场上有任何研发垂直领域的生成式AI工具我认为当前研发垂直领域的生成式AI工具在性能上没有显著优于其他工具我认为当前产品已经有不错的能力,但还可以更好我已经看到了表现优异的工具16.7.7c.3%3.3%选择相应选项的样本占比一半以上研发决策者表示,已经在市场上看到了能力不错的研发领域垂直大模型,但仍有进步空间一半以上研发决策者表示,已经在市场上看到了能力不错的研发领域垂直大模型,但仍有进步空间国内外科技企业研发团队对市场上研发垂直领域生成式国内外科技企业研发团队对市场上研发垂直领域生成式AIAI工具的看法工具的看法国内外均有50%以上的研发决策者已经在市场上看到了能力不错的研发领域垂直大模型工具,但它们仍有进步的空间。在中国,有51.3%的研发决策者已经看到了市场上提供的研发垂直领域的生成式AI工具,并表示“当前产品已经有不错的能力,但还可以更好”。在海外,研发垂直领域垂直大模型的开发程度更高,有63.3%的海外研发决策者看到了这些产品相当不错的能力。数据来源:2024年智慧芽全球科技企业调研三、国内外研发决策者使用生成式三、国内外研发决策者使用生成式AIAI的期望与顾虑的期望与顾虑92.0t.7D.0%海外研发团队(N=48)中国研发团队(N=95)提升工作效率降低部门成本创造性实现更多价值62.5).29.6%选择相应选项的样本占比提高工作效率是国内外研发决策者对生成式提高工作效率是国内外研发决策者对生成式AIAI为研发工作带来助益的共同期待为研发工作带来助益的共同期待国内外科技企业研发团队对生成式国内外科技企业研发团队对生成式AIAI工具的潜在价值判断工具的潜在价值判断在中国,研发决策者普遍期待通过生成式AI为研发工作提效降本。多达92.0%的研发决策者希望通过生成式AI的应用,提升研发工作的效率。也有多达74.7%的研发决策者希望借助生成式AI降低外包的需求、削减非核心研发人员的数量,从而控制研发部门的整体预算成本。在海外,提效也是最大期待,但除此之外,也希望借助生成式AI为研发工作创造性带来更多价值。62.5%海外研发决策者期待生成式AI提升工作效率,也占到样本总量的最多数。但与中国不同的是,除提效外,海外研发决策者更希望生成式AI创造性带来更多价值,也许不仅限于为当前研发工作提供助力,而是为整个研发工作范式带来变革性颠覆。数据来源:2024年智慧芽全球科技企业调研海外研发团队(N=48)中国研发团队(N=95)“期待值”满分5分技术情报获取和技术分析洞察是国内研发决策者最期待生成式技术情报获取和技术分析洞察是国内研发决策者最期待生成式AIAI提供帮助的两大研发工作模块提供帮助的两大研发工作模块3.893.893.853.853.763.763.743.743.723.723.653.65更便捷的技术情报获取更准确的技术分析洞察更高效的技术方案设计更自动化的研发文本撰写更快速的技术方案测试更顺畅的研发工作流3.663.663.733.733.533.533.563.563.553.553.393.39国内外科技企业研发团队对生成式国内外科技企业研发团队对生成式AIAI赋能研发工作模块的期待情况赋能研发工作模块的期待情况国内外研发决策者对技术情报获取和技术分析洞察的期待值最高。中国研发决策者对生成式AI在技术情报获取和技术分析洞察这两个工作模块上发挥的作用抱以更高期待,“期待值”分别为3.89和3.85。在海外,亦是如此,海外研发决策者也同样更期待在技术情报获取和技术分析洞察上发挥的作用,“期待值”分别为3.66和3.73。数据来源:2024年智慧芽全球科技企业调研研发人员=100人(N=26)更顺畅的研发工作流更准确的技术分析洞察更便捷的技术情报获取更自动化的研发文本撰写更高效的技术方案设计更快速的技术方案测试3.933.893.893.863.793.713.85平均“期待值”满分5分在中国,规模越大的研发团队越期待生成式在中国,规模越大的研发团队越期待生成式AIAI在研发工作中提供帮助,尤其是在研发工作流程上在研发工作中提供帮助,尤其是在研发工作流程上中国不同规模研发团队对生成式中国不同规模研发团队对生成式AIAI赋能研发工作模块的期待情况赋能研发工作模块的期待情况大规模研发团队的决策者对生成式AI在研发工作中发挥作用的期待更高,而小规模研发团队的决策者期待程度略低一些。大规模研发团队决策者对各个研发环节的“期待值”平均分为3.85,小规模研发团队决策者的“期待值”平均分为3.74。在大研发团队,由于技术研发人员更多,因此决策者更期待生成式AI构建更为顺畅的工作流程,帮助沟通协作,对生成式AI在研发工作流程中发挥作用的“期待值”高达3.93。数据来源:2024年智慧芽全球科技企业调研半导体和芯片工程和设备互联网和高科技能源电力汽车生命健康石化和材料通信消费电子消费品和食品农业 技术情报获取技术方案设计技术分析洞察技术方案测试研发工作流研发文本撰写3.80 3.40 3.40 3.20 3.00 3.00 技术分析洞察技术方案测试技术情报获取技术方案设计研发文本撰写研发工作流技术方案设计技术分析洞察技术方案测试研发文本撰写研发工作流技术情报获取3.92 3.79 3.71 3.67 3.67 3.63 4.67 4.33 4.33 4.33 4.33 3.33 技术分析洞察技术情报获取技术方案设计研发文本撰写技术方案测试研发工作流4.44 4.44 4.22 4.11 4.00 3.67 技术情报获取研发文本撰写技术方案测试研发工作流技术分析洞察技术方案设计4.22 4.11 4.00 4.00 3.89 3.89 技术情报获取技术方案测试研发工作流技术分析洞察技术方案设计研发文本撰写3.82 3.64 3.64 3.64 3.64 3.45 技术情报获取技术方案设计研发文本撰写技术分析洞察研发工作流技术方案测试技术分析洞察技术情报获取技术方案设计研发文本撰写技术方案测试研发工作流3.95 3.70 3.70 3.65 3.60 3.50 4.50 4.00 3.50 3.50 3.50 3.00 技术分析洞察技术情报获取研发文本撰写研发工作流技术方案设计技术方案测试3.33 3.33 3.33 3.33 3.00 3.00 技术分析洞察研发文本撰写研发工作流技术方案测试技术情报获取技术方案设计3.80 3.80 3.80 3.80 3.60 3.60 3.30平均3.73平均4.22平均4.15平均4.02平均3.64平均3.68平均3.67平均3.22平均3.73平均按行业看,中国互联网和高科技、能源电力行业的研发决策者对生成式按行业看,中国互联网和高科技、能源电力行业的研发决策者对生成式AIAI赋能研发工作的期待更高赋能研发工作的期待更高中国不同行业研发团队对生成式中国不同行业研发团队对生成式AIAI赋能研发工作模块的期待情况赋能研发工作模块的期待情况“期待值”满分5分数据来源:2024年智慧芽全球科技企业调研海外研发团队(N=48)中国研发团队(N=95)72.3r.3f.3f.3W.8W.8G.0G.0A.0A.03.73.7.3.3%准确性问题大模型幻觉可能导致结果偏差大、反而引起混乱社会问题生成式AI的大规模应用可能增加失业伦理问题基于生成式AI的工作成果可能权属不清,追责困难合规风险生成式AI可能面临不符合政府规范而被禁止或限制安全性问题生成式AI工具可能导致公司机密信息泄露成本问题生成式AI工具的采购成本可能过高侵权风险基于生成式AI生成的工作成果可能造成更多侵权54.2T.2b.5b.5.1.1.1.17.57.5%.0%.0.1.1%选择相应选项的样本占比安全风险和准确性问题是国内外研发决策者在研发工作中应用生成式安全风险和准确性问题是国内外研发决策者在研发工作中应用生成式AIAI的两个最大顾虑的两个最大顾虑国内外科技企业研发团队对在研发工作中应用生成式国内外科技企业研发团队对在研发工作中应用生成式AIAI的主要顾虑的主要顾虑国内外研发决策者最关心生成式AI在研发工作中应用时的安全风险和准确性问题。在中国,对使用生成式AI的安全风险表示担忧的研发决策者多达72.3%,对准确性问题表示担忧的也有66.3%,分别占到样本总量的2/3以上。海外也呈现出类似的担忧现象。对安全风险和准确性问题表示担忧的样本分别有54.2%和62.5%,超过了样本总量的半成。数据来源:2024年智慧芽全球科技企业调研研发人员=100人(N=26)研发人员100人(N=69)66.7f.7W.1W.1W.1W.1R.4R.4(.6(.68.18.1#.8#.8r.1r.1g.2g.2U.7U.7B.6B.6B.6B.6).5).5.4.4%准确性问题大模型幻觉可能导致结果偏差大、反而引起混乱社会问题生成式AI的大规模应用可能增加失业伦理问题基于生成式AI的工作成果可能权属不清,追责困难合规风险生成式AI可能面临不符合政府规范而被禁止或限制安全性问题生成式AI工具可能导致公司机密信息泄露成本问题生成式AI工具的采购成本可能过高侵权风险基于生成式AI生成的工作成果可能造成更多侵权选择相应选项的中国样本占比在中国,规模更大的研发团队决策者更关心采购生成式在中国,规模更大的研发团队决策者更关心采购生成式AIAI工具的成本问题工具的成本问题不同规模中国研发团队对在研发工作中应用生成式不同规模中国研发团队对在研发工作中应用生成式AIAI的主要顾虑的主要顾虑相比小研发团队的决策者,大规模研发团队的决策者更担心采购生成式AI的成本问题。在规模更大的研发团队,研发决策者除了考虑在技术研发过程中使用生成式AI工具可能带来的风险与挑战,也会比规模较小的研发团队决策者更关注采购生成式AI工具的成本问题,有52.4%的研发决策者对此表示担忧,比小规模研发团队高出10个百分点之多。数据来源:2024年智慧芽全球科技企业调研

    浏览量62人已浏览 发布时间2024-06-06 19页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • AI算法研究系列:量化行业配置策略梯度算法-240605(15页).pdf

    证券研究报告|金融工程专题 1/15 请务必阅读正文之后的免责条款部分 金融工程专题 报告日期:2024 年 06 月 05 日 量化行业配置:策略梯度算法量化行业配置:策略梯度算法 AI 算法研究系.

    浏览量21人已浏览 发布时间2024-06-06 15页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 电子行业AI系列之Computex 2024:英伟达主题演讲~AI时代如何在全球范围内推动新的工业革命-240604(22页).pdf

    分析师:分析师:王芳 S0740521120002杨旭 S0740521120001李雪峰 S0740522080004证券研究报告证券研究报告报告日期:报告日期:20242024年年6 6月月4 4.

    浏览量40人已浏览 发布时间2024-06-06 22页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 2024海外AI大模型发展现状及海外应用梳理分析报告.pdf

    2023 年深度行业分析研究报告 目录目录 1.1.模型层:大语言模型加深场景结合,多模态持续迭代模型层:大语言模型加深场景结合,多模态持续迭代 .5 5 1.1 大语言模型:开、闭源共存以满足不同应.

    浏览量177人已浏览 发布时间2024-06-04 28页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 零工经济研究中心:2024企业AI财税应用研究报告(28页).pdf

    1目 录一、人工智能在财税领域的发展概况.2(一)人工智能(AI)定义与范畴.2(二)企业财税迎来数智化转型契机.2(三)AI 与财税融合重塑生产力.4二、AI 财税融合的驱动因素.6(一)政策支持驱动企业财税创新.6(二)企业用户对财税产品的需求多元化.8三、AI 技术在财税领域的应用与实践.10(一)AI 财税赋能政府税务征收.10(二)AI 财税赋能企业财税管理.12(三)AI 财税产品的应用和发展现状.15四、AI 技术应用的风险挑战与策略.17(一)数据质量和准确性.18(二)数据安全与隐私保护.18(三)技术更新与人才培养.19五、数智化时代财务人员的转型与能力构建.19(一)AI 对财务人员角色与职责的影响.19(二)数智化时代财务人员必备能力框架.202一、人工智能在财税领域的发展概况一、人工智能在财税领域的发展概况(一)人工智能(一)人工智能(AIAI)定义与范畴)定义与范畴AI 是人工智能(Artificial Intelligence)的缩写,是指用机器去实现所有目前必须借助人类智慧才能实现的任务。它本质上是基于学习能力和推理能力的不断进步,去模仿人类思考、认知、决策和行动的过程。人工智能包括自然语言处理(NLP)、计算机视觉(CV)、机器学习、深度学习、数据挖掘、机器人技术等分支。AI 大模型是人工智能中的一种技术手段,是具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数,通过学习大量数据能够从中提取有用的信息,进行自主的学习和决策,从而实现更加智能和高效的处理和解决问题。例如 GPT、BERT 等。了解人工智能的思维方式可以通过理解机器的学习过程来更好地应用人工智能技术。人工智能的思维方式通常为归纳、演绎、类比三种。关于归纳,当机器处理数据时,它们会总结规律和模式,然后从类似的情况中得出更普遍的结论。例如,一些图像识别的任务,机器会对大量图片进行学习,总结出图片的特征并将其归类。这能使机器预测其他类似的图片属于什么类别;演绎是从已知条件中得出结论的过程。例如,机器可以根据已知的数学定理和公式推出答案。这种方式可以被应用在问题解决和判断推理等方面;类比是人工智能的第三种思维方式。这意味着机器可以将现有的知识应用到新的情况中。例如,机器可以模拟人类语言的使用,将相似的词语归为同一类别。这种方式为机器创造了学习最新技能的能力,帮助他们更好地处理新的数据和任务。(二)企业财税迎来数智化转型契机(二)企业财税迎来数智化转型契机1.1.中国财税数字化市场规模持续增长中国财税数字化市场规模持续增长根据艾瑞咨询的数据显示,2018-2023 年中国财税数字化市场规模持续增长,2020 年虽受疫情影响增长速率下降,但随着疫情结束后增速恢复并大幅上升。2023 年,中国财税数字化市场规模达到 518 亿元,增长率为 18.7%。预计 2025 年总规模将达到 702 亿元,增长率保持在 16.2%左右。32018-20252018-2025 年中国财税数字化市场规模及增速年中国财税数字化市场规模及增速1 12.2.企业财税管理的数智化发展历程企业财税管理的数智化发展历程企业财税从信息化到数字化到智能化,是一个逐级发展的过程。当前国内大部分企业都已经实现信息化。企业财税信息化主要是将财税管理的业务流程以信息化的形式展现出来,通过软件将信息录入 IT 系统固化日常业务流程,并自动记录相关信息来推动业务运行。这有助于降低基层人员的工作难度,提高财税管理的效率。信息化主要着眼于企业内部管理,以邮箱系统、OA、流程软件、ERP 等为代表,实现事务处理的线上化,基于在线化的信息传播为应用特征,实现流程化审批的分级管控和条线协同。数字化是在信息化的基础上,从信息系统中提取数据,利用数字技术对企业的财税业务逻辑和管理过程进行数学建模、优化,并反过来指导企业的日常财税运行。数字化增加了数据运营的元素,将企业管理经验模型化,自动分析系统记录的各项数据,并给出分析报告和解决方案,提高生产效率。而企业进入智能化阶段后,AI 开始逐渐替代专家的任务。数字化和智能化结合迎来了我国企业财税管理的数智化阶段。数字化为形成财税决策和经营策略提供数据支持。通过大数据、云计算等数字技术,能够实时收集、整理和分析财税数据,帮助企业全面、准确地掌握企业的财务状况和税务情况。智能化则在数字化的基础上,通过引入人工智能、机器学习等先进技术,能够自动处理财税数据,识别潜在风险,提出优化建议,从而减轻人工负担,提高决策的准确性和效率。数智化的核心,是以海量大数据为基础,结合人工智能相关技术,打通数据孤岛,结合场景化去解决问题。1资料来源:艾瑞咨询中国小微企业云财税行业研究报告4财税数智化发展历程财税数智化发展历程2 2(三)(三)AIAI 与财税融合重塑生产力与财税融合重塑生产力以数治税时代的来临和国家“金税四期”政策的快速落地,财税管理,正迈入一个“人机协作,智能分工”的全新时代。人工智能作为发展新质生产力的重要引擎,企业借助 AI,可以智能化地处理财税工作,挖掘数据并通过洞察变成信息和知识,辅助管理决策。目前 AI 能力主要为文本生成、语言理解、知识对话、逻辑推理、数学能力,基于这些能力体现在财税领域上的应用则主要为财税咨询、发票录入、风险预测、业务数据分析等企业所需功能,重塑企业新型生产力。AIAI 能力能力具体应用具体应用文本生成文本总结内容扩展语言理解凭证摘要识别合同信息理解会计科目映射语音识别知识对话大模型生成回答知识库召回问答逻辑推理非结构化数据处理税务辅助专业判断数学能力数据预处理数据挖掘2资料来源:零工经济研究中心5按产品模式和产品核心能力两个维度进行交叉分类,财税类产品可以划分为六大类产品。其中,智能财税产品融合大数据、AI 技术将支持多元财税管理一体化场景。智能财税产品按服务模式不同,可以划分为两大类:商事服务类与产品工具类。商事服务类的产品通常为财税服务商开发,将财税产品整体打包,以外包服务形式为其他公司提供财税服务;而产品工具类的财税产品则是作为内部工具使用,辅助企业财务决策。财税类产品类型划分财税类产品类型划分3 3人工智能财税产品通过数据、规则和用户反馈的学习来优化自身的功能,为企业和个人提供更加高效、准确的财税管理服务。数据学习:通过对海量数据的学习从中提取出有效的财务和税务特征,并根据企业的历史数据进行分析和预测。例如,系统可以通过学习企业的销售数据,判断某个产品的市场表现,从而为企业提供相关的财税建议和策略。规则学习:通过分析税务法规和政策文件,学习并自动更新财税领域的相关规则。例如,随着税法的不断修改和完善,财税 AI 能够及时调整相应的计算方式和报表模板,确保企业的纳税申报符合最新的法规要求。用户反馈学习:通过与用户的交互和反馈学习,记录用户在使用过程中的问题和疑问,并根据用户的反馈进行必要的调整和优化,提供更加适应企业如记账和报税等财税服务。3资料来源:甲子光年2022 中国智能财税用户需求场景调研报告6财税财税 AIAI 学习路径学习路径二、二、AIAI 财税融合的驱动因素财税融合的驱动因素(一)政策支持驱动企业财税创新(一)政策支持驱动企业财税创新近年来,国家出台多项政策鼓励大数据、人工智能等技术对财税领域的应用与创新,为财税数智发展营造了良好的政策环境。2022 年 3 月,国资委发布关于中央企业加快建设世界一流财务管理体系的指导意见 对企业财务数字化提出了要求,完善智能前瞻的财务数智体系。统筹制定全集团财务数字化转型规划,建立智慧、敏捷、系统、深入、前瞻的数字化、智能化财务。财税数智化领域的相关政策财税数智化领域的相关政策发布时间政策文件发布机构主要内容2021.02关于进一步扩大增值税电子发票电子化报销、入账、归档试点工作的通知财政部等第三批电子发票无纸化试点启动,试点参与单位增至 576 家。2021.03关于进一步深化税收征管改革的意见国务院加快推进智慧税务建设。充分运用大数据充分运用大数据、云计算云计算、人工智能人工智能、移动互联网等现代信息技术移动互联网等现代信息技术,着力推进内外部涉税数据汇聚联通、线上线下有机贯通,驱动税务执法、服务、监管制度创新和业务变革。2021.11会计改革与发展“十四五“规划纲要财政部强调推动电子会计凭证开具、接收、入账和归档全程数字化和无纸化转型。数字化和无纸化转型。2022.02关于中央企业加快建设世界一流财务管国资委完善智能前瞻的财务数智体系。统筹制定全集团财务数字化转型规划,完善制度体系、组织体系和管7理体系的指导意见控体系,加强跨部门、跨板块协同合作,建立智慧建立智慧、敏捷、系统、深入、前瞻的数字化、智能化财务敏捷、系统、深入、前瞻的数字化、智能化财务。统一底层架构、流程体系、数据规范,横向整合各财务系统、连接各业务系统,纵向贯通各级子企业,推进系统高度集成,避免数据孤岛,实现全集团“一张网、一个库、一朵云”。2022.06关于加强数字政府建设的指导意见国务院支持全国财政电子票据一站式查验、财政电子票据可跨省报销,推动非税收入收缴电子化全覆盖推动非税收入收缴电子化全覆盖。2022.09关于进一步优化营商环境 降低市场主体制度性交易成本的意见国务院提升办税缴费服务水平。全面推行电子非税收入一般缴款书,推动非税收入全领域电子收缴、跨省通缴”,便利市场主体缴费办事。2022 年底前,实现电子发票无纸化报销、入账、归档、存储等实现电子发票无纸化报销、入账、归档、存储等。2022.11中小企业数字化转型指南工信部构建完善中小企业数字化转型公共服务体系,加强中小企业数字化转型中小企业数字化转型公共服务平台建设。2023.11关于新时代加强和改进代理记账工作的意见财政部提高数字化服务水平。鼓励地方基于代理记账服务,探索打造涵盖财税咨询、商事登记、金融服务等业务在内的全流程一体化中小微企业管理服务平台,推动支持中小微企业发展的政策直达快享机制落实。引导代理记账机构充分运用大数据充分运用大数据、人工人工智能智能、区块链等技术手段区块链等技术手段,选用或打造数字化业务选用或打造数字化业务管理系统管理系统,对机构业务开展、合同管理、质量控制、人员管理、财务管理等方面进行规范管理,有效提升对内管理和对外服务水平。从金税一期到金税四期的政策要求及演变从金税一期到金税四期的政策要求及演变一方面,政府在持续推动智慧税务建设促进了财税 AI 的应用。如对电子发票和电子档案的推广普及提高了企业对财税 AI 产品的需求,企业财税数字化进程将进一步被提速。另8一方面,金税四期的推动对广大企业财税规范化和系统智能化提出了更高要求。金税四期是国家税务总局推出的财务管理信息系统升级版本,将运用大数据、人工智能等新一代的信息技术实现智能办税,对企业智能监管。则需要企业实现税务数据的电子化、标准化和自动化处理,促使了企业积极寻求财税 AI 产品来提高税务处理的效率和准确性。金税四期和企业AI 数字化的叠加共振推动财税领域进入新时代。宏观规划明确税务领域数字化变革目标4(二)企业用户对财税产品的需求多元化(二)企业用户对财税产品的需求多元化1.1.对智能财税有需求的企业数量持续上升对智能财税有需求的企业数量持续上升AI 在各领域有了广泛的应用和创新,为社会经济发展带来了巨大的变革和价值,越来越多的企业开始认识到 AI 在财税管理中的重要性,并愿意投入资金进行技术升级。根据甲子光年发布的2022 中国智能财税用户需求场景调研报告显示,高达九成的企业都在进行数字化建设,其中对财务类数字化产品的需求比例高达 44%。超九成企业有数字化转型需求超九成企业有数字化转型需求44D%企业有采购数字化财税产品需求企业有采购数字化财税产品需求4资料来源:艾瑞咨询中国小微企业云财税行业研究报告9在财务类数字化产品中,用户对智能财税产品的购买比例上升到了 37%,有接近四成的用户会选择采购智能财税类工具而放弃传统财税产品。从 2021-2025 年中国智能财税用户数量增长情况来看,用户数量逐年递增,2023 年中国智能财税用户总量达 637 万家。约四成企业会选择智能财税类产品约四成企业会选择智能财税类产品2021-20252021-2025 年中国智能财税用户数量规模(万家年中国智能财税用户数量规模(万家)2.2.企业对智能财税产品功能要求增多企业对智能财税产品功能要求增多当下企业用户对智能财税产品功能的需求趋于多元化和进阶化,与过去单模块、单系统的财税产品相比,企业用户现在更倾向于选择从数据库到开源架构的一体化平台。他们希望产品能够具备一键操作电子结算、自动报税、发票智能管理、财务智能管理等功能,以简化繁琐的财税工作,提高工作效率。同时,大数据时代背景下,企业用户对大数据和人工智能在业财税一体化产品中的应用需求也在不断提高,希望智能财税大模型能够利用先进技术,实现更精准的数据分析、业务洞察和风险预测。例如,注重数据的聚合和多维分析能力,能够将各种来源的数据进行整合和分析,为决策提供有力支持。企业财税产品需求逐渐多元企业财税产品需求逐渐多元5 55资料来源:甲子光年2022 中国智能财税用户需求场景调研报告10三、三、AIAI 技术在财税领域的应用与实践技术在财税领域的应用与实践像业财一体化软件、财务机器人、财税大模型、智能税务申报系统等都是 AI 在财税领域的重要应用工具,预计未来几年,AI 在财税领域的应用将呈现爆发式增长。(一)(一)AIAI 财税赋能政府税务征收财税赋能政府税务征收1.1.税务执法税务执法(1 1)税务稽查)税务稽查人工智能能够精准识别税收治理对象,有效助力税务机关开展税务稽查。一方面,税务机关可以利用 AI 的数据挖掘技术,从海量的金融数据、社会数据、行业数据等中发现异常或可疑的纳税行为,如虚开发票、偷逃漏税、转移利润等,为税务机关生成风险预警和稽查建议;另一方面,利用深度学习技术,AI 可以对图像、视频、语音等非结构化数据进行识别和分析,如识别发票真伪、核对身份信息、分析行为特征等,然后根据不同的稽查场景和目标,自动优化稽查策略和方法,如选择稽查对象、确定稽查时机、分配稽查资源等,提升税务机关稽查的准确性和效率。(2 2)税收征管)税收征管数字经济背景下,纳税人的经济活动日益纷繁复杂,税收征管时常掣肘于征纳双方信息不对称,导致税务机关及时获取纳税人涉税数据、高效完成税收征管工作的难度不断攀升,大大增加了税收征管风险。借助 AI、大数据等技术手段,建立以信息技术为依托的一体化和智能化的征管体系。税务机关正在加速金税工程的建设进程,已上线的金税四期着力推动税收征管方式从“收税”到“报税”再到“算税”升级,税收征管流程从“上机”到“上网”再到“上云”转变,税收征管效能从“经验管税”到“以票控税”再到“以数治税”提升,税务征管正朝着精准化和数智化的方向发展。(3 3)跨部门、跨板块协同合作)跨部门、跨板块协同合作财税 AI 还可以拓展共享边界,打通税务系统内部的稽查、风控、征管等业务部门以及工信、市场监管等跨政府部门数据共享的壁垒,结合银行、舆情平台等第三方部门的数据共享,能够形成一套完整的事前预警、事中监测、事后追溯的监控体系,对纳税人涉税违法风险进行全周期的智能感知和侦测,带来新的税收治理模式。112.2.纳税服务纳税服务(1 1)构建智能办税服务体系)构建智能办税服务体系在纳税人层面,AI 可以构建以纳税人需求为导向的智能办税服务体系。面对数量庞大的纳税人缴费人的多元化、个性化、差异化服务需求,AI 可基于纳税人丰富的历史沉淀数据进行建模,利用深度学习等人工智能算法为纳税人“画像”,并通过语音、指纹、人脸、虹膜等生物识别技术精准识别纳税人的身份,根据纳税人的需求、行为和历史数据快速生成相应的内容或建议,帮助各级税务机关提供诸如公共事务咨询和办理等精细化的纳税服务,满足纳税人的个性化需求,提升纳税服务便利度来间接提高纳税人的税法遵从度。(2 2)提供个性化咨询服务)提供个性化咨询服务人工智能具有更全面的能力,能够很大程度上实现不需要特殊训练就能实现不同要求的任务。目前虽然机器人广泛应用于财务、税务,能代替人工提供一些简单的便捷服务,但是对于稍微个性化或者复杂性的问题就难以回答,使绝大部分使用者在日常使用中都更倾向于使用人工服务。但是,作为人工智能的财税 AI 能够通过上文的描述进一步修正输出结果,最终实现输出能让纳税人满意的回答结果。(3 3)税收宣传)税收宣传财税 AI 可以智能化推送个性化、定制化的最新税收政策、最新的办税流程等信息,同时向纳税人推送优惠政策提醒等信息。人工智能可以高效地生成文本、图片、声音、视频等多种多样的税收宣传素材和创意并进行自动化的投放,同时对宣传效果进行数据分析和评估。同时,语义识别等自然语言处理技术则可赋能税收政策精准推荐,有助于更高效、更全面、更广泛地进行税收宣传,让纳税人更便捷、更深入地了解最新的税收政策。3.3.内部应用内部应用(1 1)撰写通知、公告与文书)撰写通知、公告与文书人工智能拥有强大的通知、提醒、公告、文书等撰写能力,能够节省执法人员所耗费的精力。税务执法人员对纳税人的稽查通知、警示通知、工作报告、执法结果等工作,皆可运用财税 AI 进行文本撰写,快速高效完成任务,提高税收执法效率,降低人力成本。12(2 2)执法教育)执法教育税收政策会随着经济运行变化不断调整,而每次变动税务机关都需要耗费大量人力、物力、财力对税务人员进行教育考核。人工智能在经过专业政策的训练之后,可以对税务人员进行专业化、个性化、精确化培训,并能用便于理解的语言解释政策文件的含义,便于税务人员快速掌握最新政策,理解其中的重点、难点,提高执法的准确性、规范性和有效性。(3 3)应对税收风险)应对税收风险AI 可以通过模型和算法辅助税务机关预测和分析税务干部自身及其在工作流程中存在的权力风险、岗位风险和制度漏洞,并生成针对性强、务实管用的具体防治措施,从内控机制角度切实防止“灯下黑”隐患,从而保障各类税收管理工作的有效性、公平性与合规性。(二)(二)AIAI 财税赋能企业财税管理财税赋能企业财税管理人工智能和大数据技术为企业实现标准业务智能化、非标业务去专业化。像业财一体化业财一体化软件软件、财务机器人财务机器人、财税大模型财税大模型、智能税务申报系统智能税务申报系统等都是 AI 在财税领域的重要应用工具。AI 技术的不断成熟和普及,在企业财税领域带来的应用场景和未来发展趋势主要有:1.1.自动化数据处理与流程优化自动化数据处理与流程优化AI 技术在财税领域目前最基础但同时也最有现实意义的应用方向之一,在于自动化数据处理。在传统的会计处理中,大量的数据录入和处理工作需要人工完成,不仅耗时且容易出错。而现在,AI 技术通过机器学习和自然语言处理等技术手段,能够快速、准确地处理海量财税数据,包括数据的收集、清洗、整理和归档等。例如,在发票处理方面,AI 的应用开启了全新的处理方式,可以通过光学字符识别技术(OCR,Optical Character Recognition)自动识别发票中的关键信息,如发票号码、开票日期、购买方信息等,并将这些信息录入财务系统中。不仅可以大幅度减少人工的工作量,同时还提高发票处理的准确性和速度。在账单处理方面,AI 可以快速准确地识别账单中的信息,包括账单号码、账单日期、账单金额等,并录入财务系统中。AI 自动化处理功能不仅极大提升财务工作的效率和准确性,还避免了人为因素造成的数据错误和遗漏。13票据识别流程及技术票据识别流程及技术6 62.2.风险预测风险预测AI 财税模型首先可以收集企业所有财务和税务数据,基于数据的准确性和完整性实现数据的集成和标准化,从而为企业提供较为全面的风险视图,方便识别潜在的风险点。其次,AI 财税模型通过分析历史数据、趋势预测等方法,发现可能存在的税务风险、财务风险和业务风险,对风险进行量化评估,确定风险的概率和影响程度,从而为企业的风险应对提供决策依据。建立风险预警机制的财税 AI 可以实时监控企业的风险状况。当模型检测到潜在风险时,及时向企业发出预警信号,提醒采取相应的风险应对措施。此外,财税模型可以定期生成风险报告,帮助企业了解风险的变化趋势和分布情况,以保障企业稳健运营和可持续发展。财税财税 AIAI 的风险预警机制的风险预警机制7 76资料来源:大数据、人工智能与财税服务创新7资料来源:ChatGPT 的智能性及其在财税领域的应用143.3.企业内部信息整合与对齐企业内部信息整合与对齐企业财税信息和政策通常处于持续变动更新状态,如果出现横向的业财税或者纵向的集团与下属公司之间税务管理信息不连通、规范不统一的现象,都容易造成企业财税人员无法及时掌握相关最新的税务政策、法规变动等业财信息,导致税务筹划、申报等方面存在滞后的风险;规范不统一也可能带来不同部门或下属公司在税务处理上存在差异的问题。通过人工智能技术搭建业财税一体化的信息化平台,集成企业内部的各类财税数据,包括但不限于财务报表、税务申报表、发票、合同等。经过数据清洗和标准化处理后保证数据的质量,为企业内部实现信息的实时共享和连通提供基础,确保财税人员能够及时获取到最新的税务政策和业务信息,减少重复劳动的可能性和降低沟通成本,提高工作效率。4.4.业务决策支持业务决策支持通过人工智能,企业可以搭建起财务预测和规划平台,拉通财务和业务数据、内部与外部数据,提升决策的效率和精度。生成报表AI 可以帮助员工生成财务报表,例如收支明细、资产负债表等。AI 可以通过快速访问和组织数据来帮助制作财务报表、资产负债表和其他报告。降低了人为错误的风险,并与人工手动流程相比节省了时间。数据分析与预测AI 可以利用机器学习和自然语言处理技术,对大量的财务数据进行分析,为企业提供合理的财务预测和决策支持。例如,可以通过历史数据来预测未来的销售额、现金流、利润等,为企业提出业内专业洞察和经营管理建议。5.5.智能对话与客户服务创新智能对话与客户服务创新智能对话使用对象可以分为企业客户和企业员工。根据对象不同所应用场景也不尽相同。(1 1)对于财税服务商,智能对话)对于财税服务商,智能对话 AIAI 主要应用于其客户咨询场景主要应用于其客户咨询场景自动回复客户咨询智能对话 AI 可以通过自然语言理解技术,识别客户的咨询并自动回复。例如,客户可能会咨询账单问题、付款状态等,AI 可以根据相关的数据和规则,提供相应的解答和帮助。15自动化客户支持智能对话 AI 可以作为财务共享中心自动化客户支持的工具。例如,客户需要更改账单信息或支付方式,AI 可以根据客户提供的请求,从财务系统中查询相应的数据,并自动化处理相关的业务流程,为客户提供更高效的支持服务。此外,智能对话 AI 可以通过自动化推送财务信息,帮助客户及时了解相关的业务流程与处理情况。处理客户反馈智能对话AI可以作为24小时在线服务的工具,帮助客户随时随地处理财务问题和投诉。例如,客户可能会在非工作时间投诉账单有误或者无法完成付款,此时 AI 可以通过自然语言处理技术,识别客户的问题与反馈并自动化处理与账单相关的业务流程,这极大地方便了客户处理业务,有助于提高客户满意度。(2 2)对于企业,)对于企业,AIAI 在智能对话下主要应用于其员工咨询场景在智能对话下主要应用于其员工咨询场景智能对话 AI 可以通过自然语言理解技术,帮助财税人员回答复杂的财税问题,例如税收法规和业务合规问题,AI 在回复时,基于强大的模型能力和庞大的数据进行自动生成回复,当问题答案具备如税务局官方答复的知识库指引,优先采用税务局官方答复,以保证答案的权威性与准确性。在无官方答复情况下,AI 基于庞大的数据库和逻辑推理再生成回复,保障问题解答的合理性和可靠性;或者员工可能会咨询如何处理某个客户的账单,AI 根据历史业务记录提供相应的处理建议。智能对话 AI 可以提高解决问题的速度和准确性,并减少查找正确信息所需的时间和精力。此外,AI 根据每个员工的具体需求提供个性化的支持,提高员工查询信息的整体效率和质量。(三)(三)AIAI 财税产品的应用和发展现状财税产品的应用和发展现状1.1.政府应用财税政府应用财税 AIAI 的实例的实例对于政府,我国各级税务机关已经比较广泛地利用人工智能赋能税收征管现代化,开展多场景的税收征管实践应用探索,提出了人工智能应用体系架构的顶层设计,并在“人工智能 税收征管”“人工智能 纳税服务”“人工智能 税务风控”等方面形成了大量创新应用成果。在税收征管领域在税收征管领域,税务机关已经利用机器人自动化系统,较好地应对了基层税务机关日常事务性工作数量多、重复性高、时间要求紧等问题,解放了高频重复操作的劳动力,并降低了操作错误率。在纳税服务领域在纳税服务领域,税务机关已经利用数字化、智能化手段改造和升级了16纳税服务模式,以服务纳税人为中心提高申报水平,实现了云端办税、“非接触”办税、“多税合一”、要素申报等。在税务风控领域在税务风控领域,税务机关已经借助大数据、人工智能等技术,先后建成了纳税人“画像”体系,并形成了配套的专项应对工作规范,为实现精准识别、精准应对税务风险奠定了良好基础。8部分地区智能税收征管的探索部分地区智能税收征管的探索9 9时间地区具体行动2022-03深圳深圳税务全力打造智慧化审批业务体系,充分利用大数据、人工智能、云计算等技术,构建了“管理数字化、流程智能化、工作简约化”的管理环境。数据显示,目前深圳电子税务局已实现 582 项办税功能,提供“智能填表智能填表AIAI 审批审批”“”“套餐式套餐式”服务等智慧办税服务等智慧办税体验,网上申报率超过 99.5%,214 个涉税缴费事项可全流程网上办;“深税”移动办税平台涵盖申报缴款、税务登记、发票业务、文书查询、证明开具等多项高频业务,企业用户超过 100 万户,个人用户超 66 万人,累计上线121 项业务,通过手机端实现 80%以上的涉税业务办理。2022-10广东V-taxV-tax 远程可视化远程可视化自助办税平台支持多种远程交互方式,纳税人可通过 V-tax 智慧柜台、PC 网页端和手机端“粤税通”微信小程序三种渠道登录,快速与税务人员视频连线,进行实时沟通、线上传递资料。这种办税体验就像打开办税“任意门”,在任何地方办税都像在实体办税厅一样,实现视听说相结合,远程“面对面”办理税费业务。广东地区如今已实现 90%以上税费业务网上办,网上申报率超过 99%,“非接触式”办税缴费水平不断提高。2023-08河北智慧无感人脸识别 畅享服务“零跑腿”:在办税服务厅多功能导税台前,智慧无智慧无感人脸识别系统会自动采集办税人员的人脸信息感人脸识别系统会自动采集办税人员的人脸信息,快速完成身份识别及纳税健康体检,并迅速将指引信息推送至纳税人手机。办税人员无需携带证件,即可实现全厅业务通办,畅享无感办税新体验。2023-08上海12366 上海中心智库团队依托海量会话记录,总结整理纳税人缴费人提问时的口语化表述,建立了智能知识库同义词库,就热点问题分析智能咨询与人工坐席的问答差异,用模拟人工对话的方式建立引导库,并推出智能反式样引导流程,持续提升关键词抓取能力与匹配效率,优化智能咨询服务智能咨询服务体验,实现模糊提问也能精准定位。截至目前,12366 上海中心已建设涵盖 3364 个税费专有名词、2 万余个相关词的同义词库,以及涵盖 65 个标准引导问、582 个扩展引导问的引导库,共引导来电会话 25 万余条,智能语音匹配率达 88%;推出全国税务系统首个 12366 英语智能系统,为不同经营主体提供双语智能税费服务。2023-08厦门厦门市税务局深入挖掘税收大数据,打造企业特色标签体系,动态构建 937 个特色标签,通过将标识标签与政策库关联,向企业精准推送相关税收政策精准推送相关税收政策,做到了政策找人“预先导”,实现了服务模式由“被动响应”到“主动预判”的转变。据统计,今年推出以来,“预先导”已服务企业 229.85 万户次。8资料来源:人工智能赋能税收征管现代化的思考9资料来源:国家税务总局官网172.2.企业企业 AIAI 财税产品的功能、应用场景财税产品的功能、应用场景中国 AI 财税产品市场需求广大,产品和服务种类丰富多样。对于企业,当前市面上已开发的主流智能财税产品涵盖功能主要为财务咨询、财务分析、财税风险监测等功能,随着人工智能技术的不断进步和应用的深化,预计 AI 财税产品功能和应用场景还会进一步拓展。当前市面上当前市面上 AIAI 财税产品已具备的功能财税产品已具备的功能1010四四、AIAI 技术技术应用的风险应用的风险挑战挑战与与策略策略AI 在财税领域的应用是把双刃剑。一方面 AI 技术在财税领域的融合与应用可以为企业带来显著的效益,包括提高工作效率、降低成本、控制风险、优化用户体验等。另一方面,AI 财税工具可能会带来数据安全、隐私泄露等问题。为确保 AI 技术的健康、稳定和可持续发展,在推进 AI 与企业财税的融合中,企业需要充分考虑了解 AI 带来哪些具体风险与难题,需要对财务人员进行相应的培训和指导,才能发挥 AI 财税工具的优势,实现高效管理。10资料来源:零工经济研究中心统计18(一)(一)数据质量和准确性数据质量和准确性挑战:虽然 AI 技术能够处理大量数据,但如果输入的数据存在质量问题,如错误、不完整或格式不统一,那么 AI 的输出结果也可能不准确。策略:确保财税数据的质量和准确性是应用 AI 技术的一个重要前提。首先,数据清洗和预处理至关重要。企业需要建立完善的数据清洗机制,通过自动化工具和人工审核相结合的方式,对输入数据进行严格筛选和修正。包括检查数据的完整性、准确性以及格式的一致性等。可以通过建立数据质量标准和指标来实现,例如定义数据的准确率、完整率等指标,并设定相应的阈值。只有满足标准的数据才会被输入到 AI 工具中。此外,企业还应建立数据质量反馈机制,将监控结果反馈给数据提供方或数据清洗人员,以便及时修正问题。(二二)数据安全与隐私保护)数据安全与隐私保护挑战:由于人工智能高度依赖海量数据和大量算力,涉税数据及个人隐私将被广泛收集,并被长期储存于生成式人工智能大模型中,然而数据的收集、存储和使用也带来了安全和隐私的风险。一方面,为了最大化生成式人工智能赋能税收治理的效用,机构在税收治理实践中对纳税人数据的采集往往容易走向“过度化”误区,导致数据过度采集、不当存储的风险;另一方面,财税大数据训练样本的审慎性、训练数据的准确性和训练算法的可靠性都影响着生成式人工智能算法的安全性、稳定性,一旦算法失当,极易引发数据滥用、数据泄露风险,进而侵害使用用户的合法权益。策略:应通过健全数据采集、数据使用和数据管理等阶段的规制手段,保障纳税人的隐私安全,尽可能规避数据隐私泄露风险。一是在数据采集的源头阶段,要从理念更新、制度保障和技术规制等方面,加强对生成式人工智能涉税数据采集的规制。二是在数据使用阶段,要对在数据共享开放和运算训练等不同场景中可能存在的各种隐私风险分别加以规制;要结合加密技术和权限控制措施,在合理合规的前提下对纳税人的涉税数据进行共享与开放;要采用多种不同的算法对涉税数据进行运算和训练,最大程度减少算法失当带来的数据泄露风险。11企业应建立完善的数据安全体系,加强数据的加密和备份,提高数据安全性。隐私保护方面,企业应制定明确的数据收集、存储和使用政策,确保个人隐私和敏感信息得到妥善保11资料来源:ChatGPT 模型引入我国数字政府建设:功能、风险及其规制19护,确保数据的合法、合规和透明地使用。(三三)技术更新与人才培养)技术更新与人才培养挑战:AI 技术的发展日新月异,技术的更新速度非常快,这要求企业不断地更新技术和知识,否则很容易被市场淘汰。同时,AI 技术的发展也对企业人才管理提出了更高的要求。对于一些简单、重复性的工作任务,如数据输入、发票处理等,财税 AI 可以自动化处理,但是由于 AI 思维存在局限,如数据依赖性、缺乏常识和直觉,以及缺乏创造性思维,对于一些更复杂、需要专业知识和经验的工作任务,则仍需要高技能管理人才的经验。企业将面临高技能人才短缺和如何合理配置人才资源的问题。策略:企业需要加大对技术研发的投入,确保技术的领先地位。同时,企业也需要加强人才的培养和引进,建立完善的人才培养体系。在应用财税 AI 产品时,需要综合考虑业务需求、AI 的应用范围和能力,合理分配工作任务,减少员工的流失,确保可持续的竞争力。五、数智化时代财务人员的转型与能力构建五、数智化时代财务人员的转型与能力构建(一)(一)AIAI 对财务人员角色与职责的影响对财务人员角色与职责的影响人工智能凭借着其高效、精准的特性,在很大程度上减轻了财务工作的压力,提高了财务工作的效率。虽然人工智能 AI 将会给企业带来很大的价值,但是同时财务人员将面临着前所未有的挑战。1.基础财务人员的需求量与重要性下降基础财务人员主要负责传统的会计工作,包括审核、记账、结账、对账、编制会计报表等,这些工作重复性高、规律性强、复杂性低,容易消耗财务人员大量的工作时间,又难以确保数据的准确性。然而借助人工智能技术,设置好相应的程序,就能高效、准确地完成这些工作。不仅可以节省大量的人力,并且能够提高财务工作的效率。相对于基础财务人员,人工智能 AI 对企业更有价值。在人工智能 AI 初步投入市场时,企业首先会减少冗余基础财务人员的人数,更加依赖人工智能 AI 的精准与高效。人工智能 AI 将取代基础财务人员的地位,成为财务工作中必不可少的一部分,基础财务人员的需求量与重要性将大幅下降。2.高级财务人员目前仍保持着竞争力目前,基础财务核算类主要由计算机处理,高级财务人员主要负责对财务进行筹划与管20理,做好预算,对企业经营活动提供建议与决策支持。人工智能 AI 还不能够完全取代高级财务人员的工作。例如,虽然财税大模型在风险管控中具有重要作用,但它并不能完全替代人工判断和经验积累。企业在使用财税大模型时,还需结合专业人员的判断和经验,共同构建完善的风险管控体系。除了掌握基本的财务知识和技能外,高级财务人员如果掌握 IT 知识,学习管理会计、战略规划、风险管理等相关领域的知识,则仍掌握着对人工智能 AI 的控制权,也能确保在人工智能时代具备竞争力。(二)数智化时代财务人员必备能力框架(二)数智化时代财务人员必备能力框架AI 技术正在对财务领域产生深远影响,为了适应这一变革,人工智能的发展对财务人员提出了新的能力要求。由于 AI 技术不断更新迭代,财务人员需要不断学习和掌握新的知识和技能。通过参加培训、阅读相关文献、参与行业交流等方式,来提升自己的专业素养和竞争力,以更好地服务于企业的财务管理和发展。首先,财务人员需要掌握与 AI 技术相关的基本知识和应用能力。这包括了解 AI 的基本原理、应用场景以及潜在风险,并能够熟练使用 AI 工具进行数据分析和处理。通过利用 AI技术,财务人员可以更高效地处理大量数据,提高工作效率,并发现潜在的业务机会和风险。其次,财务人员需要具备跨领域合作和沟通的能力。由于 AI 技术在财务领域的应用涉及多个部门和领域,因此财务人员需要与其他部门(如技术部门、业务部门等)进行紧密合作,共同推动 AI 技术的应用和发展。同时,财务人员还需要具备良好的沟通能力,能够与不同背景的人员进行有效交流,确保信息的准确传递和理解。此外,财务人员还需要具备数据分析和决策支持的能力。通过利用 AI 技术进行数据分析,财务人员可以为企业提供更准确、更全面的财务信息和建议。在决策过程中,财务人员需要能够处理和解读数据结果,结合数据分析结果和业务实际情况,提出合理的建议和解决方案,支持企业的战略发展。21参考报告参考报告【1】艾瑞咨询.中国小微企业云财税行业研究报告,2023【2】甲子光年.2022 中国智能财税用户需求场景调研报告,2022【3】周俊亭 席彦群 周媛媛 邱涛 翁安栋.大数据、人工智能与财税服务创新,2022【4】李荣辉 罗伟平 董立峰 肖倩.人工智能赋能税收征管现代化的思考,2023【5】蔡昌 庞思诚.ChatGPT 的智能性及其在财税领域的应用,2023【6】邱航 王海燕.ChatGPT 等智能对话 AI 引入企业财务共享中心建设:功能、风险及防控,2023【7】周智博.ChatGPT 模型引入我国数字政府建设:功能、风险及其规制,2023

    浏览量79人已浏览 发布时间2024-06-03 28页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 人形机器人行业深度报告(二):精密减速器人形机器人核心零部件国内厂商迎来长期成长空间-240531(24页).pdf

    证券研究报告证券研究报告 行业研究行业研究 行业深度行业深度 机械设备机械设备 行业研究行业研究/行业深度行业深度 人形机器人核心零部件,国内厂商迎来长期成长空间人形机器人核心零部件,国内厂商迎来长.

    浏览量18人已浏览 发布时间2024-06-03 24页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
  • 人形机器人电机行业深度:电机是机器人核心驱动人形机器人打开新成长-240531(38页).pdf

    证券研究报告2024年5月31日行业:机械设备增持 (维持)电机是机器人核心驱动,人形机器人打开新成长人形机器人电机行业深度分析师:刘阳东 SAC编号:S0870523070002分析师:吴婷婷 SA.

    浏览量34人已浏览 发布时间2024-06-03 38页 推荐指数推荐指数推荐指数推荐指数推荐指数5星级
2555条  共128
前往
客服
商务合作
小程序
服务号
会员动态
会员动态 会员动态:

138**37... 升级为标准VIP wei**n_... 升级为至尊VIP

微**... 升级为高级VIP 程臻**U 升级为至尊VIP

180**94... 升级为至尊VIP 150**10... 升级为高级VIP

152**80... 升级为高级VIP peo**zj... 升级为至尊VIP

微**... 升级为高级VIP 138**22... 升级为高级VIP

wei**n_... 升级为高级VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为高级VIP dia**nd... 升级为至尊VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为高级VIP

wei**n_... 升级为标准VIP 152**39... 升级为至尊VIP

186**16... 升级为标准VIP wei**n_... 升级为至尊VIP

dia**nd... 升级为高级VIP wei**n_... 升级为高级VIP

微**... 升级为标准VIP 159**58... 升级为标准VIP

135**74... 升级为高级VIP wei**n_... 升级为高级VIP

wei**n_... 升级为高级VIP 136**87... 升级为至尊VIP

海宝 升级为至尊VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为标准VIP L**m 升级为至尊VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为高级VIP

wei**n_... 升级为高级VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为标准VIP wei**n_... 升级为高级VIP

156**01... 升级为标准VIP 139**37... 升级为至尊VIP

微**... 升级为标准VIP 137**04... 升级为至尊VIP

158**40... 升级为标准VIP ALE**77... 升级为高级VIP

wei**n_... 升级为至尊VIP 135**45... 升级为标准VIP

135**68... 升级为高级VIP 136**65... 升级为至尊VIP

138**99... 升级为标准VIP B F**le 升级为至尊VIP

135**54... 升级为高级VIP 136**65... 升级为高级VIP

fa**ox 升级为高级VIP 173**78... 升级为标准VIP

wei**n_... 升级为高级VIP 158**38... 升级为高级VIP

158**38... 升级为标准VIP 134**13... 升级为高级VIP

Som**ne... 升级为至尊VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为高级VIP 181**38... 升级为至尊VIP

wei**n_... 升级为高级VIP 升级为高级VIP

wei**n_... 升级为标准VIP 138**71... 升级为高级VIP

wei**n_... 升级为至尊VIP 186**52... 升级为至尊VIP

135**22... 升级为标准VIP 微**... 升级为高级VIP

176**91... 升级为高级VIP wei**n_... 升级为至尊VIP

Sim** L... 升级为至尊VIP wei**n_... 升级为标准VIP

张** 升级为标准VIP 婉华 升级为至尊VIP

138**40... 升级为高级VIP wei**n_... 升级为至尊VIP

微**... 升级为高级VIP wei**n_... 升级为高级VIP

185**24... 升级为标准VIP wei**n_... 升级为至尊VIP

wei**n_... 升级为至尊VIP wei**n_... 升级为标准VIP

非**... 升级为至尊VIP wei**n_... 升级为标准VIP

150**15... 升级为至尊VIP 187**03... 升级为至尊VIP

138**33... 升级为标准VIP 183**18... 升级为高级VIP

158**68... 升级为至尊VIP wei**n_... 升级为标准VIP

wei**n_... 升级为高级VIP 138**08... 升级为至尊VIP

微**... 升级为标准VIP wei**n_... 升级为至尊VIP

135**85... 升级为至尊VIP 187**12... 升级为至尊VIP