《AIIA:中国人工智能技术成熟度白皮书2022(316页).pdf》由会员分享,可在线阅读,更多相关《AIIA:中国人工智能技术成熟度白皮书2022(316页).pdf(316页珍藏版)》请在三个皮匠报告上搜索。
1、中国人工智能产业技术成熟度白皮书(2022)(2022)中国人工智能产业发展联盟(AIIA)2023 年 8 月IPREFACEPREFACE前言自 2017 年国务院印发实施新一代人工智能发展规划以来,人工智能产业被上升为国家战略的高度,人工智能技术的基础研究、产业转化和传统行业应用都取得了长足的进展。人工智能技术既有独特的自身产业属性,又具有明显的对其它产业赋能,促进实体经济发展的特征,因而应用范围和影响力极为广泛。它所涉及的知识产权问题也具有很强的时代性,尤其在近年实体经济融合的过程中,也产生了许多新的挑战。自 2018 起,由 AIIA 学术与知识产权工作组组织,在上海交通大学苏州人工
2、智能研究院的牵头下,联合各会员单位、法学界、人工智能产业界、知识产权服务机构等在内的专业团队,分年度组建了人工智能产业知识产权研究课题组,对不断产生的新问题和挑战进行研究,并将研究成果以白皮书的形式发表出来。2018 年课题组由 11 家单位组成,发布2018 人工智能产业知识产权与数据白皮书(以下简称“2018 白皮书”),从基本法律概况(保护端)、专利分析(创新端)和专利价值评估(运营端)三个具体角度,呈现了 AI 领域的知识产权现状,并通过既有争议和案例的展示,对数据相关权利的几个主要问题进行了梳理。2018 白皮书一经发布,就在社会各界引起了强烈反响。在此基础上,2019 年更多单位主
3、动参与,21 家单位协同工作,扩大研究范围,提供了更多详实的数据,完成人工智能产业知识产权白皮书 2019(以下简称“2019 白皮书”),形成了更为规范和完整的框架,即:以人工智能的定义和分类标准为开篇引领,在共识的定义和标准下进行专利检索以及基于检索事实的专利分析,之后结合知识产权布局现状对人工智能企事业单位面临的知识产权实务问题进行了一定的分析和探讨。在 2019 年白皮书初步形成的“内涵定义-专利检索和分析-知识产权实务”的结构框架下,2020 年课题组进一步扩大规模,50 余家单位参与进来,进行全面而细致的讨论和事实补充,形成了中国人工智能产业知识产权白皮书 2020II(以下简称“
4、2020 白皮书”)。2020 白皮书第一章和第二章从基础层、感知认知层、行业应用层、综合运用层 4 个层面 22 个子主题,展现当下人工智能全产业链的产业发展状况和专利布局趋势;第三章至第六章内容覆盖人工智能知识产权管理工作的主要环节知识产权创造、运用、保护、风险防控,成为人工智能领域知识产权相关实务工作的实操指南。2021 年,仍有 50 家左右单位参与白皮书的制作。针对白皮书篇幅庞大的问题,课题组对知识产权白皮书形式进行了革新:根据主题的不同,将白皮书总体划分成三个分册和一个案例选编,形成 中国人工智能产业知识产权白皮书 2021的分册一:产业专利分析白皮书(简称“专利分析白皮书”)、分
5、册二:数据治理白皮书(简称“数据治理白皮书”)、分册三:知识产权管理白皮书(简称“知识产权管理白皮书”)和附录:知识产权优秀案例选编(简称“案例选编”),其中:专利分析白皮书重点在于人工智能基础层、感知认知层和行业应用层上的技术和专利分析,展现人工智能在产业链上的发展状况和专利布局趋势,除了提供术和专利分析,展现人工智能在产业链上的发展状况和专利布局趋势,除了提供权威统计数据和分析结论外,还延续了 2019 年、2020 年白皮书的传统,即专利检索式、检索策略、数据来源等信息全部公开,充分体现了编纂作者的奉献精神与白皮书的公开透明。相较于往年,白皮书紧跟 AI 热点技术,在行业应用层中新增了智
6、能媒体、智慧城建两个新型领域的专利分析:数据治理白皮书聚焦于当前热点的人工智数据治理话题,介绍了全球人工智数据相关政策、数据合规和安全风险及其应对措施,并提供了丰富的案例和解析来力争让人工智能从业者从中获得启发,指导实践工作,尽量避免触犯法律红线,这也是课题组在历届白皮书中首次对人工智能数据治理这一主题进行系统地研究和介绍;知识产权管理白皮书侧重于人工智能企事业单位对知识产权的高质量质创造、保护、许可运营、开源、技术秘密等方面的管理,包括高价值专利培育、应对海外审查规则、标准必要专利及其许可、风险防控、专利商标技术秘密的保护、管理体系的高质量建设等方面的研究等,并提出相关的实务工作建议。III
7、2022 年,依托之前工作基础和经验,整合了超过 80 家 AI 与科研机构、知识产权服务机构,超过 120 位的专家配合制作此次白皮书。本次白皮书与之前的白皮书相比,做了侧重点的较大调整,由知识产权分析转向技术应用趋势分析。我们从技术成熟度和产业应用方向,面向智能客服、智能网络、智能家居、智慧金融、智慧教育、智能服务机器人等,形成十四个产业组,着重围绕人工智能产业化应用的成熟度进行分析,探讨其现状和未来发展的趋势。本次白皮书的一个重要贡献是提出了一套技术应用成熟度分析的方法论和表达方式,并依据实际数据进行了量化分析。本次白皮书发布的是研究成果的整体介绍缩略版,供研究和从业者了解人工智能在各个
8、领域的技术成熟度概况,期待为各行业的发展提供有益的参考和指导。IV中国人工智能产业知识产权白皮书 2022编写单位中国人工智能产业知识产权白皮书 2022编写单位主编:主编:上海交通大学苏州人工智能研究院 俞凯中国信息通信研究院知识产权中心 李文宇组织单位:组织单位:中国人工智能产业发展联盟(AIIA)牵头单位:牵头单位:上海交通大学上海交通大学苏州人工智能研究院VABOUT THE CONTRIBUTORSABOUT THE CONTRIBUTORS关于贡献者本报告中的撰写内容、案例素材、专利检索与分析是由国内各个行业专业的AI 企业、重要科研机构以及知识产权服务机构的大量专家们共同完成的,
9、他们对 AI 领域的知识产权及相关问题持有最专业的观点。在此对他们的贡献表示由衷的感谢!同时,白皮书的编辑过程还要特别感谢上海交通大学组织专题小组对于白皮书编纂的大力支持,他们是:周杨杰、赵梓涵、陈志、奚彧、邱一航、杨云帆、徐涵霖、黄文思、雷佳怡、王崇华、胡冠宸。该小组中的老师和同学在文献整理编辑、研究方法论以及研究结论的支撑方面做出了重要贡献。他们的努力和专业知识为我们的白皮书提供了宝贵的支持和帮助,衷心感谢他们的付出和奉献!VI目录第一章 人工智能概述.11.1 人工智能定义.11.2 人工智能分类.31.2.1 行业分类.3本章小结.8第二章 分析方法论及综合产业应用成熟度分析.9引言.
10、92.1 综合产业应用分析.92.1.1 主要 AI 技术大类及综合产业应用.102.1.2 技术成熟度分析方法.102.1.2.1 学术界与产业界成果四象限图.112.1.2.2 热度-供给图与阶段-供给图.12第三章 智慧金融.153.1 产业定义.153.2 主要技术点分类.163.3 主要技术在产业的应用.163.4 产业技术成熟度分析.213.5 技术分析.23第四章 智能家居.334.1.产业定义.334.2.主要技术点分类.34VII4.3.主要技术在产业的应用.354.4.产业技术成熟度分析.394.5.技术分析.41第五章 智慧建筑.705.1.产业定义.705.2.主要技术
11、点分类.715.3.主要技术在产业的应用.715.4.产业技术成熟度分析.755.5.技术分析.77第六章 智慧座舱.886.1.产业定义.886.2.主要技术点分类.896.3.主要技术在产业的应用.896.4.产业技术成熟度分析.946.5.技术分析.96第七章 自动驾驶.1107.1.产业定义.1107.2.主要技术点分类.1107.3.主要技术在产业的应用.1117.4.产业技术成熟度分析.1167.5.技术分析.118第八章 智能服务机器人.126VIII8.1.产业定义.1268.2.主要技术点分类.1278.3.主要技术在产业的应用.1278.4.产业技术成熟度分析.1348.5
12、.技术分析.136第九章 智能客服.1739.1.产业定义.1739.2.主要技术点分类.1749.3.主要技术在产业的应用.1759.4.产业技术成熟度分析.1889.5.技术分析.190第十章 智慧教育.20610.1.产业定义.20610.2.主要技术点分类.20710.3.主要技术在产业的应用.20810.4.产业技术成熟度分析.21210.5.技术分析.214第十一章 智慧出行.22711.1.产业定义.22711.2.主要技术点分类.22711.3.主要技术在产业的应用.22811.4.产业技术成熟度分析.231IX11.5.技术分析.233第十二章 智慧医疗.24012.1.产业
13、定义.24012.2.主要技术点分类.24012.3.主要技术在产业的应用.24112.4.产业技术成熟度分析.24912.5.技术分析.251第十三章 云计算.26713.1.产业定义.26713.2.主要技术点分类.26813.3.主要技术在产业的应用.26913.4.产业技术成熟度分析.27213.5.技术分析.274第十四章 电商及零售.28014.1 产业定义.28014.2 主要技术点分类.28014.3 主要技术在产业的应用.28014.4 产业技术成熟度分析.28414.5 技术分析.286第十五章 基础软硬件和智慧网络.29515.1 基础软硬件.29515.1.1 产业定义
14、.295X15.1.2 主要技术点分类.29615.1.3 主要技术点知识产权统计.29715.1.4 产业技术成熟度分析.29815.2 智慧网络.30015.2.1 产业定义.30015.2.2 主要技术点分类.30115.2.3 主要技术点知识产权统计.30115.2.4 产业技术成熟度分析.303第十六章 总结.3051第一章 人工智能概述第一章 人工智能概述1.1 人工智能定义人工智能并非诞生于现代。事实上,它的起源可以追溯到古希腊时期甚至更早,始于人类膜拜神灵的古老愿望。在希腊神话中,赫菲斯托斯是赫拉和宙斯的儿子,他出生时身体虚弱,在被抛到了奥林匹斯山上后,被爱琴海岛屿利姆诺斯岛人
15、所救,长大后的赫菲斯托斯制造了一个魔法宝座。该宝座具有现代人工智能的特征:为助人们实现某个目标,能够根据情况提前编程并以不同方式作出响应。亚里士多德(公元前 384 年-322 年)是精确制定规则的第一人,他开发的非正式三段论,在原则上允许人们能够在给定的初始前提下机械地得出结论。现代人工智能的种子是最初由古典哲学家种下,他们试图将人类思维过程描述为机械符号并操纵。这种思想一定程度促进了 20 世纪 40 年代可编程数字计算机的发明,并激发了后续讨论建立电子大脑的可能性。经过多年的发展,人工智能已经发展成为一门覆盖领域十分广泛且极富挑战性的技术科学,也正因如此,人工智能的定义到现在依旧是百家争
16、鸣,但其核心思想却始终如一像人类一样思考的机器。人工智能最早是由麻省理工学院的John McCarthy在1956年达特茅斯会议上提出的,McCarthy 将其定义为:人工智能就是让机器的行为看起来像是人所表现出的智能行为一样(McCarthy 1956)。图灵奖得主 Edward Feigenbaum把人工智能定义为:人工智能属于计算机科学的一个分支,旨在设计智能的计算机系统,即对照人类在自然语言理解、学习、推理、问题求解等方面的智能行为,人工智能所设计的系统应呈现出与人类行为类似的特征(Feigenbaum etal.1981)。玛格丽特博登在人工智能哲学一书中就目前四种最为流行的人工智能
17、定义进行了归类和辨析,分别为:(1)人工智能就是让计算机去做人类需要运用智能才能做的事;(2)研究怎样制造计算机,并为其编程,使其能做心灵所能做的那些事情;(3)人工智能是计算机的发展,而计算机的外在性能具有我们认为是属于人类心理过程的那些特征;(4)人工智能是一种一般性的智能科学,是认知科学的智力内核,它的目标是提供一个系统的理论,既可解释意向性,也可以解释以此为基础的各种心理能力。其中,玛格丽特认为前三种定2义各自有其偏颇和缺陷,只是对技术的表层功能进行了阐释,没有上升到理论和哲学的高度,而第四种定义则能够从心理认知的角度进行阐释。我国学者在人工智能的定义上也是各引一端。中国科学院院士、清
18、华大学人工智能研究院院长张钹认为人工智能是利用机器去模仿人的智能行为,这些智能行为包括推理、决策、规划、感知和运动。中国科学院院士、中国科学院自动化所研究员谭铁牛认为人工智能是一门以探寻智能本质、研制具有类人智能的智能机器为目的,以模拟、延伸和扩展人类智能的理论、方法、技术及应用系统为内容,以会看、会说、会行动、会思考、会学习为表现形式的学科(谭铁牛,2018)。中国通信学会将人工智能定义为:研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学,将其视为计算机科学的一个分支,指出其研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等(张 et al.20
19、18)。人工智能标准化白皮书 2018中认为人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统(Cesi,2018)。目前,为人工智能进行普适性定义比较困难,且从时间的维度来看,人工智能的内涵仍在不断丰富和发展,涵盖的领域也越来越多。正如前美国麻省理工学院人工智能实验室主任 Patrick Winston 所述,当前给出一个一般性的人工智能定义似乎是不可能的,因为智能似乎是一个包含着许多信息处理和信息表达技能的混合体(Winston and Shellard,1990)。目前,学界的共识多为“让计算机为
20、人类做各种各样的事情”且“人工智能是建立在现代算法基础上,以历史数据为支撑而形成的具有感知、推理、学习、决策等思维活动并能够按照一定目标完成相应行为的计算机系统”。近期,以 ChatGPT 为典型的通用人工智能(AGI)引起了广泛关注。通用人工智能一直是人工智能研究领域备受关注和争论的话题,尤其是自 GPT-4 推出以来。AGI 代表着在软件中模拟人类认知能力,使系统能够找到解决不熟悉任务的方法。其最终目标是能够执行人类可以完成的任何任务,特别是在自然语言理解方面。然而,目前并没有一个全球公认的通用人工智能的定义。通用人工智能的例子有很多,比如自动驾驶汽车、无人机机器人,甚至像 ChatGPT
21、-4 这样的聊天机器人。31.2 人工智能分类1.2.1 行业分类人工智能已经渗透进我们生活的角角落落。近年来,人工智能已经被提升到国家战略高度,在“新基建”背景下,人工智能为智能经济的发展和产业数字化转型提供底层支撑,推动人工智能与 5G、云计算、大数据、物联网等领域深度融合,由此衍生出更多的应用场景,加速人工智能与数字经济融合的进程。综合人工智能与各行业融合应用情况,我们将人工智能行业划分为服务机器人、自动驾驶、基础软硬件、智能座舱、云计算、电商及零售、智慧医疗、智能客服、智慧网络、智能家居、智慧建筑、智慧出行、智慧金融、智慧教育十四个一级行业分支,以及每个行业分支衍生的二级行业分支,如图
22、 1 示出。图 1:一级行业分支和二级行业分支的简图4该分支简图是基于中国人工智能产业知识产权白皮书(2021)报告中的行业分类图来进行修改的。相较 中国人工智能产业知识产权白皮书(2021),本白皮书报告中,人工智能行业分类删除了智能媒体、智慧农业、智慧城建、智能防疫应用等,新增了服务机器人、基础软硬件、云计算这几个全新的领域;将智能座舱、智慧出行和自动驾驶进行了分离界定,分别覆盖不同的领域。智能服务机器人智能服务机器人智能服务机器人是在非结构环境下为人类提供必要服务的多种高技术集成的智能化装备。近年来,随着人工智能、5G、云计算、物联网、大数据的快速发展,以及场景需求的不断拓展,在包括计算
23、机视觉及语音交互、伺服驱动器、定位导航、运动规划及控制等技术的加持赋能下,具有感知、分析及处理来自外部环境的信息等智慧能力的成为智能服务机器人的标配。从应用场景和产业发展进行划分,本报告将智能服务机器人产业可以分为面向家庭的消费类服务机器人产业以及面向公共商用环境的商用服务机器人产业两大类,其中又细分为综合家庭助理机器人、家务服务机器人、养老康护机器人、教育娱乐机器人、讲解接待机器人、餐饮酒店机器人、云平台机器人等智能服务机器人子产业。其中,以智能清洁机器人品类为代表的家务服务机器人产业,已经取得了爆发式的发展。中国智能机器人产业起步较晚,但受益于我国产业政策大力支持和引导发展迅速。政府相关部
24、门已颁布一系列利好政策推动智能机器人产业的发展,中国服务机器人的销售额增速持续高于全球服务机器人销售额增速,保持良好增长态势。基础软硬件基础软硬件基础软硬件,通常是指 AI 基础软硬件,是人工智能算法与硬件平台相结合,实现更高效的计算和更快的响应速度的软硬件系统,它包括 AI 芯片(如 NPU、GPU 等)、芯片使能(如昇腾 CANN、英伟达 CUDA 等)、AI 计算框架(如Pytorch、MindSpore 等)、开发使能及工具等。AI 芯片是专门用于处理人工智能应用中大量计算任务的模块,主要有 NPU、GPU 等类型。GPU 是通用芯片,经过软硬件优化可以高效支持 AI 应用。NPU5是
25、专门为 AI 产品或服务而设计的芯片,主要是侧重加速机器学习(尤其是神经网络、深度学习),这也是目前 AI 芯片中最多的形式。目前全球 AI 芯片市场上,华为、英伟达、英特尔、AMD 等公司都在研发和生产 AI 芯片,其中,华为的昇腾系列芯片已经成为全球领先的 AI 芯片之一。AI 框架是一种软件框架,用于构建、训练和部署人工智能模型。AI 框架提供了一组 API,使开发人员能够构建和训练自己的模型。这些 API 通常包括用于定义模型的函数、用于训练模型的函数以及用于评估模型的函数。AI 框架还提供了一些工具,如可视化工具和调试器,以帮助开发人员更轻松地构建和调试模型。目前主流的 AI 框架有
26、 PyTorch、MindSpore、PaddlePaddle 等,MindSpore是华为开源自研的 AI 框架,支持端边云全场景的深度学习框架,在大模型、AI4S等新方向具备独特优势。总之,AI 软硬件平台是一个集成了各种人工智能开发所需的软硬件资源的系统,可以帮助开发人员更加高效地进行人工智能应用的开发和部署,是人工智能产业的根基。云计算云计算云计算产业是基于云计算技术的一种新型计算模式,它将计算资源、软件工具和数据存储服务等提供给用户,使用户可以通过互联网访问和使用这些资源和服务。云计算产业通过在云端部署和管理计算资源,提供了一种灵活、可扩展和高效的计算模式,为、政府机构和个人用户提供
27、了更加便捷、可靠和经济的计算解决方案。云计算产业包括了各种类型的云计算服务和解决方案,例如基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)等,近些年又因为 AI 技术的蓬勃发展,提出了模型即服务(MaaS)等形式。云计算产业的主要参与者包括了云计算服务提供商、软件开发商、数据中心运营商、网络技术公司、安全服务提供商等,它们通过不断创新和扩展服务范围,推动着云计算产业的快速发展和普及。6智能座舱智能座舱智慧座舱最初运用于飞机上,包括高分辨率显示屏、先进的飞行控制系统、自动化系统、数据链接和人机界面等。智慧座舱旨在提高飞行员的工作效率和安全性,同时减少人为错误和疲劳。近年
28、来,汽车不断向智能化发展。智能座舱、智能驾驶作为汽车智能时代双子星。智慧座舱包括了带给驾驶员和乘客更加安全、舒适、智能的驾乘体验所有模块,包括操控系统、娱乐系统、空调系统、通信系统、座椅系统、交互系统、感知系统等。从车内看,智能座舱是座舱内饰、座舱电子产品的综合创新、升级和联动。智能座舱内饰包括座椅、灯光、空调等,用户可以对座舱内各内饰功能进行控制,伴随语音语义识别、机器视觉等技术的发展,座舱内饰的智能化程度逐渐提升。智能座舱电子产品包括全液晶仪表、车载信息娱乐系统、车联网模块、抬头显示(HID)、流媒体后视镜等汽车电子设备。同时也将与智能手机、手表等实现互联,进而与智慧家庭、智慧办公等场景无
29、缝衔接,助力互联的全面打通,最终实现将汽车由单一的驾驶、乘坐工具升级为一个以消费者为中心的“智能移动空间”。从车外看,智能座舱将通过车联网、无线通信、远程感应、GPS 等技术,与车外的各项基础网联设施、联网设备实现 V2X(Vehicle-to-Everything)联结。感知交通信号、路况、车外娱乐生活场景信号,助力自动驾驶感知层和决策层的工作,进而推动高阶自动驾驶的实现。除此之外,为了提高座舱 AI 算力,模拟人的思考、更懂人、感知人,从而主动精确地提供服务,座舱内部的决策运算工作也将扩展至车外,在车载芯片外建立独立感知层,由云端计算中心统一提供AI 算力。智慧出行智慧出行智慧出行以互联网
30、预约车辆出行为背景,包含智能订单调度,车辆自动驾驶,智能语音交互,实时交通情况预测,出行路径规划等功能需求,以“AI+智慧交通服务”,在传统的出行行业基础上,以人工智能相关技术为助力,改善出行效率及安全性,提高司乘体验,增进产业更新换代,高效保障出行质量。7自动驾驶自动驾驶自动驾驶汽车(Autonomous vehicles;Self-driving automobile)又称无人驾驶汽车、电脑驾驶汽车、或轮式移动机器人,是一种通过电脑系统实现无人驾驶的智能汽车。自动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车
31、辆。1.2.2 技术分类人工智能涉及范围广泛,以技术来分类,目前主要分为(此处参考 21、20年的白皮书内容)通用机器学习、AI 感知、AI 认知、AI 系统四大核心技术分类。通用机器学习通用机器学习通用机器学习是一种机器学习方法,它可以应用于各种不同的任务和领域,而不需要进行大量的领域特定的调整或修改。通用机器学习算法可以从数据中学习模式和规律,并使用这些模式和规律来进行预测、分类、聚类等任务。通用机器学习算法的例子包括决策树、支持向量机、神经网络等。AI 感知AI 感知AI 感知技术是指将物理世界的信号通过摄像头、麦克风或者其他传感器的硬件设备,借助语音识别、图像识别等前沿技术,映射到数字
32、世界,再将这些数字信息进一步提升至可认知的层次。AI 感知技术可以帮助人工智能系统理解和感知周围环境,从而更好地进行决策和行动。例如,计算机视觉技术可以帮助人工智能系统识别图像和视频中的对象和场景,语音识别技术可以帮助人工智能系统理解和转换语音命令,自然语言处理技术可以帮助人工智能系统理解和生成自然语言文本。AI 感知技术是实现人工智能智能化的重要组成部分。AI 认知AI 认知AI 认知是指人工智能系统通过模拟人类的认知过程,实现对信息的理解、推理、学习和决策等高级智能功能。AI 认知技术包括自然语言处理、知识表示8与推理、机器学习、深度学习、推荐系统等。通过这些技术,人工智能系统可以从大量的
33、数据中学习和发现规律,从而实现对复杂问题的理解和解决。AI 认知技术的应用包括智能客服、智能翻译、智能推荐、智能问答等。当前通用人工智能(AGI)高速发展,出现了大模型这一类通用人工智能基础设施建设的热潮,其在认知层的记忆、理解、规划、决策等能力涌现,应用于各种领域,如自然语言处理、计算机视觉、智能交通等。AI 系统AI 系统AI 系统是指一种基于人工智能技术的计算机系统,它可以模拟人类的智能行为和思维过程,实现自主决策、自主学习和自主适应等高级智能功能。AI 系统可以通过感知、认知、推理和决策等环节,对外部环境进行感知和理解,并根据自身的目标和任务,自主地进行决策和行动。AI 系统的应用非常
34、广泛,包括智能客服、智能翻译、智能推荐、智能问答、自动驾驶、智能制造等领域。随着人工智能技术的不断发展和应用,AI 系统将会在更多的领域发挥重要作用。本章小结本章节介绍了人工智能在现代社会中的重要性和应用领域。目前学界普遍认为,人工智能的目标是让计算机能够为人类完成各种任务。人工智能是建立在现代算法基础上的一种技术,通过历史数据支持,具有感知、推理、学习、决策等思维活动。近年来,人工智能已成为国家战略的重要组成部分,在新基建背景下,为智能经济的发展和产业数字化转型提供了底层支撑。人工智能与 5G、云计算、大数据、物联网等领域深度融合,衍生出更多的应用场景。我们将人工智能行业划分为智能制造、智慧
35、教育、智慧金融以及智能家居、智慧物流、智慧交通、智慧医疗等十六个一级行业分支,并介绍了每个行业分支的二级衍生分支。此外,我们还将以技术进行关键点分类,包括通用机器学习、AI 感知、AI 认知、AI 系统。按照这样的分类,我们会在各个章节的框架中进行应用。9第二章 分析方法论及综合产业应用成熟度分析第二章 分析方法论及综合产业应用成熟度分析引言引言随着人工智能技术不断进步和创新,人工智能的应用范围越来越广泛,从智能客服到智能家居,从智能制造到智能农业,无处不在。然而,人工智能的产业化应用成熟度却是一个备受关注的问题。本次白皮书将侧重点由知识产权分析转为人工智能产业化应用的成熟度分析,探讨其现状和
36、未来发展的趋势。期望通过深入研究人工智能在各个领域的应用情况,我们可以更好地了解人工智能产业化应用的现状,并为各行业的发展提供有益的参考和指导。为了能够科学、量化的分析技术成熟度,我们提出了一套完整的分析方法论和可视化工具,通过四象限图分析、对比图分析、和热度-供给图与阶段-供给图三种分析工具,分析人工智能在各个领域的产业应用成熟度,提供整体技术的宏观图景,推动人工智能在行业应用落地方面的创新和发展。让我们一起探索人工智能产业化应用的成熟度,为未来的科技发展描绘出更加美好的蓝图!2.1 综合产业应用分析人工智能的综合产业应用分析是指对人工智能在各个行业和领域中的广泛应用进行全面评估和分析的过程
37、。它涉及对人工智能技术在不同行业中的应用情况、技术成熟度、发展趋势等方面进行综合考察和研究。在人工智能的综合产业应用分析中,研究人员会通过收集和整理相关行业中人工智能应用的对应技术点知识产权情况和学术论文,分析其人工智能技术的发展趋势、创新方向等,通过人工智能的综合产业应用分析,可以帮助和决策者更好地了解人工智能在不同行业中的应用潜力,为相关行业的发展提供指导和决策支持。此外,该分析也有助于推动人工智能技术的创新和进步,促进人工智能产业的健康发展。102.1.1 主要 AI 技术大类及综合产业应用人工智能技术已经在各个领域产生了深远的影响。在产业界,AI 技术的应用已经成为一种趋势,它正在改变
38、着我们的生产方式、商业模式和市场格局。综合人工智能技术与各产业融合应用情况,下图示出了 AI 技术在产业应用的简图。AI 技术在产业应用的简图2.1.2 技术成熟度分析方法技术成熟度分析方法是评估一项技术在产业化上成熟度或发展阶段的方法。数据源:数据源:分析的数据来源一方面是通过面向各细分行业征集核心技术点,通过知识产权搜索工具和核心期刊、论文查询工具得到对应的统计数据集;另一方面是通过面向各细分行业专家、学者进行问卷调研,进行主观判断相对应技术点所处于的阶段,该阶段参考了 Gartner 技术成熟度曲线将技术的发展分成了五个11阶段(萌芽期、膨胀期、破灭期、爬升期、成熟期),并对应进行打分(
39、1-5 分),形成对应数据集。分析工具:分析工具:本文引入了两种分析工具:四象限分析、热度-供给图与阶段-供给图,以下具体介绍。2.1.2.1 学术界与产业界成果四象限图四象限图是一种常用的工具,本文中我们将学术界和产业界相关产出进行分类和可视化,表示为横坐标和纵坐标,形成了一个由四个象限图,它们分别代表:产业关注产业关注:这个象限位于第一象限,是相对应的技术点备受产业界关注,相关产业方向的知识产权产出比较多,而学术论文较少;大众关注大众关注:这个象限位于第二象限,是相对应的技术点备受产业界和学术界关注,相关产业方向的知识产权产出和学术论文均较多;小众关注小众关注:这个象限位于第三象限,是相对
40、应的技术点在产业界和学术界相关产出均较少,相关学术论文和产业方向的知识产权均较少;学术关注学术关注:这个象限位于第四象限,是相对应的技术点备受学术界关注,相关学术论文产出较多,而产业方向的知识产权较少。学术界与产业界成果的四象限示例图12该图意在对比不同技术点在学术界与产业界的研究情况与热度。我们通过近十年知识产权的数量来反应相关技术点在产业界的研发热度,通过近三年论文的数量来反应相关技术点在学术界的研究热度,以论文数量作为横坐标、知识产权数量作为纵坐标绘制成学术界与产业界成果四象限图(以下简称四象限图)。对于每个产业方向,我们分别以论文数和知识产权数的对数平均值作为不同象限的分界线。通过四象
41、限图,我们可以大致看出在该产业方向中,学术界与产业界对不同技术点的关注情况。具体来说,位于四象限图中第一象限的技术点受到了学术界和产业界的一致关注,这一定程度上可以反映出该技术点正处在蓬勃发展的过程中,在前沿技术和落地应用上均有很大的提升和研究空间,同时也反映出该技术点在实际的应用场景中具有较高的价值。而位于第二象限中的技术点则更多的受到了产业界的关注,在学术界中对于它们的研究相对较少,这可能是因为相关技术在学术研究的角度上已经相对成熟,相对更需要的是与实际场景结合的适配工作,也可能是相关问题刚刚从实际的应用场景中被抽象和归纳出来,暂时没有进入学术界的视野中;相反,在第四象限中的技术点则更多被
42、学术界关注,这可能是学术界的研究相对超前暂时不能被应用到实际生产生活中导致的。具体导致二四象限中的点呈现出这种学术界和产业界的关注度和热度不相匹配的原因可能是多种多样的,前文仅仅列举出了部分常见的原因,在之后对具体的产业方向的四象限图进行分析的过程中会进行更加有针对性的分析。最后,位于第三象限的技术点的热度在两个界别中均相对较低,导致这种情况发生的原因也有许多可能,例如:相关技术点趋于成熟,剩余未解决的问题都相对困难和棘手;技术点处在萌芽阶段,还未被广泛关注等。2.1.2.2 热度-供给图与阶段-供给图数据定义数据定义:为了更加准确的反映各个技术点的研究热度以及产学供给情况等,我们设计了调查问
43、卷,邀请学术界的研究专家和产业界的产业专家对技术点所处阶段、产业界和学术界的热度、产学供给情况进行主观打分。考虑到数据离群的13干扰,会对于参与调研的专家提出要求,并结合行业情况进行评分,截止撰稿时,共收集到数百份有效调研材料。技术点所处阶段技术点所处阶段:技术点所处的阶段是参考 Gartner 技术成熟度曲线将技术的发展分成了五个阶段,萌芽期、膨胀期、破灭期、爬升期、成熟期。产业界和学术界的热度产业界和学术界的热度:热度大致被分为了五个等级,其中 3 代表了技术点所属的产业方向的平均热度、1 代表热度最低、5 代表热度最高。产学供给情况产学供给情况:产学供给情况也被大致分为了五个等级,其中
44、3 代表了技术点所属产业方向供给的平均水平、1 代表供给最少、5 代表供给最多。阶段-供给示例图14热度-供给示例图在具体绘图前,考虑到数据的代表性问题,我们筛选掉了收集到的问卷少于10 个的技术点。对于剩余的技术点,根据相应问卷得到的评价的平均和方差情况,绘制了热度-供给图与阶段-供给图。在图中,椭圆的中心位置代表了相应指标的平均水平,而椭圆的两轴的长度代表了相应指标的方差情况。15第三章 智慧金融第三章 智慧金融3.1 产业定义近年来,信息科技的发展取得了长足进步,云计算、大数据、移动互联网、区块链、物联网以及以深度学习、数据挖掘、机器学习等为首的人工智能技术日益成熟,相关技术的广泛应用使
45、人类社会从电子化、信息化、网络化、数字化正式逐步迈向智能化时代。同时,现代金融消费者对于金融产品与服务的时效性、便捷性、个性化、智能化、定制化等方面的需求逐渐提高,加快了金融产品创新加速。随着信息技术与金融的深入融合,智慧金融应运而生。智慧金融依托于互联网技术,运用大数据、人工智能、云计算等科技手段,打造金融产品和服务模式,使金融行业的业务流程、客户服务方面得到全面的提升,实现金融服务、营销、运营、风控的智慧化。智慧金融的参与者不仅包括为金融机构提供人工智能技术服务的,也包括传统金融机构、监管机构等,这些参与者共同构建了智慧金融生态圈。国务院于 2017 年 7 月印发的新一代人工智能发展规划
46、中首次正式提出要发展“智能金融”,要求“创新智能金融产品和服务,发展金融新业态”;工业和信息化部于 2017 年 12 月印发的促进新一代人工智能产业发展三年行动计划(2018-2020 年)中也提出要积极培育人工智能创新产品和服务,促进人工智能技术的产业化,推动智能产品在金融领域的集成应用。在众多产业政策接连出台的背景下,智能金融的蓬勃发展带来了产品与服务不断突破创新,以最新科技支撑的智能金融使得金融体系和商业模式的运行发生了重大的变革。智慧金融将成为未来金融产业创新和转型的重要发展趋势,也是提升金融业整体效率的必经之路。163.2 主要技术点分类3.3 主要技术在产业的应用3.3.1 智能
47、营销利用人工智能,结合线上和线下消费渠道数据,采用多模型的方式,实现用户精准的画像系统及实时的消费倾向分析,给予最匹配的消费推荐;以大数据、人工智能技术为基础,及时、准确识别用户需求,提供个性化的营销方式有效触达人群,实现人货场的最佳匹配,提升营销效率,降低营销成本。173.3.2 智能服务利用语音识别、语音生成、自然语言处理、大数据及深度学习等技术,基于用户历史信息智能挖掘用户需求,为用户主动提供精准、高效服务;通过自然语言处理技术理解用户需求,通过语音、文字等多种交互模式,解决用户在使用产品或服务中遇到的问题,以更低的成本为用户提供 24 小时高效满意服务。3.3.3 智能运营利用人工智能
48、、大数据等技术,根据客户需求进行精准推荐,提供个性化产品和服务,提升产品和服务质量;利用大数据技术,对内部数据和外部数据深入分析,通过自动化技术将不必要的重复工作自动化,减少成本提高效率。3.3.4 智能风控智能风控是金融科技的重要应用领域之一,也是一种精益风险管理模式,通过将大数据、云计算、人工智能等新一代信息技术综合应用到金融业务的风险控18制环节,提升风险管理效率,有效降低服务及运营成本,是金融科技通过风险控制环节显现起自身价值的具体体现形式。3.3.5 智能投顾综合利用分析、预测、决策技术,为投资者提供个性化的投资建议和资产配置方案。AI 技术会依据对用户风险承受能力、投资目标、投资期
49、限等因素,利用博弈优化算法为用户设计投资组合策略。在 AI 算法的加持下,投资策略会根据用户需求及对市场总体情况的研判进行动态调整,可提升人工投资顾问的服务效率,同时提升投资策略防风险增收益的效果。在智能投顾场景需要解决的预测和决策问题包括。预测问题主要涉及以下几类需要预测的指标:19常用的预测方法如下:在预测结果的基础上,需要根据用户的偏好及资金约束等建立决策模型,输出针对性的投资决策。该类技术主要基于博弈及运筹类优化方法,常用优化方法如下:3.3.6 智能投研利用先进的数据分析和挖掘技术为专业投资人员(如基金经理、研究员等)的投资研究提供支持。主要是帮助专业投资人员搜集金融数据、挖掘潜在的
50、投资机会、预测市场走势等。智能投研服务的主要目标是提升专业投资人员投资决策的准确性和效率。基于 AI 技术,可以为专业投资人员提供更丰富、清晰、低噪声、高信息含量的数据,还可以在此基础上提供预投资决策相关的投资环境各维度的预测结果,还可以通过实时检测方法提示异常事件,剖析事件形成的原因,推演事件的影响范围及强度。这些信息为专业投资人员的投资研究提供了必不可少的数据支撑。20除了在智能投顾领域需要研判的各类指标走势外,还特别需要关注重点的风险、舆情等相对基础的信息。相对来说,挖掘、预测、归因类方法用处较大,博弈优化类方法利用率较低。主要技术需求如下:3.3.7 智能监管以人工智能、大数据技术、云
51、计算技术为支撑丰富金融监管手段,多维度数据分析实现异常交易和风险主体的识别,为监管提供智能化参考依据,提高监管机构应对变化能力。同时,通过区块链和隐私计算技术驱动的智能监管方案,便携性的帮助监管机构改变监管数据采集模式,实现了信息共享,减低了监管成本,避免了数据被伪造篡改及泄露的风险,保证监管合规性。213.4 产业技术成熟度分析3.4.1 学术界与产业界成果四象限图223.4.2 热度-供给图与阶段-供给图233.5 技术分析3.5.1 联邦学习主要专利情况主要专利情况目前专利主要聚焦安全与隐私保护方向,以及机器学习、模型训练等方面。全球受理的联邦学习专利数量高达 2 万余件。应用趋势应用趋
52、势目前,联邦学习在金融行业的应用处于框架设计和合作探索的阶段,联邦学习能够实现跨行业和跨机构的数据安全融合,提高金融行业的整体反欺诈和风控能力。经过多年发展,联邦学习在金融行业上主要聚焦于信贷风控、营销风控、零售营销、小微服务、反洗钱监管。例如,在金融反欺诈应用中,借助该技术可以在保护数据安全和用户信息隐私的前提下,联合多个外部机构实现跨行业和跨机构的反欺诈建模。在信贷风控场景中,由于个别机构存在数据稀缺、信息不全面等问题,利用联邦学习技术可以融合多源信息丰富建模特征,共同提升风控能力。虽然联邦学习在金融行业已经形成了典型应用,但未来发展上,产业应在不断磨合和优化的过程中,推动联邦学习步入开放
53、通用的阶段,共同打造联邦数据网络的生态。3.5.2 多方安全计算主要专利情况主要专利情况目前专利主要聚焦数据信息检索、数据保护、加密通信、密钥分发等方面。全球受理的多方安全计算专利数量达 3000 余件。应用趋势应用趋势近年来国内外多方安全计算在金融产业化应用的步伐明显加快。从整体发展情况看,国外多方安全计算产品形态仍处于初级阶段,而国内产品蓬勃发展,形成一定有优势。目前,多方安全计算在金融行业的主要应用场景包括普惠金融、智能风控、智能营销、反洗钱和资产管理等。例如在智能风控场景中,借助多方安全计算可以保护用户信息不泄露的情况下将更多维度数据纳入联合风控模型24中,从而构建更加精准的风控模型。
54、多方安全计算是解决数据安全共享的理想技术方案,但在金融行业的落地应用上还存在难点,需要不断探索解决。针对多方安全计算的应用研究分析,未来发展将主要集中在性能优化和应用扩展这两方面。在性能优化上,多方安全计算通常会带来高额的通信和计算成本,在安全模式下保证现实可用的性能是亟需探索的问题。在应用扩展上,多方安全技术实现的应用相对有限,在联合统计和查询上尤为明显,对于一些复杂业务需求的解决能力还有待提升。3.5.3 可信执行环境主要专利情况主要专利情况目前专利主要聚焦可信平台完整性维护、安全通信、内外部计算机组件保护等方面。全球受理的可信执行环境专利数量高达 22 万余件。应用趋势应用趋势可信执行环
55、境是一个涵盖硬件、软件及服务的安全区域,在这个区域内对隐私数据进行计算。在金融行业上的应用主要是通过可信、抗篡改的软硬件为各个金融场景构建一个可信的安全环境。例如,在联合金融风控场景中,需要不同的机构参与提供各自领域的数据进行联合计算,这样容易造成用户信息和数据资产的泄露,利用可信执行环境,不同机构之间可以在不泄露原始数据的前提下联合进行风控评估,提高业务效率和安全性。在未来发展过程中,虽然具备通用性好、性能高等优势,但仍需要进一步提升可信执行环境技术的普及度和可信度。随着国内在重要领域自主可控的要求逐步提高,如何将可信执行环境发展为自主可控的技术并落地金融业务中,成为了未来发展重点关注的话题
56、。3.5.4 因果推断主要专利情况主要专利情况与因果推断相关的专利共 161 篇,研发历程主要分为两个阶段,首先 2012年-2017 年为摸索阶段,该阶段专利数均为 2-3 篇,2018 年-2022 年为发展阶段,专利数量迅速提高至 50 篇。25应用趋势应用趋势因果推断技术应用范围较广,目前已广泛运用于各大政府机构、金融机构、互联网的策略分析业务之中。因果推断方法从传统计量经济学方法如双重差分模型、合成控制法、断点回归模型等逐渐补充了表示学习、随机因果推动等机器学习模型。其应用领域由简单的学术评估的归因分析细化分为以下四大研究场景:一、非实验场景策略效果评估:人为创造一个虚拟对照组与策略
57、上线数据做比较估计策略真实效果,如城市政策效果评估;二、实验场景下的正向用户下探:探究策略对于不同用户的异质性影响(HTE),更好的归因和理解不同的用户群,如根据现有高活客户数据进行潜客挖掘。三、策略敏感人群探究,挖掘客户弹性差异化实施优惠政策。四、因果影响指标分析,用于剖析不同变量对政策效果的异质性影响效果。3.5.5 预测推演主要专利情况主要专利情况因为专利法较少保护社会经济领域的技术研究,所以此类技术申请专利较少,发表论文较多。但是工程领域的模拟仿真技术专利申请数量很大,每年约有几千项专利的申请,而且近几年也呈爆发趋势。26应用趋势应用趋势在 2000 年后爆发了预测和推演技术的应用热潮
58、。但是目前这些技术还大多停留在学术研究领域,指导实际决策的较少。目前业界在关注了预测对社会经济的应用外,开始逐步头像策略仿真与推演的应用研究。随着数字化转型进程的推荐,数据采集挖掘应用逐渐成熟,决策仿真推演技术将在此基础上发挥重大作用,指导决策者在虚拟系统下进行仿真实验,降低实际试点带来的风险和损失。3.5.6 时间序列预测主要专利情况主要专利情况应用趋势应用趋势数字化转型前期主要是数据采集、结构化处理、分析加工技术的应用。现阶段,数字化将迈向智能化节点,预测及决策(强化+博弈+运筹优化)技术将发27挥更加重要的作用。在智能化转型的过程中,一般是先爆发预测需求、进而是模拟推演和决策类的需求。3
59、.5.7 深度强化学习主要专利情况主要专利情况应用趋势应用趋势如前所述,在 2019 年后爆发了广泛的应用需求。但是目前还大多数在游戏领域,真实决策场景下的应用将会在近几年爆发。3.5.8 多智能体博弈主要专利情况主要专利情况28应用趋势应用趋势如前所述,在 2019 年后爆发了广泛的应用需求。但是目前还大多数在游戏领域,真实决策场景下的应用将会在近几年爆发。基于此类技术,直接服务与社会管理、经济金融系统管理场景智能决策领域的,还没有代表产品出现。3.5.9 运筹优化主要专利情况主要专利情况运筹优化是个很大类的技术领域,上图显示的是其中一类方法鲁棒优化技术的申请情况应用趋势应用趋势该技术应用较
60、多,在路径规划(如美团、滴滴),港口调度、路网交通中有较大的应用。目前已经出现基于此类技术的决策支持产品,这里产品的市场空间巨大,目前刚从起步进入成长期。3.5.10 多模态算法主要专利情况主要专利情况多模态技术在过去几年中取得了显著发展,吸引了众多公司和研究机构的关注。这导致了多模态领域的专利申请数量不断增加。这些专利涵盖了多模态技术29在各种场景和应用中的应用,包括计算机视觉、语音识别、自然语言处理、人机交互等。其中,一些主要的技术巨头,如谷歌(Google)、微软(Microsoft)、苹果(Apple)、亚马逊(Amazon)和腾讯(Tencent),在多模态领域拥有大量的专利。这些公
61、司在多模态技术的研究和开发方面投入了大量资源,以期在智能设备、虚拟助手、自动驾驶等领域取得竞争优势。多模态技术的专利主要涉及以下几个关键领域:计算机视觉(Computer Vision):这个领域涉及图像和视频处理技术,用于识别、分析和理解图像内容。专利可能涉及目标检测、场景识别、人脸识别和动作识别等技术。自然语言处理(Natural Language Processing,NLP):该领域包括文本分析和生成,以及与语言相关的技术。专利可能涉及情感分析、文本摘要、机器翻译、对话系统等应用。语音识别(Speech Recognition)和语音合成(Speech Synthesis):这些领域涉
62、及音频数据的处理和生成。专利可能包括不同语言和口音的语音识别技术,以及用于生成自然、流畅语音的语音合成技术。人机交互(Human-Computer Interaction,HCI):这个领域关注如何使计算机系统与用户更自然、更高效地进行交互。专利可能涉及手势识别、触觉反馈、眼动追踪等技术。多模态融合技术:这个领域关注如何将不同模态的数据结合在一起,实现更高级别的信息提取和表达。专利可能包括多模态数据融合算法、多模态情感识别等应用。随着技术的发展和应用需求的变化,上述领域可能会出现更多新的专利方向。应用趋势应用趋势多模态技术(Multimodal technology)是一种用于处理多种信息来源
63、的技术,它可以理解、处理、生成和整合来自不同模态(视频图像、声音、文本等)的数据。通过同时分析和整合这些不同类型的数据,多模态技术可以实现更高级别的信息提取、理解及内容生成。30例如,在人工智能(AI)领域,多模态技术越来越多地被用于以下任务:1.图像描述(Image Captioning):根据图像内容自动生成描述性文字。2.视觉问答(Visual Question Answering):通过分析图像内容和用户提供的文本问题,生成相关的答案。3.图像、语音、视频合成(Image,Speech,Video Synthesis):将文本提示转换为相应的图像、音频及视频。4.虚拟人(Virtual
64、 Being):通过实现具备多模态感知和交流能力的虚拟人,来实现更自然的人机交互系统。由于人的感知是多模态的,所以多模态技术在许多应用领域具有广泛的应用前景,包括自动驾驶、智能手机应用、虚拟现实(VR)和增强现实(AR)等。利用多模态技术,AI 系统将可以更好地理解现实世界,并为用户提供更丰富、更准确的信息和服务。3.5.11 声纹识别主要专利情况主要专利情况2012 年起,声纹识别技术的国内相关专利公开数量呈大幅上升,七年间(2011-2018)已近翻了 10 倍,并一直保持高位水平。应用趋势应用趋势声纹识别有文本相关和文本无关的两种,各自包含声纹确认、声纹辨认两类。31随着 2018 年央
65、行移动金融基于声纹识别的安全应用技术规范的颁布,以及 2019 年金融科技产品认证的出台,金融业继续稳居声纹识别产业的第一大民用领域。截止 2020 年下旬,约有 30 家银行机构采购了声纹识别技术产品。(*数据来源于中国声纹识别产业发展白皮书 2.0)生物识别技术正逐渐成熟并进入大规模应用阶段。随着 3D 传感器的快速普及、多种生物特征的融合,每个设备都能更聪明地“看”和“听”。生物识别和活体技术也将重塑身份识别和认证,数字身份将成为人的第二张身份证。由于不同场景对生物特征的适应性各有不同,基于多模态的解决方案代表了一个新兴趋势,多生物特征识技术融合已经成为必然。国际标准化组织(ISO)和国
66、际电工委员会(IEC)已经联合公布了信息技术生物特征多模态和其他多生物特征融合(ISO/IECTR247222007),该方案能融合多种生物指令,以保证在一种生物特征失真的情况下,仍能顺利识别。此外将多种识别方式叠加起来,攻击成本会急剧上升,从而带来安全性上升。这有助于降低金融诈欺所造成的损失,确保用户信息或数据安全。第五代移动通信技术将使移动带宽大幅度增强,提供近百倍于 4G 的峰值速率,促进基于 4K/8K 超高清视频、AR/VR 等沉浸式交互模式的逐步成熟。连接能力将增强至百亿级,带来海量的机器类通信及连接的深度融合。网络向云化、软件化演进,网络可切片成多个相互独立、平行的虚拟子网络,为
67、不同应用提供虚拟专属网络,加上高可靠、低时延、大容量的网络能力,将使车联网、物联网、工业互联网等领域获得全新的技术赋能。语音作为最自然的人机交互方式,将迎来更多成长机会和更大的发展空间。(*数据来源于中国声纹识别产业发展白皮书 2019)由于声音信号的复杂性,声纹识别在实际应用时仍然面对很多挑战,包括但不限于:背景噪声干扰、跨信道识别、超短语音精度低、假冒攻击等。3.5.12 深度学习主要专利情况主要专利情况从 2013 年至 2022 年,根据统计数据显示,“通用机器学习-深度学习融合”技术的国内专利申请量约 64161 个。从技术应用场景来看,“通用机器学习-深度学习融合”技术可以广泛应用
68、于智能营销、智能风控等领域。目前,全球越来越32多的人们开始意识到机器学习-深度学习融合技术应用的重要性,因此需要针对不同机器学习-深度学习融合技术进行研究和开发。另一方面,随着全球化进程的加快,对机器学习-深度学习融合技术的需求正不断增长。总之,从现有数据来看,“通用机器学习-深度学习融合”技术具有非常广阔的应用前景,未来在智能营销、智能风控等领域中的市场需求将会越来越大。应用趋势应用趋势“通用机器学习-深度学习融合”技术逐渐渗透到智能金融领域中,主要应用于智能营销和智能风控两大方向。越来越多的时序相关的模型(例如 RNN、LSTM、GRU 等)应用于线上智能营销场景中,用于快速捕捉客户在时
69、间域上的兴趣变化。例如,在保险推荐领域,时序模型可以用来预测客户对于每一类保险的兴趣变化,从而帮助业务人员做出更加准确的营销手段决策。除此之外,还有一些辅助的算法技术(例如 GNN、GCN、KGCN 等)融入其中,提升整体模型的精准度。例如,构建保险产品的知识图谱可以快速帮助模型找到客户历史购买保险的非显性联系,有效帮助业务人员进行下一次的产品推荐。随着获取数据的成本逐渐增加,元学习、迁移学习等算法主要用来解决智能营销中存在数据稀疏问题。例如,利用客户在日常产品的购买行为预测在金融领域的购买意向度。在金融信贷行业的发展过程中,普惠金融起到了巨大的作用。智能风控主要负责判断用户是否存在欺诈风险或
70、者违约风险,从而起到提前预警减少的损失。数据增强技术主要解决欺诈行为数据中存在的数据稀疏问题,提升数据质量和数量,从而提升识别欺诈客户的准确性。自 2017 年以来,越来越多的时序相关的模型(例如 RNN、LSTM、GRU 等)和传统的机器学习模型(例如 RandomForest,Xgboost,LightGBM 等)的融合模型应用于智能风控场景中。33第四章 智能家居第四章 智能家居4.1.产业定义智能家居产业是指利用物联网、人工智能等技术,将传统家居设备与互联网连接,实现设备之间的智能互联和远程控制,以提高家居生活的舒适度、便利性和安全性的产业。在智能家居产业中,通过智能化的设备和系统,可
71、以实现家庭照明、安防监控、温度控制、家电控制、健康监测等功能,为用户提供智能化、便捷化的家居生活体验。智能家居产业包括了各种智能设备和系统,如智能照明、智能安防、智能家电、智能门锁、智能音响、智能温控等。这些设备可以通过互联网或本地网络进行通信和控制,实现远程监控、自动化控制、场景设置等功能。智能家居产业涉及多个领域,包括硬件设备制造商、软件开发商、平台提供商、系统集成商以及相关服务提供商等。此外,智能家居产业还涉及到标准制定、数据安全与隐私保护等方面的问题。根据国务院文件关于促进智能家居产业发展的指导意见,智能家居被定义为利用物联网、云计算、大数据、人工智能等技术手段,通过连接、感知和控制家
72、庭设备和系统,实现家庭设备之间的互联互通、自动化管理和智能化服务的一种家庭生活方式。智能家居旨在提高家庭生活品质、提供便利与舒适、节约资源和能源,同时满足用户个性化需求。该定义旨在推动智能家居产业的发展,加强标准化建设和技术创新,促进产业协同发展与应用推广。随着技术的不断进步和用户对便利性和舒适性的需求增加,智能家居产业正快速发展。预计未来几年内,智能家居市场将继续扩大,并为用户创造更加智慧和便捷的生活方式。344.2.主要技术点分类354.3.主要技术在产业的应用4.3.1 人机交互系统人机交互系统是指人与计算机或其他智能设备之间进行信息交流和操作的过程。它通过各种输入和输出方式,使人们能够
73、与计算机进行有效的沟通和互动。人机交互系统的目标是提供简单、直观、高效的用户体验,使用户能够轻松地完成任务、获取信息或控制设备。人机交互系统通常包括以下几个关键组件:1、输入设备:用于将用户的指令或信息输入到计算机系统中,常见的输入设备有键盘、鼠标、触摸屏、语音识别等。2、输出设备:用于将计算机处理后的结果或信息以可理解的方式呈现给用户,常见的输出设备有显示器、音频设备、打印机等。363、用户界面:提供用户与计算机系统之间交互的界面,包括图形用户界面(GUI)、命令行界面(CLI)、触摸界面等。4、交互技术:包括语音识别、手势识别、眼动追踪等技术,用于实现更自然、智能化的人机交互方式。5、用户
74、体验设计:关注用户需求和心理特征,通过优化界面设计、交互流程等方面来提升用户满意度和效率。近年来,随着人工智能技术的快速发展,人机交互系统也得到了进一步改进和创新。例如,语音助手和智能音箱利用语音识别和自然语言处理技术,使用户可以通过声音指令与设备进行对话;虚拟现实和增强现实技术为用户提供了更沉浸式的交互体验;手势识别和眼动追踪技术则使得人们可以通过简单的动作或眼神实现与计算机的交互。总之,人机交互系统在不断演进和创新,旨在提供更加便捷、智能化的用户体验,并为人们在日常生活和工作中带来更多可能性。4.3.2 智能家电智能家电是指通过连接互联网和智能技术,具备智能化功能的家用电器。它们可以与用户
75、进行交互、实现远程控制、自动化操作以及与其他智能设备进行互联。智能家电的种类很多,常见的包括:1、智能音箱:具备语音助手功能的音箱,可以通过语音指令播放音乐、查询天气、控制其他智能设备等。2、智能电视:具备互联网连接功能的电视,可以观看在线视频、浏览网页、37使用应用程序等。3、智能冰箱:内置摄像头和传感器,可以实时监测食物存储情况、提醒过期食品、提供菜谱推荐等功能。4、智能洗衣机:通过手机应用程序远程控制洗衣机的启动、停止和选择洗涤模式,也可以根据衣物类型和污渍程度自动调整洗涤参数。5、智能空调:可以通过手机应用程序远程控制空调的开关、温度和模式设置,也可以根据用户习惯和环境条件自动调整温度
76、和风速。6、智能照明系统:通过智能灯泡或灯具,可以远程控制灯光的亮度、颜色和定时开关,也可以与其他智能设备进行联动,实现更智能化的照明体验。7、智能安防设备:包括智能门锁、摄像头、门窗传感器等,可以实现远程监控、入侵报警、门锁解锁等功能。8、智能厨房设备:如智能烤箱、咖啡机、电饭煲等,通过手机应用程序或语音指令进行远程控制和定时预约,方便用户在外出前准备好食物或饮品。这些智能家电通过连接互联网和手机应用程序,使用户可以随时随地进行远程控制和监控,并且可以根据用户习惯和需求实现自动化操作。智能家电的出现使得家居生活更加便捷、高效,并且提供了更多个性化的使用体验。4.3.3 传感器智能家居中的传感
77、器是一种关键的技术装置,用于感知和收集环境信息。这些传感器可以测量和监测各种物理量,如对声、光、电、火、气、水的环境感知,以及空气质量、温度、湿度等体感舒适度感知等。通过将环境数据转换为电信号或数字信号,传感器为智能家居系统提供了实时的、准确的信息。传感器在智能家居中扮演着重要的角色。它们与智能设备和系统相连,使得智能家居可以自动化地响应环境变化和用户需求。例如,温度传感器可以帮助调节恒温系统,确保室内舒适;湿度传感器可以控制加湿器或除湿器,维持适宜的湿度水平;光照传感器可以根据光照强度调整照明系统的亮度;声音传感器可以38触发语音助手或安防警报系统。通过与其他智能设备和系统的联动,传感器还可
78、以实现更高级别的智能化功能。例如,人体红外传感器结合照明系统可以实现自动开关灯光;运动传感器结合安防系统可以实现入侵检测和报警功能;烟雾/气体传感器结合警报系统可以提供火灾和气体泄漏的及时警示。总之,智能家居中的传感器是连接物理世界和数字世界的桥梁。它们通过收集环境数据,使得智能家居系统具备了自动化、个性化和智能化的功能,为用户创造更加舒适、便捷、安全和高效的生活体验。4.3.4 设备安全声纹识别是一种利用个体的声音特征进行身份验证或识别的技术。它通过分析人的语音信号中的声音质量、频谱特征、语调等信息,来确定一个人的身份。与传统的身份验证方式相比,声纹识别具有独特性、难以伪造性和方便性等优势。
79、声纹识别可以应用于多个领域,包括安全领域、金融领域、客户服务以及智能设备等。在安全领域,声纹识别可以用于身份验证,例如在电话银行中通过声音确认用户身份。在金融领域,声纹识别可以防止欺诈行为,提高交易安全性。在客户服务方面,声纹识别可以用于自助服务系统,提供更便捷的用户体验。声纹识别并非完美无缺,仍存在一定的误识率和受环境因素影响的问题。因此,在实际应用中需要结合其他身份验证方式来提高准确性和安全性。394.4.产业技术成熟度分析4.4.1 学术界与产业界成果四象限图404.4.2 热度-供给图与阶段-供给图414.5.技术分析4.5.1 语音降噪主要专利情况主要专利情况应用趋势应用趋势在移动通
80、信领域,语音降噪技术可以提高通话质量和语音识别准确性,满足人们对高质量通信的需求。随着 5G 网络的普及和移动设备性能的提升,语音降噪技术将成为移动通信的重要发展方向。智能音箱和语音助手也是语音降噪技术的重要应用场景。通过降低环境噪声干扰,语音助手和智能音箱可以提供更清晰、更准确的语音交互体验,使用户与智能设备之间的沟通更加便捷和自然。在无线耳机和耳机通话领域,消除环境噪声对于通话质量至关重要。通过采用先进的语音降噪技术,无线耳机可以提供更清晰、更稳定的通话体验,让用户在各种环境下都能享受高品质的通话效果。远程会议和远程教育也是语音降噪技术的重要应用领域。在远程环境中,参与者可能面临各种背景噪
81、声干扰。通过使用语音降噪技术,可以有效减少背景噪声,提高远程会议和教学的清晰度和可理解性。总体而言,随着对语音质量和用户体验要求的不断提高,以及相关技术的不断创新,语音降噪技术在移动通信、智能设备、无线耳机、远程会议等领域都有着广阔的应用前景,并推动整个行业向前发展。424.5.2 声源定位主要专利情况主要专利情况应用趋势应用趋势声源定位应用的趋势是不断增长和发展。随着技术的进步和创新,声源定位在许多领域中得到了广泛应用,包括虚拟现实、增强现实、智能音箱、无人驾驶汽车等。声源定位技术可以提供更沉浸式的体验和更准确的环境感知,为用户带来更好的音频体验和交互体验。未来,随着人工智能、深度学习和大数
82、据等技术的发展,声源定位应用有望进一步扩大,并在更多领域中发挥重要作用,如安防监控、智能家居、医疗诊断等4.5.3 回声消除主要专利情况主要专利情况43应用趋势应用趋势回声消除应用的趋势是不断发展和改进。回声是由于音频信号在传输或反射时与环境中的障碍物相互作用而产生的。回声消除技术旨在减少或消除这种回声,以提高音频质量和语音通信的清晰度。未来的回声消除应用趋势包括以下几个方面:1、算法优化:随着人工智能和机器学习的发展,回声消除算法将变得更加智能和高效。通过深度学习和神经网络等技术,可以提高算法的准确性和性能。2、多麦克风阵列:多麦克风阵列可以捕捉到不同位置和方向的音频信号,从而提供更多的信息
83、用于回声消除。未来的趋势是将多麦克风阵列应用于各种设备和场景,如智能音箱、会议系统等。3、实时通信应用:随着远程工作和远程会议的增加,实时通信应用对于清晰的语音质量变得越来越重要。回声消除技术将在视频会议、语音通话等实时通信应用中得到广泛应用。嵌入式系统集成:未来的趋势是将回声消除技术嵌入到各种设备和系统中,如智能手机、汽车音响系统等。这将提供更好的用户体验和更清晰的音频质量。未来回声消除应用的趋势是通过算法优化、多麦克风阵列、实时通信应用和嵌入式系统集成等方面不断改进和发展,以提供更好的音频质量和用户体验。4.5.4 盲源分离主要专利情况主要专利情况44应用趋势应用趋势盲源分离应用的趋势是不
84、断增长和发展。盲源分离是一种信号处理技术,旨在从混合信号中分离出不同的源信号,而无需事先了解源信号的特征或进行训练。以下是盲源分离应用的趋势:1、音频处理:盲源分离在音频处理领域有广泛的应用。例如,可以将音乐中的不同乐器分离出来,或者从语音信号中提取出不同说话者的声音。2、视频处理:盲源分离也可以应用于视频处理领域。例如,在多摄像头系统中,可以将不同摄像头捕捉到的视频信号进行分离,以实现多角度观看或跟踪特定对象。3、无线通信:在无线通信领域,盲源分离可以用于多用户检测和信道估计。它可以帮助识别和分离同时传输的多个用户的信号,从而提高系统容量和性能。4、医学图像处理:在医学图像处理领域,盲源分离
85、可以用于提取出不同组织或结构的图像信息,从而帮助医生进行诊断和治疗决策。5、语音识别和语音合成:盲源分离可以用于语音识别和语音合成任务中。通过将说话者的声音与背景噪声进行分离,可以提高语音识别系统的准确性,并改善语音合成系统生成的语音质量。盲源分离应用将在音频处理、视频处理、无线通信、医学图像处理以及语音识别和语音合成等领域得到更广泛的应用,并为这些领域带来更好的性能和效果。4.5.5 波束形成主要专利情况主要专利情况45应用趋势应用趋势波束形成是一种利用多个天线元素组合来形成和聚焦无线信号的技术。随着通信技术的发展和需求的增加,波束形成在许多领域都有广泛的应用。以下是一些波束形成应用的趋势:
86、1、5G 通信:5G 通信需要更高的带宽和更快的速度,而波束形成可以提供更高的数据传输速率和更好的覆盖范围。因此,5G 通信系统中广泛使用了波束形成技术。2、毫米波通信:毫米波频段具有更大的带宽和更高的传输速率,但其传输范围相对较短。波束形成可以通过聚焦信号来增加传输距离并提高可靠性,因此在毫米波通信中广泛应用。3、网络覆盖增强:在人口稠密区域或室内环境中,网络覆盖可能存在挑战。通过使用波束形成技术,可以将信号聚焦在特定区域,提高网络覆盖范围和质量。4、雷达系统:雷达系统需要准确探测和定位目标,并提供高分辨率图像。波束形成技术可以增强雷达系统的性能,提高目标探测和跟踪的准确性。5、无人机通信:
87、无人机通信需要实时和可靠的数据传输,而且无人机天线受限。通过使用波束形成技术,可以提高无人机通信的稳定性和可靠性。4.5.6 麦克风阵列信号处理主要专利情况主要专利情况46应用趋势应用趋势麦克风阵列信号处理是一种利用多个麦克风组成的阵列来捕获和处理声音信号的技术。它可以提供更好的声音捕获和环境噪声抑制效果。以下是一些麦克风阵列信号处理应用的趋势:1、语音识别和语音助手:随着语音交互技术的发展,语音识别和语音助手成为越来越普遍的应用。麦克风阵列信号处理可以提供清晰的语音输入,提高语音识别准确性,并改善语音助手的响应质量。2、会议和通讯系统:在会议室和远程通讯中,清晰的声音传输和噪声抑制是关键。麦
88、克风阵列信号处理可以减少背景噪声和回声,提供更好的会议体验和通讯质量。3、虚拟现实和增强现实:虚拟现实(VR)和增强现实(AR)应用需要与环境交互并提供沉浸式的听觉体验。麦克风阵列信号处理可以提供定位和环境声音模拟,增强用户体验。4、声源定位和跟踪:麦克风阵列信号处理可以通过分析多个麦克风之间的时间差和幅度差来确定声源的方向,并实现精确的声源定位和跟踪,对于虚拟现实(VR)和增强现实(AR)应用。5、智能家庭控制:虚拟现实(VR)和增强现实(AR)应用需要与环境交互并提供沉浸式的听觉体验。麦克风阵列信号处理可以提供定位和跟踪、噪声抑制等功能,改善用户体验。6、远程会议和远程教育:远程会议和远程
89、教育越来越常见,而且在这些场景中,清晰的声音传输非常重要。麦克风阵列信号处理可以提供清晰、准确的声音捕获,并降低背景噪声对会议或教育内容的干扰。474.5.7 嵌入式神经网络编译器主要专利情况主要专利情况应用趋势应用趋势嵌入式神经网络编译器是一种将神经网络模型转化为在嵌入式设备上运行的优化代码的工具。它可以提高神经网络在边缘设备上的效率和性能。以下是一些嵌入式神经网络编译器应用趋势:1、边缘人工智能:随着边缘计算和物联网的发展,将人工智能引入边缘设备成为一种趋势。嵌入式神经网络编译器可以将复杂的神经网络模型转化为在资源受限的边缘设备上运行的高效代码,实现本地的智能决策和分析。2、移动设备应用:
90、移动设备如智能手机、平板电脑等也需要高效的神经网络推理能力。嵌入式神经网络编译器可以将模型转化为适合移动设备上运行的优化代码,提高移动应用中人工智能功能的性能和效率。3、智能家居和物联网:智能家居和物联网应用中,边缘设备需要具备感知、决策和响应能力。嵌入式神经网络编译器可以将神经网络模型转化为在低功耗、资源受限的边缘设备上运行的优化代码,实现智能家居和物联网中的人工智能功能。4、自动驾驶和机器人技术:自动驾驶和机器人技术需要进行实时决策和感知处理。嵌入式神经网络编译器可以将复杂的感知和决策模型转化为适合在嵌入式系统上运行的高效代码,提高自动驾驶和机器人系统的性能和响应速度。484.5.8 模型
91、归并主要专利情况主要专利情况应用趋势应用趋势模型归并是指将多个神经网络模型合并为一个更大的模型的技术。它可以提高模型的效率、减少内存占用,并简化模型部署和维护。以下是一些模型归并应用趋势:1、边缘计算和物联网:在边缘设备上运行复杂的神经网络模型可能会受到资源限制的挑战。通过将多个小型模型归并为一个较大的模型,可以在边缘设备上实现更复杂的任务和功能,同时减少内存占用和计算开销。2、模型压缩和加速:随着神经网络模型变得越来越大和复杂,模型压缩和加速成为一种重要的需求。通过将多个小型模型归并为一个更大的模型,可以减少冗余参数和计算操作,从而提高推理速度和减少存储需求。3、联邦学习:联邦学习是一种保护
92、数据隐私的分布式学习方法。通过将多个本地模型归并为一个全局模型,可以在不共享原始数据的情况下进行全局模型训练,从而保护用户隐私。4、多任务学习:多任务学习是指在一个模型中同时处理多个相关任务。通过将多个单独训练的任务模型归并为一个共享参数的多任务模型,可以实现参数共享、知识共享,并提高整体性能。494.5.9 实时语音识别主要专利情况主要专利情况应用趋势应用趋势实时语音识别是一种将语音信号转换为文本的技术,具有广泛的应用领域。以下是一些实时语音识别应用的趋势:1、语音助手和虚拟助手:随着智能手机、智能音箱和其他智能设备的普及,语音助手和虚拟助手成为人们日常生活中的常见工具。实时语音识别技术可以
93、使这些助手更加智能和响应迅速。2、会议记录和转写:在商务和学术领域,会议记录和转写是必不可少的。实时语音识别可以实时记录会议内容,并将其转换为文本,提高会议效率并方便后续查阅。3、实时字幕和翻译:在演讲、直播、新闻报道等场景中,实时字幕和翻译可以帮助听众更好地理解内容。实时语音识别技术可以将演讲内容即时转换为字幕或进行实时翻译。4、电话客服和自动化呼叫中心:电话客服行业正逐渐采用自动化呼叫中心来提供更高效的客户服务。实时语音识别技术可以帮助自动化系统快速理解客户需求,并提供准确的回答和解决方案。5、实时语音分析与情感识别:实时语音识别还可应用于情感分析和情感识别。通过分析说话者的语调、声调以及
94、其他声学特征,可以推断其情感状态并作出相应反馈。504.5.10 语音唤醒主要专利情况主要专利情况应用趋势应用趋势语音唤醒是一种通过声音指令唤醒设备并启动语音交互的技术。以下是一些语音唤醒应用的趋势:1、智能家居和物联网:随着智能家居设备和物联网的普及,语音唤醒成为控制和操作设备的便捷方式。用户可以通过简单的声音指令唤醒智能家居设备,并实现对灯光、温度、安防等功能的控制。2、汽车和智能交通:语音唤醒在汽车和智能交通领域有着广泛的应用。驾驶员可以通过语音指令唤醒车载系统,并进行导航、电话、音乐等操作,提高驾驶安全性和便利性。3、移动设备和虚拟助手:移动设备如智能手机和平板电脑也广泛应用了语音唤醒
95、技术。用户可以通过声音指令唤醒虚拟助手(如 Siri、Google Assistant 等),并进行搜索、发送消息、设置提醒等操作。4、健康医疗:在医疗领域,语音唤醒可用于患者监测、远程医疗等场景。患者可以通过语音指令唤醒医疗设备,并进行测量身体参数、咨询医生等操作。5、安防监控:语音唤醒在安防监控领域也有应用。用户可以通过声音指令唤醒安防系统,并进行实时视频监控、报警处理等操作。514.5.11 分布式唤醒主要专利情况主要专利情况应用趋势应用趋势分布式唤醒是指在多个设备或节点上进行语音唤醒处理的技术。以下是分布式唤醒应用的趋势:1、多设备协同:随着智能家居设备和物联网的普及,用户可能同时拥有
96、多个智能设备,如智能音箱、智能手机、智能电视等。分布式唤醒可以使这些设备协同工作,实现更广泛的语音控制和交互。2、低功耗和高效性:分布式唤醒可以将语音唤醒处理任务分散到多个节点上,减轻单个设备的负担,并提高系统的响应速度和效率。同时,通过合理的任务分配和资源利用,可以降低功耗,延长设备的续航时间。3、隐私保护:在分布式唤醒中,语音数据可以在本地设备上进行处理,减少对云端服务器的依赖。这样可以增强用户对语音数据隐私的控制和保护,避免敏感信息泄露的风险。4、异构设备兼容性:分布式唤醒技术可以跨不同类型和品牌的设备进行应用,实现设备之间的互操作性。这样用户可以通过任意一个支持分布式唤醒的设备进行语音
97、控制,并与其他设备进行无缝连接和交互。5、边缘计算和云端协同:分布式唤醒可以将计算任务从云端迁移到边缘设备上进行处理,减少云端服务器的负载和延迟。同时,云端和边缘之间可以进行协同工作,实现更复杂、更智能的语音交互体验。52随着智能家居、物联网和边缘计算等技术的发展,分布式唤醒在提高系统性能、保护隐私、提供更灵活交互方式等方面具有广阔的应用前景,并将为用户带来更便捷、安全和个性化的语音交互体验。4.5.12 方言识别主要专利情况主要专利情况应用趋势应用趋势方言识别是一种将不同地区或社群特定的语言变体区分开来的技术。以下是一些方言识别应用的趋势:1、语音助手和智能设备:随着智能设备的普及,方言识别
98、可以帮助语音助手更好地理解和响应用户的方言口音,提供更准确和个性化的服务。2、地方文化保护和传承:方言是地方文化的重要组成部分。通过方言识别技术,可以记录和保护各地区独特的方言语音,促进地方文化的传承和保护。3、语音翻译和实时字幕:对于外地游客或移民理解当地方言可能存在困难。方言识别技术可以帮助实时翻译或提供字幕,使他们更好地理解当地人的交流。4、方言教育和学习:对于学习某种特定方言的人来说,方言识别可以帮助评估学习者的发音准确性,并提供针对性的反馈和指导。5、方言社交媒体和内容分发:随着社交媒体的兴起,许多人使用方言进行社交互动。方言识别技术可以帮助社交媒体平台更好地理解用户发布的内容,并提
99、供相关推荐和个性化服务。534.5.13 声纹识别要专利情况要专利情况应用趋势应用趋势声纹识别是一种通过分析个体的声音特征来识别和验证身份的技术。以下是一些声纹识别应用的趋势:1、身份验证和安全领域:声纹识别可以用于替代或增强传统的身份验证方法,如密码、指纹或面部识别。它可以应用于手机解锁、电子支付、银行交易等场景,提供更方便和安全的身份验证方式。2、电话客服和呼叫中心:声纹识别可以用于电话客服和呼叫中心,自动识别和验证客户的身份,提高客服效率和用户体验。3、反欺诈和安全监控:声纹识别可以用于反欺诈和安全监控领域。通过分析声音特征,可以检测可疑行为或欺诈活动,并提供实时警报。4、个性化服务和智
100、能助手:声纹识别可以帮助智能助手更好地理解用户,并提供个性化服务。根据声音特征,智能助手可以自动调整语速、音量等参数,以适应用户的偏好。5、医疗保健:声纹识别在医疗保健领域也有应用潜力。例如,通过分析患者的声音特征,可以检测出某些疾病或健康问题迹象,如哮喘、睡眠呼吸暂停等。544.5.14 多模态说话人识别主要专利情况主要专利情况应用趋势应用趋势多模态说话人识别是指通过多种传感器和信息源(如声音、图像、视频等)来识别和辨别不同的说话人身份。以下是一些多模态说话人识别应用的趋势:1、安全和身份验证:多模态说话人识别可以用于安全领域,如边境安检、物理访问控制等。通过结合声音、面部图像或其他生物特征
101、,可以实现更准确和可靠的身份验证。2、语音助手和智能设备:多模态说话人识别可以帮助语音助手更好地辨别和区分不同的用户。这样,语音助手可以提供个性化的服务和响应,满足用户的特定需求。3、会议记录和智能笔记:在会议记录和智能笔记应用中,多模态说话人识别可以帮助自动标记和归档不同参与者的发言内容。这样,会议记录可以更准确地捕捉到每个参与者的观点和意见。4、智能交通系统:在智能交通系统中,多模态说话人识别可以帮助车辆或交通设施辨别不同驾驶员或乘客的声音特征。这有助于提供个性化服务、驾驶行为分析以及车内安全监控。5、娱乐和游戏体验:在娱乐和游戏领域,多模态说话人识别可以增强用户体验。例如,在虚拟现实游戏
102、中,系统可以根据玩家的声音特征来识别并响应不同的指令或情绪。554.5.15 声纹验证主要专利情况主要专利情况应用趋势应用趋势声纹验证是通过分析个体的声音特征来进行身份验证和识别的技术。以下是声纹验证应用的趋势:1、安全认证:声纹验证作为一种生物特征认证技术,被广泛应用于安全认证领域。它可以用于手机解锁、电子支付、网络登录等场景,提供更安全、方便的身份验证方式。2、电话银行和客服:声纹验证在电话银行和客服领域也有着广泛的应用。用户可以通过讲话来进行身份验证,避免了繁琐的密码输入,提高了用户体验和安全性。3、健康医疗:声纹特征可以反映个体的健康状况和情绪状态。因此,声纹验证在健康监测和医疗诊断方
103、面也有着潜在的应用。通过分析声音特征可以检测出一些健康问题或情绪变化,为个体提供更精准的医疗服务。4、智能助理和智能家居:随着智能助理和智能家居设备的普及,声纹验证成为一种方便的身份识别方式。用户可以通过语音与智能助理进行交互,并实现个性化服务、智能家居控制等功能。5、社交娱乐:声纹特征也可以用于社交娱乐领域。例如,通过分析声音特征可以生成个性化的语音合成、唱歌评分等应用,为用户带来更丰富多样的娱乐体验。564.5.16 语音合成主要专利情况主要专利情况应用趋势应用趋势语音合成是一种将文本转换为声音的技术,以下是语音合成应用的趋势:1、个性化和自然度:语音合成技术不断追求更加自然、流畅和逼真的
104、声音。越来越多的研究和开发致力于提高语音合成系统的个性化能力,使其能够根据用户的需求和偏好生成具有个性化特点的声音。2、多语种和跨语种:随着全球化的发展,多语种和跨语种的需求也在增加。语音合成技术不仅要支持更多的语言,还要能够实现在不同语言之间进行无缝转换,以满足用户在多语言环境下的需求。3、智能助理和虚拟人物:智能助理和虚拟人物是目前广泛应用语音合成技术的领域之一。通过给虚拟助理和虚拟人物赋予具有个性化、情感表达、交互能力的声音,使其更加生动、亲切、具有人性化。4、教育和培训:语音合成在教育和培训领域也有着广泛应用。例如,通过生成具有流利发音和标准口音的声音来辅助学习外语;或者通过生成具有丰
105、富表达能力的声音来进行教学讲解。5、娱乐和媒体:语音合成技术在娱乐和媒体领域也有着重要应用。例如,在游戏中生成角色对话;或者在电影制作中生成配音等。574.5.17 方言及语种合成主要专利情况主要专利情况应用趋势应用趋势方言及语种合成是指将文本转换为特定方言或语种的声音的技术。以下是方言及语种合成应用的趋势:1、方言保护和传承:方言合成技术可以帮助保护和传承各地的方言。通过生成具有地方特色的声音,可以促进方言的使用和传播,避免方言逐渐消失。2、跨语种交流:随着全球化的发展,跨语种交流变得越来越普遍。方言及语种合成技术可以帮助人们在不同语种之间进行交流,提供更多元化、便捷的跨文化交际方式。3、文
106、化娱乐:方言及语种合成在文化娱乐领域也有广泛应用。例如,在电影、电视剧中生成具有特定方言或语种的角色对话。4、教育和学习:方言及语种合成技术可以用于教育和学习领域。例如,在外语学习中生成具有特定方言或口音的声音,帮助学生更好地理解和模仿。5、个性化体验:方言及语种合成可以为用户提供个性化的声音体验。用户可选择自己熟悉或感兴趣的特定方言或语种来生成声音,增加个性化和情感连接。584.5.18 声音复刻主要专利情况主要专利情况应用趋势应用趋势声音复刻是一种利用声纹识别技术将一个人的声音复制并应用于其他场景或设备中的技术。以下是声音复刻应用的趋势:1、影视和游戏产业:声音复刻可以用于电影、电视剧和游
107、戏中,将特定演员或角色的声音进行复刻,使其在不同场景或游戏中保持一致性。2、虚拟助手和智能设备:声音复刻可以用于虚拟助手和智能设备中,使其具备特定人物的声音特征,提供更加个性化和亲切的交互体验。3、教育和培训领域:声音复刻可以用于教育和培训领域,将专业人士的声音进行复刻,提供更具权威性和专业性的教学资源。4、文化遗产保护:声音复刻可以用于保护文化遗产中特定人物的声音,例如历史名人、艺术家等,使其在今后的展览或活动中得以重现。5、个性化娱乐产品:声音复刻可以用于个性化娱乐产品,例如个性化语音包、语音合成等,为用户提供独特且个性化的娱乐体验。594.5.19 语义理解主要专利情况主要专利情况应用趋
108、势应用趋势语义理解是指通过分析文本或语音的意义和语境,从中提取出关键信息和意图的技术。以下是语义理解应用的趋势:1、智能助理和虚拟人物:语义理解技术在智能助理和虚拟人物中得到广泛应用。通过深入理解用户的指令、问题和需求,智能助理可以提供更准确、个性化的回答和服务。2、自动问答和知识图谱:语义理解可用于自动问答系统,帮助用户快速获取准确的答案。此外,与知识图谱结合,语义理解可以提供更丰富、连贯的知识检索和推荐。3、智能搜索和信息检索:语义理解技术有助于改进搜索引擎的效果,使其能够更好地理解用户查询的意图,并提供相关、准确的搜索结果。4、情感分析和情感智能:通过语义理解技术,可以分析文本中的情感色
109、彩,帮助了解用户情绪和态度。这对于情感智能应用、舆情分析等具有重要作用。5、自然语言生成技术:语义理解技术可用于自然语言生成,帮助计算机生成更准确、流畅、自然的文本或对话。这对于聊天机器人、自动摘要、机器翻译等具有重要作用。604.5.20 知识推理主要专利情况主要专利情况应用趋势应用趋势知识推理是指通过分析和推理已有的知识,从中得出新的结论或发现新的关联的技术。以下是知识推理应用的趋势:1、语义搜索和智能问答:知识推理技术可以用于改进语义搜索引擎和智能问答系统,使其能够更准确、全面地回答用户的查询,并提供更深入、个性化的解决方案。2、自动推理和决策支持:知识推理可用于自动推理和决策支持系统,
110、帮助分析复杂的问题、数据和情境,并提供基于逻辑和规则的推断和决策。3、智能机器人和虚拟助手:知识推理技术在智能机器人和虚拟助手中有广泛应用。通过分析用户需求、环境信息和已有知识,智能机器人可以做出适应性强、个性化的行动和回应。4、自动化知识图谱构建:知识推理可用于自动化构建和扩展知识图谱。通过从大量文本、数据中提取结构化信息,并进行关联、归纳,可以生成更全面、连贯的知识图谱。5、智能辅助决策:知识推理技术可用于智能辅助决策系统,帮助分析复杂问题并提供决策建议。通过对已有知识进行逻辑推断和规则应用,可以辅助人们做出准确、明智的决策。614.5.21 智能知识问答主要专利情况主要专利情况应用趋势应
111、用趋势智能知识问答是一种利用人工智能技术和自然语言处理技术,提供准确、及时和个性化答案的问答系统。以下是智能知识问答应用的趋势:1、虚拟助手和智能设备:随着智能手机、智能音箱和其他智能设备的普及,虚拟助手和智能设备成为人们日常生活中的常见工具。智能知识问答技术可以使这些助手更加智能和响应迅速。2、在线客服和自助服务:越来越多的将智能知识问答应用于在线客服和自助服务系统中,以提供即时、准确的答案,帮助用户解决问题和提供支持。3、专业领域知识问答:在特定领域,如医疗、法律、金融等,智能知识问答可以提供专业领域的准确答案,并帮助用户获取专业建议和指导。4、教育和培训领域:在教育和培训领域,智能知识问
112、答可以用于学习辅助工具,帮助学生获取学习资料、解决问题,并提供个性化的学习建议。5、社区问答平台:在社区问答平台上,智能知识问答可以提供准确的回答,并帮助用户找到相关问题和解决方案。624.5.22 开放域问答主要专利情况主要专利情况应用趋势应用趋势开放域问答是指涉及广泛主题和领域的问答系统,不限定于特定领域或专业知识。以下是开放域问答应用的趋势:1、多模态问答:随着技术的发展,开放域问答系统不仅可以处理文本问题和回答,还可以处理图像、音频和视频等多种形式的输入和输出。2、深度语义理解:开放域问答系统正在不断提高对语义的理解能力,包括对上下文、逻辑关系和推理能力的理解。这使得系统能够更准确地理
113、解问题并提供更有深度的回答。3、个性化回答:开放域问答系统越来越注重个性化回答,根据用户的偏好、历史记录和上下文信息提供更加定制化和个性化的回答。4、多语言支持:随着全球化的发展,开放域问答系统需要支持多种语言,以满足不同地区和用户的需求。5、社交媒体整合:开放域问答系统正越来越多地与社交媒体平台整合,以便从社交媒体上获取信息、参与对话,并提供相关问题的回答。634.5.23 个性化推荐主要专利情况主要专利情况应用趋势应用趋势个性化推荐是指根据用户的兴趣、偏好和行为历史,为用户提供个性化的推荐和建议的技术。以下是个性化推荐应用的趋势:1、多模态推荐:随着技术的发展,个性化推荐不仅限于文本和图像
114、,还可以包括音频、视频和其他多种形式的内容。多模态推荐可以更全面地理解用户需求,提供更丰富和多样化的推荐内容。2、实时推荐:实时推荐是指根据用户当前的上下文和行为,及时地提供个性化的推荐。通过实时分析用户行为和环境信息,实时推荐可以更准确地捕捉用户需求,并提供及时、适时的推荐。3、社交媒体整合:个性化推荐系统正越来越多地与社交媒体平台整合,以获取社交关系、兴趣标签和社交互动等信息,从而更好地理解用户兴趣和需求,并提供更准确、有针对性的推荐。4、跨平台和跨设备:随着用户在多个平台和设备上的活动增加,个性化推荐系统需要跨平台和跨设备进行协同工作,以提供一致且无缝的个性化体验。5、隐私保护:随着对数
115、据隐私和安全性关注度的提高,个性化推荐系统需要更加注重用户数据的隐私保护。采用隐私保护技术,如差分隐私、联邦学习等,以保护用户数据并提供可信赖的个性化推荐服务。644.5.24 多轮对话管理主要专利情况主要专利情况应用趋势应用趋势多轮对话管理是指在人机对话中有效管理和处理多个连续的对话轮次,以下是多轮对话管理应用的趋势:1、上下文感知和持续性:多轮对话管理技术将注重上下文感知和持续性。系统可以理解和记忆之前的对话内容,使得后续的对话更连贯、自然,并能够在多个轮次中保持一致性。2、用户意图识别和跟踪:多轮对话管理需要准确识别和跟踪用户的意图。系统会分析用户的发言,理解其意图,并根据上下文进行相应
116、的回应和行动。3、对话策略优化:多轮对话管理将注重对话策略的优化。系统会根据用户需求和目标,选择合适的回策略,以提供最佳的用户体验。4、混合式对话系统:多轮对话管理将与其他技术相结合,如自然语言处理、知识图谱等。通过整合不同的技术,系统可以更全面、准确地理解用户需求,并提供更丰富、智能化的回应。5、个性化和情感智能:多轮对话管理将注重个性化和情感智能。系统会学习用户偏好和情感状态,并据此调整回应策略,以提供更贴近用户需求、更具情感共鸣的交互体验。654.5.25 全双工交互主要专利情况主要专利情况应用趋势应用趋势全双工交互是指在通信过程中,双方可以同时发送和接收信息的能力。以下是全双工交互应用
117、的趋势:1、视频会议和远程协作:全双工交互技术在视频会议和远程协作中发挥着重要作用。它可以实现实时的双向音视频通信,提供更加真实、高效的远程协作体验。2、语音助手和智能设备:随着智能助手和智能设备的普及,全双工交互使得用户可以与设备进行自然而流畅的对话。用户可以同时提问和接收回答,享受更智能化、便捷的服务。3、游戏和虚拟现实:全双工交互技术为游戏和虚拟现实提供了更加沉浸式的体验。玩家可以与游戏角色进行实时对话,并获得即时反馈,增强游戏的互动性和真实感。4、智能家居和物联网:全双工交互使得智能家居设备之间以及设备与用户之间可以进行无缝的双向通信。用户可以通过语音指令控制设备,并获取即时反馈和状态
118、更新。5、语音搜索和推荐系统:全双工交互技术为语音搜索和推荐系统提供了更高效、准确的服务。用户可以通过语音提问并即时获得相关信息或推荐结果。664.5.26 数字人主要专利情况主要专利情况应用趋势应用趋势数字人是指基于人工智能技术构建的虚拟人物,具有自主思考、情感表达和交互能力。以下是数字人应用的趋势:1、虚拟助理和客户服务:数字人可以作为虚拟助理或客户服务代表,与用户进行实时对话和交互。它们可以回答问题、提供帮助、解决问题,并提供个性化的服务体验。2、教育和培训:数字人在教育和培训领域有广泛应用。它们可以扮演教师或导师的角色,提供个性化的学习支持和辅导,帮助学生更好地理解和掌握知识。3、娱乐
119、和媒体:数字人可以在娱乐和媒体领域中扮演角色,如电影、游戏、虚拟主播等。它们可以与用户进行互动,提供更丰富、沉浸式的娱乐体验。4、个性化医疗和健康管理:数字人可以在医疗和健康管理领域发挥作用。它们可以监测用户的健康状况、提供医疗建议,并根据个人需求提供个性化的健康管理方案。5、社交媒体和虚拟社区:数字人可以在社交媒体平台上扮演角色,与用户进行互动并参与虚拟社区。它们可以成为用户的朋友、伴侣,提供情感支持和社交互动。674.5.27 3D 视听交互主要专利情况主要专利情况应用趋势应用趋势3D 视听交互是指通过虚拟现实(VR)、增强现实(AR)和混合现实(MR)等技术,实现用户与虚拟环境或数字内容
120、的交互。以下是 3D 视听交互应用的趋势:1、更真实的体验:随着技术的进步,3D 视听交互应用将提供更真实、逼真的体验。通过高分辨率的图像、逼真的音效和精确的手势追踪,用户可以沉浸在一个几乎无法区分虚拟和现实世界的环境中。2、多感官体验:除了视觉和听觉,未来的 3D 视听交互应用将更多地涉及其他感官,如触觉、嗅觉和味觉。通过智能设备和传感器技术,用户可以感受到虚拟环境中的物体质地、气味和味道,增强沉浸感和身临其境的体验。3、社交与协作:3D 视听交互应用将越来越注重社交和协作功能。用户可以与其他用户共享虚拟空间,进行虚拟会议、游戏或创作等活动。这种社交和协作功能将进一步提升用户体验,并推动新型
121、应用的发展。4、跨平台和跨设备:未来的 3D 视听交互应用将支持跨平台和跨设备的使用。无论是在 VR 头显、AR 眼镜、智能手机还是其他设备上,用户都可以享受到一致且无缝的 3D 视听交互体验。5、应用场景多样化:除了游戏和娱乐领域,3D 视听交互还将广泛应用于教68育、医疗、建筑设计、工业制造等各个领域。通过虚拟仿真训练、远程医疗诊断、虚拟实景导航等应用,可以提高效率、降低成本,并创造全新的商业模式。4.5.28 多模态交互主要专利情况主要专利情况应用趋势应用趋势多模态交互是指通过结合多种感官输入和输出方式,如语音、视觉、触觉等,实现用户与计算机系统或应用程序之间的交互。以下是多模态交互应用
122、的趋势:1、语音和图像结合:语音识别和图像识别技术的进步,使得语音和图像可以结合使用,提供更丰富和便捷的交互方式。例如,通过拍照或扫描二维码获取信息,并使用语音进行查询或操作。2、视觉和触觉融合:虚拟现实(VR)和增强现实(AR)等技术的发展,使得用户可以通过视觉和触觉融合的方式与虚拟环境进行交互。例如,通过手势识别和触摸反馈设备,用户可以在虚拟环境中进行自然而直观的操作。3、多设备协同:随着智能手机、智能手表、智能音箱等设备的普及,多模态交互应用将更加注重多设备之间的协同工作。用户可以通过不同设备之间的联动和配合,实现更灵活、一致的交互体验。4、情感识别与表达:情感识别和情感表达技术的发展,
123、使得计算机系统能够更好地理解用户的情感状态,并相应地做出反馈。例如,在语音助手中添加情感识别功能,使其能够更加智能地回应用户的情感需求。695、个性化定制:多模态交互应用将越来越注重个性化定制,根据用户的偏好、习惯和需求提供定制化的交互体验。例如,在智能助手中根据用户喜好调整语音风格、颜色主题等。70第五章 智慧建筑第五章 智慧建筑5.1.产业定义随着新一代信息技术在建筑业的不断运用,建筑产品已不再是单纯的钢筋、混凝土“硬件”。智慧建筑是含有各种控制系统、BIM 数字模型“软件”及钢筋、混凝土“硬件”的有机整体。这种有机整体正在一步步走向联合,构筑智慧城市,智慧地球。智慧建筑作为一个全新的概念
124、流行开来,但是目前依然没有一个统一的定义。国际标准协会定义是:“它是建立在建筑的平台上,对建筑设备、自动化系统、智能服务系统、智能管理系统实现一个最优化的控制,使人们享有一个方便,智能的建筑环境”。这个定义依然停留在智能建筑上,没有考虑智慧建筑的社会意义。在中国国家标准 GB50314-2015智能建筑设计标准中,将智能建筑定义为“以建筑物为平台,基于对各类智能化信息的综合应用,集架构、系统、应用、管理及优化组合为一体,具有感知、传输、记忆、推理、判断和决策的综合指挥能力,形成以人、建筑、环境互为协调的整合体,为人们提供安全、高效、便利及可持续发展功能环境的建筑。从“智能”到“智慧”,现有定义
125、从注重技术、应用和具体产出到突出理念和广义贡献,在这里我们创新性的认为智慧建筑应该是在吸收智能建筑的基础上,从建筑项目全生命周期角度,科学地实施绿色建设方案,最终向人们提供一个开放信息环境下的高品质建筑环境。715.2.主要技术点分类5.3.主要技术在产业的应用5.3.1 智慧城市规划城市规划依托智能技术可大规模感知城市、认知城市、发现城市规律。城市智能模型的发展为城市规划提供了理想导向、问题导向以外的第三种规划思路:以城市规律导向编制城市规划,逐步集成城市多要素动态感知、全生命周期联动、多系统智能更新、规划设计自主迭代等关键 AI 技术,精准感知城市需求并根据人的需求不断产生与之匹配的技术方
126、案。新一代 AI 技术能够显著提升城市规划决策的智能辅助、城市空间场景的智能集成以及城市运行的智能组织方面的能力,人工智能辅助城市规划突破了传统智慧城市单一系统难以完成的、将自上而下与自下而上相结合的治理模式,提升了社会组织的效率。725.3.2 智能设计建筑设计是一个复杂的过程,一方面需要知识和经验,另一方面又需要想象力和创造力。人工智能技术能够将建筑理论和设计经验数字化,提高设计过程的工作效率,同时也为设计提供了更多的思路。人工智能算法通过判断不同场景,在建筑师输入场地、容积率需求等经济技术指标后,软件通过运算在最短时间给出推荐的楼型组合,不同参数之间高效协同,大大提高了设计效率。5.3.
127、3 智能审图随着工程规模不断扩大,工程的精细化管理需求越来越迫切,传统基于二维图纸的人工审查模式已无法满足当前工程建设要求。在此背景下智能审图理念应运而生。智能审图能够智能解构图纸信息,精确审查图纸问题。基于 BIM 的智能审查审批应用覆盖规划报建、施工图审查、竣工验收等环节。利用 BIM 图纸解析技术将图纸数字化,结合图文识别、要素抽取等 AI 技术智能识别图纸空间、构件等对象信息,快速发现并标注设计缺陷,自动完成图纸审查,提高审查质量,带动 BIM 技术在建筑项目全生命周期的全面应用。735.3.4 智慧运维智能物联时代,运用数字建筑中 BIM、云计算、大数据、智能控制等技术,赋能传统设备
128、实现物联网化统一管理运维,实现设备、终端等建筑资产的可视化、精细化、动态化运维管理,提升建筑生态化、绿色化管理和运营水平。5.3.5 智慧安防计算机视觉技术被认为是城市智慧安防的“眼睛”,能够采集、捕捉、分析各类图像及视频信息,大大提高安防效率和准确度。目前以计算机视觉识别为基础的生物体特征识别方式已逐渐开始成熟,这些特征包含面部特征,以及更细微的如人眼的虹膜、掌纹、声纹乃至步态等。尽管机器与生物体之间的交流还无法突破机械手段,各种信息和数据的录入手段还有待突破,但是机器能够通过视觉识别、生物特征检测等技术检测图像中的人是否是活体存在的,能够借助后台数据的对比鉴别图像中的人员身份信息,甚至识别
129、图像中人员行动的轨迹和姿势。5.3.6 智慧工地74智慧工地运用数字建筑相关技术,对施工现场全生产要素进行实时的一体化管控,辅助施工的科学分析和决策,全面提升建设施工的效率、质量和安全,助推工程建设管理的精细化、智慧化、高效化。目前智慧工地主要以 BIM+物联网+互联网为基础平台,利用智能机器人、可穿戴设备等智能设备同工人、传统机械实施现场生产,通过智能摄像头、人脸识别、RFID、二维码、无人机等收集工程现场数据,依靠移动通信、互联网与基础平台实现信息流的实时交互,该平台基于数据模型分析信息流所指向的工程现场物质流状态,并通过云平台、GPS 等技术实现与管理系统、智能加工系统、智能物流系统的对
130、接,最终帮助各级管理者有效掌握物质流的情况,实现工程现场的安全、质量、进度成本、劳务等方面的智慧管理与智慧决策。5.3.7 城市体检评估系统城市体检评估系统作为开展城市体检工作的有效手段和工具,集多源异构数据、多部门数据集合、集业务系统与空间分析决策系统于一体的复杂综合系统,支撑城市体检快速实现指标管理、数据收集、数据处理、指标计算、分析诊断、智能决策、报告生成、整改跟踪、监测预警等功能,为城市治理提供数据支撑和治理建议,促进高质量的城市更新,推动城市结构优化、功能完善和品质提升,实现城市可持续发展。755.4.产业技术成熟度分析5.4.1 学术界与产业界成果四象限图765.4.2 热度-供给
131、图与阶段-供给图775.5.技术分析5.5.1 群体智能技术主要专利情况主要专利情况根据数据统计显示,群体智能技术的全球专利申请量约 524 个。应用趋势应用趋势群体智能技术专利申请量从 2012 年到 2022 年呈现出逐年增长的趋势。其中,2013 年至 2017 年专利申请量增长迅速;从 2018 年至 2020 年,增长仍然较快,达到了约二分之一总增长量的增长速度;而从 2021 年至 2022 年,增长速度速度继续加快,每年增长数目均在 70 个以上。专利申请数量最高的一年是2021 年,达到的专利数量为 99 个,而 2022 年的数量则有所下降。从应用场景和领域的角度来看,此类技
132、术在城市规划决策辅助方面应用价值非常高,可将城市规划大规模使用的来自卫片、航片、统计数据、地面感知、专访和实地调研等渠道的信息和数据进行综合使用、协同认知。随着城市规划学科的成熟,对群体智能技术的需求愈发紧迫,专利申请数量依然呈现出增长趋势。此外,在人工智能技术领域,群体智能是非常重要的一项技术,也是未来发展的重点之一。因此,预计未来“方言及多语种语音识别”技术专利申请数量仍会保持较高的增长趋势。5.5.2 语义分析主要专利情况主要专利情况根据数据统计显示,语义分析技术的全球专利申请量约 562 个。应用趋势应用趋势从 2012 年到 2022 年,语义分析技术的专利申请数量整体呈现增长的态势
133、。其中 2019 年到 2021 年保持比较快的增长水平。“语义分析”技术作为多媒体人工智能核心关键技术自 2013 年以来一直受到较高的重视,三星、ABB、平安等公司,均在语义分析专利领域有较多的布局,通过多媒体人工智能将其语义分析纳入城市规划信息的分析系统,快速分析、分解各方讲话,并汇聚到城市大数据库内。这也侧面反映了语义识别技术在城市规划行业具有较重要的作用。从专利申78请数量的变化趋势也可以看出,近些年该技术研究和应用整体呈现较快的发展趋势。5.5.3 知识推理与决策主要专利情况主要专利情况根据数据统计显示,知识推理与决策技术的全球专利申请量约 23 个。应用趋势应用趋势知识推理与决策
134、技术 2012 年至 2017 年期间专利申请数量为零,从 2018年至 2022 年间该技术专利的申请数量呈现逐年上升的趋势,其中 2019 年到2021 年申请量的增长幅度最大。而 2022 年,申请量较前一年有些许下降。基于以上数据的变化趋势,可以看出该技术从 2017 年以后才受到了更多的关注,专利申请数量逐步上升,但在 2022 年却出现了下降。其中 2019 年的申请量增长加速,可能是由于行业发展的迅速和技术的迭代加速,促使对该技术的创新和研发产生了更大的需求。但是,在技术应用和市场落地的过程中也遇到了很多挑战,可能是导致最近申请量下降的原因之一。5.5.4 知识计算主要专利情况主
135、要专利情况根据数据统计显示,知识计算技术的全球专利申请量约 1479 个。应用趋势应用趋势知识计算技术专利申请量从 2012 年到 2022 年呈现出逐年增长的趋势。其中,2017 年至 2021 年专利申请量增长迅速,而 2022 年申请量较前一年有比较明显的下降,增长数量为 167 个。专利申请数量最高的一年是 2021 年,达到的专利数量为 310 个。从应用场景和领域的角度来看,此类技术在辅助城市设计方面应用价值非常高,通过挖掘相关工程数据价值为最佳建筑设计方案的确定提供依据。此外,在人工智能技术领域,知识计算是非常重要的一项技术,也是未79来发展的重点之一。因此,预计未来知识计算技术
136、专利申请数量仍然会保持较高的增长趋势。5.5.5 知识抽取主要专利情况主要专利情况根据数据统计显示,知识抽取技术的全球专利申请量约 124 个。应用趋势应用趋势知识抽取技术从 2012 年到 2022 年期间的专利申请数量整体呈现增长的态势,其中 2017 年到 2022 年保持比较快的增长水平。知识抽取技术作为知识图谱核心关键技术,自 2015 年以来一直受到较高的重视。利用知识抽取为多个领域和应用场景的智能化、高效化提供技术支持。从专利申请数量的变化趋势也可看出,近年知识抽取在建筑审图方面的技术研究和应用整体呈较快发展趋势。5.5.6 图像处理技术主要专利情况主要专利情况根据数据统计显示,
137、图像处理技术的全球专利申请量约 85 个。应用趋势应用趋势从数据变化幅度来看,图像处理技术专利申请量 2012 年至 2017 年呈现缓慢增长趋势,而 2018 年至 2021 年这四年该技术专利申请量较前几年增长显著。然而,2022 年申请量较前一年减少,且低于 2017 年前数量,可能与新冠疫情影响有关。从专利申请量近些年变化趋势可以看出,2012 年至 2017 年图像处理技术仍在发展中,对于提高图像处理质量的技术基础仍不成熟,到 2018 年随着技术积累和发展,图像处理技术及相关应用有了较为明显的进步。5.5.7 专家系统主要专利情况主要专利情况根据数据统计显示,专家系统技术的全球专利
138、申请量约 116 个。80应用趋势应用趋势专家系统这项技术在过去几年中呈现出不同程度的波动。具体来说:2012年和 2015 年,全球每年专利申请量为 3,这可能是由于该技术的新颖性和潜在市场需求,之后在 2013 年和 2014 年,全球每年专利申请量出现停滞,或许是因为竞争加强和市场需求的疲软等原因。到了 2016 年,专利申请量有了小幅反弹,达到 2 项。这表明该技术可能在市场中开始受到更多的重视和使用。2017 年和 2018 年,专利申请量逐渐攀升至 5 和 6 项,这可能是由于该技术被更多和机构采用,也可能是由于技术改进、成本降低和市场需求扩大等因素的综合作用。2019 年和 20
139、20 年,专利申请量又快速增加到 30 和 12 项,这可能是由于技术的认可度增加、市场活力增强等因素。到了 2021 年,专利申请量再度上升至 28 项,这表明该技术在市场上前景和需求较大,最后 2022 年专利申请数量波动下降至 7 项,可能是由于全球新冠肺炎疫情的冲击。总体来看,该技术的专利申量呈现出一定的波动和变化,但从趋势来看,该技术近年来还是逐渐获得市场认可。5.5.8 知识表示主要专利情况主要专利情况根据数据统计显示,知识表示技术的全球专利申请量约 337 个。应用趋势应用趋势知识表示技术领域的全球专利申请量在过去十年中呈现一个逐年递增的趋势。其中,2016 年的专利申请量比 2
140、012 年增长了三倍以上,2021 年的专利申请量比 2017 年增长了超过两倍。值得关注的是,2022 年的申请量出现了下降,这可能与技术的成熟度和市场变化有关。此外,知识表示是一种将建筑设备故障诊断网络模型在线化,实现实际数据、参数、模型与理论模型的实时交互、双向修正的技术,可以将最合理的结果反馈给用户,提高操作效率。因此,知识表示技术在建筑设备故障诊断、设备控制、建筑智能运维等领域的应用前景非常广阔,未来还有很大的发展空间。815.5.9 BP 神经网络算法主要专利情况主要专利情况根据数据统计显示,BP 神经网络算法的全球专利申请量约 257 个。应用趋势应用趋势BP 神经网络算法领域的
141、全球专利申请量在过去十年中呈现一个逐年递增的趋势。其中,2015 年的专利申请量比 2012 年增长了一倍以上,2020 年的专利申请量比 2016 年增长了超过三倍。值得关注的是,2021 年、2022 年的申请量较之 2020 年出现了下降,这可能与技术的成熟度和市场变化有关。此外,利用BP 神经网络建立建筑光伏发电功率预测模型,通过光伏发电模型和光伏发电的工程计算公式来预测得到光伏出力,可以制定和安排合理的可再生能源发电调度曲线,能够有效避免可再生能源发电功率的波动性对电网产生的影响,确保源荷供需平衡。因此,BP 神经网络算法在建筑能源智慧管理、可再生能源预测、建筑能源互联网等领域的应用
142、前景非常广阔,未来还有很大的发展空间。5.5.10 多智能体强化学习算法主要专利情况主要专利情况根据数据统计显示,多智能体强化学习算法的全球专利申请量约 397 个。应用趋势应用趋势从年度专利申请量来看,该算法专利的趋势呈现出先升后降的态势。2020年是专利申请量的高峰年,达到了 81 项,之后 2021 年、2022 年多智能体强化学习算法专利申请数量有所下降,分别为 66 项和 38 项,但仍处于高水平。该算法的增长趋势提示人工智能算法在实际应用中有着重要的作用,越来越多的和个人开始注重多智能体场景的建筑能耗算法研究,即每个强化学习智能体分别控制建筑中央空调系统的各个子设备,能够有效加强整
143、体的学习效率多源数据的融合。在今后的发展中,该多智能体强化学习算法领域仍然值得关注和重视,具有潜力。825.5.11 模型预测控制算法主要专利情况主要专利情况根据数据统计显示,模型预测控制算法的全球专利申请量约 306 个。应用趋势应用趋势模型预测控制算法专利从 2012 年至 2022 年,全球每年专利申请量呈现出一定波动,但总体上呈现逐年上升的趋势。具体分析如下:2012 年至 2014 年,该技术专利申请数量较为稳定,申请数量分别为 2 项、2 项和 5 项,可能是因为该算法还未被广泛应用导致申请数量较少。2015 年和 2016 年间该算法专利申请数量明显增加,但 2017 年专利申请
144、数量有所回落,数量为 19 项,这可能是由于相关市场需求下降所导致;2018 年至 2020 年,该技术专利申请数量持续增加,且增长速度较为平稳。这可能是因为该技术在多个领域得到应用,如建筑能耗预测、负荷预测等领域的技术创新和商业应用,逐渐提升了该技术的市场价值和研发投入。2021 年至 2022 年,该技术专利申请数量略有下降,这可能是因为该技术已经成为主流技术,市场饱和度较高导致创新力度的下降,或者市场对该技术的认知和需求在短时间内有所下降。综合来看,模型预测控制算法在未来仍有一定的发展空间,但需要进一步加强技术创新和专利布局,以提高该技术在商业应用中的竞争力。5.5.12 多目标优化算法
145、主要专利情况主要专利情况根据数据统计显示,多目标优化算法的全球专利申请量约 119 个。应用趋势应用趋势多目标优化算法专利从 2012 年至 2022 年,全球每年专利申请量呈现出一定波动,但总体上呈现逐年上升的趋势。具体分析如下:2012 年至 2014 年,该技术专利申请数量增速较快,申请数量分别为 2 项、7 项和 19 项,可能是因为该算法市场需求较大。2015 年和 2018 年间该算法专利申请数量增长趋势较为平稳,2018 年专利申请数量为 10 项;2019 年至 2020 年,该技术专利申请83数量增长速度加快,这可能是因为该技术在多个领域得到广泛应用。2021 年至 2022
146、 年,该技术专利申请数量略有下降,但总体仍呈现增长趋势,这可能是因为该技术已经成为主流技术,市场饱和度较高导致创新力度的下降,或者市场对该技术的认知和需求在短时间内有所下降。综合来看,多目标优化算法在未来仍有一定的发展空间,但需要进一步加强技术创新和专利布局。5.5.13 知识融合主要专利情况主要专利情况根据数据统计显示,知识融合技术的全球专利申请量约 405 个。应用趋势应用趋势全球知识融合技术专利在最初几年(2012 年-2014 年),专利申请数量较多,分别为 25 项、28 项、20 项。2015 年申请数量为 15 项,略有下降。2016年申请数量又增为 37 项,2017-2020
147、 年申请数量较前几年呈现增长趋势,分别为 32 项、62 项、46 项,说明该技术得到越来越多的关注。到 2021 年、2022 年申请量略有下降,但仍处于高水平。该技术的增长趋势提示知识融合在实际应用中有着重要的作用,越来越多的和个人开始注重和研究多源数据的融合。在今后的发展中,此技术也有望继续保持高速增长。5.5.14 随机森林主要专利情况主要专利情况根据数据统计显示,随机森林算法的全球专利申请量约 130 个。应用趋势应用趋势这项技术专利申请的数量从 2012 年的 9 项开始增加到 2013 年的 15 项,2014 年-2016 年该算法相关的专利申请数量较少,维持在 3-6 项之间
148、,2017 年至 2021 年期间,申请数量波动较大,但均保持在 10 项以上的申请量,这可能与该领域技术的研究和应用进展有关,也可能受到市场需求变化等外部因素的影响。总体来说,随机森林的专利申请数量呈现出逐年增长的趋势,说明该领域具84有广阔的市场前景,也表明人们对建筑设备全生命周期的预防性维护、健康状态评估和管理的关注与日俱增,同时也对这项技术的研究投入越来越多。5.5.15 粒子群算法主要专利情况主要专利情况根据数据统计显示,粒子群算法领域的全球专利申请量约 171 个。应用趋势应用趋势从年度专利申请量来看,该技术专利的申请数量趋势波动较大。2021 年是专利申请量的高峰年,达到了 26
149、 项.前几年中(2012 年-2015 年)专利申请数量波动较大,分别为 6 项、1 项、10 项、5 项,这可能由于该项算法刚兴起,各领域的应用场景仍在探索中。之后 2016 年至 2021 年期间,每年相对稳定在15-26 项之间。该领域的专利申请量相对稳定,但是波动也较大。值得关注的是,2022 年的申请量出现了下降,这可能与技术的成熟度和市场变化有关。5.5.16 生物特征识别主要专利情况主要专利情况根据数据统计显示,生物特征识别技术的全球专利申请量约 770 个。应用趋势应用趋势生物特征识别技术领域的全球专利申请量在过去十年中呈现一个逐年递增的趋势。其中,2014 年的专利申请量比
150、2012 年增长了一倍以上,2020 年的专利申请量比 2018 年增长了超过一倍。值得关注的是,2021 年和 2022 年的申请量出现了下降,这可能与技术的成熟度和市场变化有关。此外,目前以计算机视觉识别为基础的生物体特征识别方式已逐渐开始成熟,这些特征包含面部特征,以及更细微的如人眼的虹膜、掌纹、声纹乃至步态等。尽管机器与生物体之间的交流还无法突破机械手段,各种信息和数据的录入手段还有待突破,但是机器能够通过视觉识别、生物特征检测等技术检测图像中的人是否是活体存在的,能够借助后台数据的对比鉴别图像中的人员身份信息,甚至识别图像中人员行动的轨85迹和姿势。因此,生物特征识别技术在智能安防领
151、域的应用前景非常广阔,未来还有很大的发展空间。5.5.17 图像识别主要专利情况主要专利情况根据数据统计显示,图像识别技术的全球专利申请量约 868 个。应用趋势应用趋势图像识别技术领域的全球专利申请量在过去十年中呈现一个逐年递增的趋势。其中,2016 年的专利申请量比 2012 年增长了三倍以上,2020 年的专利申请量比 2017 年增长了超过两倍。值得关注的是,2021 年和 2022 年的申请量出现了下降,但仍保持在较高申请量,分别为 160 项、107 项,这可能与技术的成熟度和市场变化有关。从整体上看,图像识别技术专利申请数量呈现出上升趋势,特别是从 2019 年起开始增长较快,这
152、表明图像识别技术受到越来越多的关注和投资。综上所述,图像识别技术在未来可能会得到更多的发展和应用,这也意味着图像识别技术的市场潜力巨大,有望成为未来的重要技术之一。5.5.18 行为分析主要专利情况主要专利情况根据数据统计显示,行为分析技术的全球专利申请量约 444 个。应用趋势应用趋势从数据变化幅度来看,行为分析技术专利申请量 2012 年至 2015 年呈现缓慢增长趋势,而 2017 年至 2020 年这三年该技术专利申请量较前几年增长显著。然而,2021 年、2022 年申请量较前一年减少,但仍较高于 2019 年前数量,可能与新冠疫情影响有关。从专利申请量近些年变化趋势可以看出,201
153、2 年至2019 年行为分析技术仍在发展中,对于行为分析技术的基础仍不成熟,到 2019年随着技术积累和发展,行为分析及相关应用有了较为明显的进步。865.5.19 Elman 神经网络算法主要专利情况主要专利情况根据数据统计显示,Elman 神经网络算法领域的全球专利申请量约 759 个。应用趋势应用趋势从 2012 年到 2016 年,Elman 神经网络算法领域的专利申请数量一直呈现缓慢增长态势,但在 2016 年后呈现出爆发式增长,2020 年和 2021 年的专利申请数量双双突破了 143 项和 134 项。受疫情影响,2020 年 Elman 神经网络算法领域的专利申请数量出现了小
154、幅下降,但在 2021 年增长数量出现回弹。2022 年申请数量忽然下降为 58 项,可能是由于技术已经成熟、市场逐渐饱和等因素。从整体上看,Elman 神经网络算法专利申请数量呈现出上升趋势,特别是从 2016 年起开始增长较快,这表明Elman 神经网络算法受到越来越多的关注和投资。综上所述,声纹识别技术在未来可能会得到更多的发展和应用。5.5.20 知识推理主要专利情况主要专利情况根据数据统计显示,知识推理技术的全球专利申请量约 650 个。应用趋势应用趋势从上述数据中可以看出,知识推理技术专利申请数量逐年上升,呈现出增长趋势。在 2012 年至 2014 年期间专利申请数量出现大幅增长
155、,但在 2015 年数量下降为 15 项,自 2016 年至 2020 年期间该技术专利申请数量又快速增长,2020 年达到申请量突破了之前的记录,达到最大值 127 项。但在 2021 年和 2022 年期间,专利申请数量又突然下降,2022 年申请数量为 65 项,这可能是因为市场的饱和度和竞争加剧所致。总的来说,尽管专利申请数量的增长速度有所波动,但总的趋势仍然是上升的,这表知识推理技术在未来仍将得到广泛的关注和应用。875.5.21 图像分类主要专利情况主要专利情况根据数据统计显示,“图像分类”技术的全球专利申请量约 1108 个。应用趋势应用趋势从 2012 年到 2019 年,图像
156、分类技术的专利申请数量一直呈现缓慢增长态势,但在 2019 年后呈现出大幅增长,2020 年和 2021 年的专利申请数量双双突破了 17 项和 15 项。然而,2022 年的申请量下降为 11 项,可能与市场需求或者技术发展方向有关。通过比较前几年的数据,可以看出图像分类技术在未来几年内持续发展,受到了全球范围内的广泛关注和投资。这也反映出图像分类技术在不同领域中的广泛应用前景,包括城市评估体检、遥感影像识别、车载行业等。综上所述,图像分类技术在未来可能会得到更多的发展和应用,这也意味着图像分类技术的市场潜力巨大,有望成为未来的重要技术之一。5.5.22 知识建模主要专利情况主要专利情况根据
157、数据统计显示,“知识建模”技术的全球专利申请量约 87 个。应用趋势应用趋势“知识建模”技术专利申请量呈逐年上升的趋势,但在 2012 年至 2016 年之间,增长幅度相对较小。从 2016 年开始,专利申请量开始快速增长,每年的增幅也逐步扩大,直到 2020 年达到峰值,其后在 2021 年、2022 年稍有回落。可以看出,在这十年间,“知识建模”技术备受关注,专利申请量得到了显著增长,这也反映了该领域的研究和发展持续推进。88第六章 智慧座舱第六章 智慧座舱6.1.产业定义智慧座舱最初运用于飞机上,包括高分辨率显示屏、先进的飞行控制系统、自动化系统、数据链接和人机界面等。智慧座舱旨在提高飞
158、行员的工作效率和安全性,同时减少人为错误和疲劳。近年来,汽车不断向智能化发展。智能座舱、智能驾驶作为汽车智能时代双子星。智慧座舱包括了带给驾驶员和乘客更加安全、舒适、智能的驾乘体验所有模块,包括操控系统、娱乐系统、空调系统、通信系统、座椅系统、交互系统、感知系统等。从车内看,智能座舱是座舱内饰、座舱电子产品的综合创新、升级和联动。智能座舱内饰包括座椅、灯光、空调等,用户可以对座舱内各内饰功能进行控制,伴随语音语义识别、机器视觉等技术的发展,座舱内饰的智能化程度逐渐提升。智能座舱电子产品包括全液晶仪表、车载信息娱乐系统、车联网模块、抬头显示(HID)、流媒体后视镜等汽车电子设备。同时也将与智能手
159、机、手表等实现互联,进而与智慧家庭、智慧办公等场景无缝衔接,助力互联的全面打通,最终实现将汽车由单一的驾驶、乘坐工具升级为一个以消费者为中心的“智能移动空间”。从车外看,智能座舱将通过车联网、无线通信、远程感应、GPS 等技术,与车外的各项基础网联设施、联网设备实现 V2X(Vehicle-to-Everything)联结。感知交通信号、路况、车外娱乐生活场景信号,助力自动驾驶感知层和决策层的工作,进而推动高阶自动驾驶的实现。除此之外,为了提高座舱 AI 算力,模拟人的思考、更懂人、感知人,从而主动精确地提供服务,座舱内部的决策运算工作也将扩展至车外,在车载芯片外建立独立感知层,由云端计算中心
160、统一提供AI 算力。896.2.主要技术点分类6.3.主要技术在产业的应用6.3.1 语音交互以车载场景下的人机对话交互为核心,融合智能导航、多媒体娱乐、车身控制、驾驶行为监控、车况监控等智能座舱人机交互需求,围绕“语音交互智能+云端互联服务”,改变传统车载设备以触控、按键为核心的操控模式,改善交互体验,有效确保驾乘安全。906.3.2 视觉交互借助车载摄像头硬件,视线、手势等就交互方式已逐渐应用落地,通过视线估计确定最终的注视位置进行交互,同时手势在触屏交互中应用广泛,有效提升用户在驾乘中的用户体验。6.3.3 多模态交互借助车载摄像头硬件,视线、手势等就交互方式已逐渐应用落地,通过视线估计
161、确定最终的注视位置进行交互,同时手势在触屏交互中应用广泛,有效提升用户在驾乘中的用户体验。6.3.4 身份认证基于生物特征识别进行身份认证是一套集多种生物识别技术于一体的平台。以人脸、指静脉、虹膜为核心的多种生物识别技术,建立跨平台的、开放的、可扩展的生物特征识别身份认证平台,实现用户身份的安全便捷、真实、准确的认证,进而为用户提供个性化的服务。916.3.5 座舱视觉感知基于计算机视觉技术,包含驾驶员监测系统(DMS)、乘客监测系统(OMS)、物体识别与人车交互系统等功能,具有高精度、高效率、高鲁棒性等核心优势。通过这套解决方案,可为智能汽车提供领先可靠的舱内感知技术及相关配套服务,全方位保
162、障舱内驾乘体验的安全性与舒适性。6.3.6 多模态知识图谱知识图谱能够通过挖掘,通过语义关联把各种实体关联起来,构建大型语义网络,从而把结构化、非结构化的数据通过数据抽取、融合在一起,能够有助于更好的高效利用数据。6.3.7 车载信息安全智能网联汽车的信息安全防护不只是单指保障车辆本身的信息安全,而是一个由于包含了通讯、云平台和外部的新兴生态系统组成的整体性生态安全预警和防护,同时这种安全预警也需要长期地进行,需要定期地对整个生态系统做好安全性的检测,以便于发现潜在的危害性926.3.8 车载终端1)数据采集和存储:T-BOX 通过接口接入 CAN 总线,通过 CAN 网络进行数据采集。主要对
163、车辆信息、整车控制器信息、电机控制器信息、电池管理系统 BMS、车载充电机等数据进行采集并解析。采集信息后,T-BOX 按照最大不超过 30s 时间间隔,将采集到的实时数据保存在内部存储介质中,若出现 3级报警时,会按照最大不超过 1s 时间间隔保存。智能车载终端广泛应用后,某些采集的信息经过处理会集中显示在车载终端的显示屏上,用户有统一的操控界面,提升用户体验。2)远程查询和控制:用户可以通过手机 APP 可以实现远程查询车辆状态,比如车辆油箱里还有没有油,车窗车门有没有关牢,电池电量还有多少够不够用,还可以行驶多久等等;还可以控制门开关、鸣笛闪灯、开启空调、启动发动机、车辆定位等等。其运行
164、流程是,首先用户通过 APP 发送命令,接下来TSP 后台发出监控请求指令到车载 T-BOX,车辆获取控制命令后,通过 CAN总线发送控制报文并实现对车辆的控制,最后反馈操作结果到用户的手机 APP上。3)道路救援:这一项主要是针对行车安全而设计的,包含了路边救援协助、紧急救援求助、车辆异动自动报警、车辆异常信息远程自动上传等服务。这些功能可以保障车主的生命安全,如碰撞自动求救功能,车辆碰撞触发安全气囊后,T-BOX 会自动触发乘用车客户救援热线号码,自动上传车辆位置信息至后台,同时后台将发信息给所有紧急联系人,短信中包含事故位置信息,以及事件信息,让事故车辆和人员得到及时的救援。4)故障诊断
165、:提供胎压检测系统、发动机管理系统、变速箱控制系统、辅助保护系统等自助诊断服务,及时反馈车辆状态报告(四门开关状态,后备箱开关状态,四门玻璃状态、发动机机舱盖状态、驻车标志等)以及远程仪表台(燃油剩余量、剩余电量、可续航里程、总里程、百公里油耗、车辆停放位置、机油油量报警)。935)异常提醒:车辆异常报警、车被拖走报警、防盗报警、被盗车辆跟踪、安全证书校验等。6.3.9 自动控制系统自动控制系统主要指座舱内车辆自主控制功能,如智能车窗、智能空调、智能座椅调节等。6.3.10 智能座舱硬件虚拟化智能座舱硬件虚拟化是运行在座舱物理硬件与虚拟终端之间的软件技术,封装后的虚拟化层可访问座舱底层的处理器
166、、内存和外围设备等硬件资源。此外,虚拟化还提供硬件设备共享功能,多个终端可共享使用座舱内的网络链路、存储和设备。6.3.11 体验评价管理汽车智能座舱域用户体验评价管理主要致力于建立以用户体验为中心的评价计算方法,形成准确、客观的用户体验评价指标和计算结果,进而为整个座舱域的软硬设计、算法实现等技术提供指导和评测。946.4.产业技术成熟度分析6.4.1 学术界与产业界成果四象限图956.4.2 热度-供给图与阶段-供给图966.5.技术分析6.5.1 方言及多语种语音识别主要专利情况主要专利情况根据数据统计显示,“方言及多语种语音识别”技术的全球专利申请量442个。应用趋势应用趋势“方言及多
167、语种语音识别”技术专利申请量呈现出逐年增长的趋势。其中,从2013 年至 2014 年,增长迅速,专利申请量提升了近两倍;从 2014 年至 2015年,增长仍然较快,达到了三分之一的增长;而从 2015 年至 2022 年,增长速度更加平稳,每年增长数目均在 10 个以上。专利申请数量最高的一年是 2021年,达到的专利数量为 57 个,而 2022 年的数量则有所下降。从应用场景和领域的角度来看,此类技术的应用非常广泛,包括语音翻译、智能客服、自动驾驶等多个方面。随着跨境贸易和国际化程度的加深,对多语言语音识别的需求愈发紧迫,专利申请数量依然呈现出增长趋势。此外,在人工智能技术领域,语音识
168、别是非常重要的一项技术,也是未来发展的重点之一。因此,预计未来“方言及多语种语音识别”技术专利申请数量仍然会保持较高的增长趋势。6.5.2 方言及多语种合成主要专利情况主要专利情况根据数据统计显示,“方言及多语种合成”技术的全球专利申请量约 89 个。应用趋势应用趋势“方言及多语种合成”技术专利申请量在过去的几年内呈现出不同的趋势。2012 年到 2013 年期间,该技术没有任何专利申请。从 2014 年开始,专利申请量开始增加,并在 2015 年达到了 3 项。之后,在 2016 年和 2017 年,该技术专利申请量再次下降至 0 项。然而,自 2018 年以来,该技术又呈现出快速增长的趋势
169、,特别是 2021 年和 2022 年,该技术的专利申请量达到 10 项和 7 项,分别是过去十年中专利申请数量最高的两年。从技术应用场景来看,“方言及多语种97合成”技术可以广泛应用于语音合成、机器翻译、语言学习等领域。目前,全球越来越多的人们开始意识到语言多样性的重要性,因此需要针对不同语种和方言进行研究和开发。另一方面,随着全球化进程的加快,对多语种处理技术的需求正不断增长。从现有数据来看,“方言及多语种合成”技术具有非常广阔的应用前景,未来在机器翻译、语音合成、语音识别等领域中的市场需求将会越来越大。从技术发展的角度来看,这个趋势可能与人工智能和自然语言处理技术的不断发展以及细分领域的
170、深入应用有关。在应用方面,“方言及多语种合成”技术可以应用于语音合成、语音识别和多语言翻译等领域,这些应用领域的广泛需求可能促进了该技术的发展。总的来说,“方言及多语种合成”技术的专利申请量表明了该技术日益受到重视,并在不同应用领域得到广泛的应用。6.5.3 声音个性化复刻主要专利情况主要专利情况根据数据统计显示,“声音个性化复刻”技术的全球专利申请量约 106 个。应用趋势应用趋势“声音个性化复刻”技术专利在 2013 和 2016 年都没有申请,说明技术在这段时间内的发展较为缓慢。之后在 2017 年有 1 项申请,2018 年突然增加到 9 项申请,说明技术在这个时期开始得到更多的关注和
171、应用。之后申请数量保持在3-8 项之间,2021 年却突然增加到 12 项,表明技术在这个时期得到了更多的关注和应用,应用范围也在不断扩大。总体来看,从低谷到高峰再到逐渐稳定,展示了“声音个性化复刻”技术在全球的逐渐普及和稳定应用趋势。6.5.4 高性能鲁棒语音识别主要专利情况主要专利情况根据数据统计显示,“高性能鲁棒语音识别”技术的全球专利申请量 85 个。应用趋势应用趋势98“高性能鲁棒语音识别”技术专利的申请数量从 2013 年至 2019 年间呈现逐年上升的趋势,其中 2019 年申请量的增长幅度非常明显,与之前几年的申请量相比增加了很多。而在 2020 年和 2021 年,申请量相对
172、于前一年有所下降,但没有出现明显的跌幅。最近一年,即 2022 年,申请量再次下降,回归到之前的水平。基于以上数据的变化趋势,可以看出该技术在 2010 年代末期受到了更多的关注,专利申请数量逐步上升,但在最近两年却出现了稍微的下降。其中 2019年的申请量增长比较明显,可能是由于行业发展的迅速和技术的迭代加速,促使对该技术的创新和研发产生了更大的需求。但是,在技术应用和市场落地的过程中也遇到了很多挑战,可能是导致最近两年申请量略有下降的原因之一。6.5.5 全双工对话主要专利情况主要专利情况根据数据统计显示,“全双工对话”技术的全球专利申请量约 49 个。应用趋势应用趋势2014 年到 20
173、16 年期间,每年的专利申请量相对比较稳定,都是 2 个左右。但是在 2017 年至 2019 年之间,专利申请量有所增加,从 2 个逐年增加到 4 个。而在 2020 年,专利申请量快速上升到 5 个,随后在 2022 年更是激增到了 8 个,呈现出了明显的增长趋势。这种趋势显示出全双工对话技术在近年来受到了越来越多的关注,并且在技术应用、商业模式等方面也取得了可观的进展。特别是在2020 年以后,受到新冠疫情的影响,全球线上交流需求的快速增长,也促进了全双工对话技术的应用。同时,随着 5G、人工智能等新技术的不断发展,全双工对话技术的应用场景也会越来越广泛,因此其专利申请量的增长趋势也将得
174、到进一步的加强。6.5.6 语音合成主要专利情况主要专利情况根据数据统计显示,“语音合成”技术的全球专利申请量约 1552 个。99应用趋势应用趋势从数据变化幅度来看,语音合成技术专利申请量呈逐年增加趋势,尤其是在2019 年至 2021 年这三年内,增幅显著。然而,2022 年的申请量突然下降,可能与市场需求或者技术发展方向有关。通过比较前几年的数据,可以看出语音合成技术在未来几年内持续发展,受到了全球范围内的广泛关注和投资。这也反映该技术在不同领域中的广泛应用前景,包括教育、医疗、智能家居、车载行业等。6.5.7 情感语音合成主要专利情况主要专利情况根据数据统计显示,“情感语音合成”技术的
175、全球专利申请量约 342 个。应用趋势应用趋势自 2013 年至 2022 年,全球“情感语音合成”领域的专利申请呈现逐年增长的趋势。特别是在 2015 年之后,专利申请数量迅速增加。这说明情感语音合成技术逐渐受到了更多的关注和研究,可能意味着在未来该技术将会得到更广泛的应用和发展。此外,从 2018 年开始每年专利申请数量增长幅度开始缓和,可能表明该技术的发展进入稳定期,专利数量增长速度不会再保持之前的高速增长。6.5.8 声纹识别主要专利情况主要专利情况根据数据统计显示,“声纹识别”技术的全球专利申请量约 173 个。应用趋势应用趋势从2012年到2019年,声纹识别技术的专利申请数量一直
176、呈现缓慢增长态势,但在 2019 年后呈现出爆发式增长,2021 年和 2022 年的专利申请数量双双突破了 25 项和 20 项。受 COVID-19 疫情影响,2020 年声纹识别技术的专利申请数量出现了小幅下降,但在 2021 年又迎来了爆发式增长。从整体上看,声纹识别技术专利申请数量呈现出上升趋势,特别是从 2019 年起开始增长较快,这表明声纹识别技术受到越来越多的关注和投资。综上所述,声纹识别技术在未来可能100会得到更多的发展和应用,这也意味着声纹识别技术的市场潜力巨大,有望成为未来的重要技术之一。6.5.9 语义理解主要专利情况主要专利情况根据数据统计显示,“语义理解”技术的全
177、球专利申请量约 37 个。应用趋势应用趋势“语义理解”技术专利申请量的变化趋势如下:在 2013 年和 2014 年,该技术还没有得到很多关注和专利申请。但是,自 2015 年起,专利申请开始逐渐增加,并在 2019 年达到了一个高峰,随后略微下降。而在 2022 年,专利申请数量大幅上升,达到了 15 项,显示出该技术受到越来越多关注和投资。总体上看,“语义理解”技术在全球专利申请量上呈现出逐渐递增的趋势,表明该技术在未来可能会有更多的应用和发展。需要注意的是,专利申请数量的上升并不能直接反映出技术的发展水平和商业化前景,但对于科技发展趋势及技术研究方向的分析仍有一定的参考价值。6.5.10
178、 多轮对话管理主要专利情况主要专利情况根据数据统计显示,“多轮对话管理”技术的全球专利申请量约 7 个。应用趋势应用趋势从 2013 年至 2021 年,全球该技术的专利申请量始终为 0,说明该技术领域在该时期内并不是专利申请的热点。但是,2021 年专利申请量突然增加到 1,这可能意味着该技术领域引起了某些我国公司或研究机构的关注。接下来,2022年专利申请量增加到了 6,显示出该技术领域的专利申请量正在逐步增加,这表明国人工智能技术在这个领域的应用前景越来越受到重视,研究和开发活动也越来越频繁。总的来看,这种变化趋势表明,该技术领域的研究和开发可能会在未来几年内得到更多的投资和关注。101
179、6.5.11 智能问答主要专利情况主要专利情况根据数据统计显示,“智能问答”技术的全球专利申请量约 59 个。应用趋势应用趋势智能问答技术在近几年的发展非常迅速。在 2013 年至 2015 年期间,该技术的专利申请量很少。但随着技术的逐渐成熟,从 2016 年开始,每年的专利申请数量都在逐渐增加。特别是在 2021 年,智能问答技术的专利申请数量达到了 13项,这意味着该技术领域的创新和研究引起了更多的关注。对于这种变化趋势,我们可以解读为智能问答技术的研究和应用越来越受到重视,越来越多的和研究机构开始投资和研究这一领域。同时,我们可以预见到智能问答技术在未来会逐渐普及和应用到各种应用场景中
180、,例如智能客服、智能家居等、智能车载等领域。6.5.12 多模态交互主要专利情况主要专利情况根据数据统计显示,“多模态交互”技术的全球专利申请量约 622 个。应用趋势应用趋势多模态交互技术领域的全球专利申请量在过去十年中呈现一个逐年递增的趋势。其中,2014 年的专利申请量比 2013 年增长了一倍以上,2021 年的专利申请量比 2018 年增长了超过一倍。值得关注的是,2022 年的申请量出现了下降,这可能与技术的成熟度和市场变化有关。此外,多模态交互是一种将多种交互方式(如语音、手势、触控等)结合起来的技术,可以大大提高用户的交互体验和操作效率。因此,多模态交互技术在智能家居、智能手机
181、、汽车等领域的应用前景非常广阔,未来还有很大的发展空间。6.5.13 智能推荐主要专利情况主要专利情况根据数据统计显示,“智能推荐”技术的全球专利申请量约 98 个。102应用趋势应用趋势智能推荐技术的专利申请量在过去的十年里出现了逐步增加的趋势,其中2013、2015 年的申请量相对较低,而 2017 年之后的申请量有了较大的增长,尤其是 2021 年的申请量达到了 16 项。这表明“智能推荐”技术在过去的几年中受到了越来越多的关注和应用,这种趋势在未来也可能会继续保持下去。此外,在2014 年和 2016 年也出现了相对较高的专利申请量,这可能与相关技术的创新和发展有关。值得一提的是,从
182、2018 年到 2022 年,每年的申请量较为稳定,在11-16 项之间波动。这表明该技术领域已经逐渐稳定下来,相关公司和研究机构在专利申请方面已经形成了一定的规律和节奏。6.5.14 多源数据融合主要专利情况主要专利情况根据数据统计显示,“多源数据融合”技术的全球专利申请量约 620 个。应用趋势应用趋势全球“多源数据融合”技术专利的申请量在过去十年中逐年增加。在最初几年(2012 年-2014 年),专利申请仅有数个,但自 2015 年开始,该技术得到越来越多的关注,专利申请量开始呈现逐年增加的趋势。特别是在 2019 年到 2021年间,专利申请量迅速增加,2021 年达到了 146 个
183、,到 2022 年申请量略有下降,但仍处于高水平。该技术的增长趋势提示数据融合在实际应用中有着重要的作用,越来越多的和个人开始注重和研究多源数据的融合。在今后的发展中,此技术也有望继续保持高速增长。6.5.15 疲劳监测主要专利情况主要专利情况根据数据统计显示,“疲劳监测”技术的全球专利申请量约 182 个。应用趋势应用趋势这项技术专利申请的数量从 2013 年的 1 份开始逐年增加,在 2021 年达到32 份的高峰后略有下降。其中,2015 年和 2020 年的专利申请数量增幅最为显著。103这可能与该领域的技术研究和市场需求增长有关。此外,虽然整体趋势是增长的,但每年的申请数量波动较大,
184、可能与该技术的研究和应用进展有关,也可能受到市场需求变化等外部因素的影响。总体来说,疲劳监测技术的专利申请数量呈现出逐年增长的趋势,说明该领域具有广阔的市场前景,也表明人们对健康和安全的关注与日俱增,同时也对这项技术的研究投入越来越多。6.5.16 入侵检测防御主要专利情况主要专利情况根据数据统计显示,“入侵检测防御”技术的全球专利申请量约 116 个。应用趋势应用趋势“入侵检测防御”技术专利申请量在过去十年中呈现出较为明显的波动趋势,但整体呈上升趋势。具体来看,从 2013 年至 2014 年,专利申请量增长了约150%,从 5 项升至 10 项;但 2015 年至 2016 年,专利申请量
185、相对下降,持平于3 项。之后,2017 年至 2022 年间,专利申请量再次增长,年平均增长率超过 30%。这显示出,“入侵检测防御”技术在当前和未来都是一个备受关注和投资的领域,也反映出该技术的发展前景广阔。从行业应用角度看,该技术可用于网络安全领域,保护信息安全,防止信息泄漏和黑客入侵等问题。随着人工智能技术的不断发展和应用,需要加强对网络安全的保护和防御,因此,还有较大的发展空间。6.5.17 用户连接单元主要专利情况主要专利情况根据数据统计显示,“用户连接单元”技术的全球专利申请量约 2261 个。应用趋势应用趋势该技术领域的专利申请量在过去的十年间呈现出逐年上升的趋势。从 2013年
186、开始,每年专利申请量都有所增加,并在 2017 年、2018 年、2019 年、2020年和 2021 年出现了较为明显的增长。而 2022 年的专利申请量则出现了明显的下降,相较于 2021 年减少了近 40%的申请量。这种变化可能表明该技术领域在近104几年快速发展,不断涌现出新的创新技术。同时,2022 年的专利申请量下降也可能是由于该技术领域的竞争趋于饱和,已经存在的专利已经足够维护市场份额。此外,与该技术领域相关的政策、市场、技术等方面的变化也可能是导致专利申请量变化的原因。6.5.18 3D 虚拟形象主要专利情况主要专利情况根据数据统计显示,“3D 虚拟形象”技术的全球专利申请量约
187、 209 个。应用趋势应用趋势“3D 虚拟形象”技术专利从 2013 年至 2022 年,全球每年专利申请量呈现出一定波动,但总体上呈现逐年上升的趋势。具体分析如下:2013 年至 2015 年,该技术专利申请数量较为稳定,2014 年申请数量为 0 可能是因为该技术还未被广泛应用或者相关的专利已经全部被申请,导致申请数量较少。2016 年至 2020年,该技术专利申请数量持续增加,其中 2017 年至 2020 年增长较为明显。这可能是因为该技术在多个领域得到应用,如 3D 电影、虚拟现实、游戏等领域的技术创新和商业应用,逐渐提升了该技术的市场价值和研发投入。2021 年至 2022年,该技
188、术专利申请数量略有下降,这可能是因为该技术已经成为主流技术,市场饱和度较高导致创新力度的下降,或者市场对该技术的认知和需求在短时间内有所下降。综合来看,“3D 虚拟形象”技术在未来仍有一定的发展空间,但需要进一步加强技术创新和专利布局,以提高该技术在商业应用中的竞争力。6.5.19 AR 交互技术主要专利情况主要专利情况根据数据统计显示,“AR 交互技术”技术的全球专利申请量约 1283 个。应用趋势应用趋势从上述数据中可以看出,AR 交互技术专利申请数量逐年上升,呈现出增长趋势。在 2013 年至 2016 年期间,专利申请数量的增长相对较慢,每年增长量105在 10 个左右。但在 2017
189、 年和 2018 年间,专利申请数量快速增长,分别达到了74 和 133 个,较上一年增长量大幅提升。在 2019 年至 2020 年期间,专利申请数量保持相对稳定,分别为 127 和 154 个。但在 2021 年,专利申请数量突破了之前的记录,达到了 284 个。这可能与AR 技术得到了越来越广泛的应用有关,尤其是在互联网、教育、娱乐和广告等领域中的应用。但是在 2022 年,专利申请数量又突然下降到了 138 个,可能是因为市场的饱和度和竞争加剧所致。总的来说,尽管专利申请数量的增长速度有所波动,但总的趋势仍然是上升的,这表明 AR 交互技术在未来仍将得到广泛的关注和应用。6.5.20
190、视线检测主要专利情况主要专利情况根据数据统计显示,“视线检测”技术的全球专利申请量约 142 个。应用趋势应用趋势“视线检测”技术专利申请从 2013 年的 7 项逐年上升,到 2021 年达到 22项,十年间总体呈现逐年增长趋势。这表明该技术在市场中的应用需求逐渐增加。然而,2022 年的数据反而出现了下降,从 22 项降至 12 项。有可能是因为该技术已经发展到一个相对饱和的阶段,新的创新点变得更加困难,导致申请数量下降。另外,我们还可以注意到,从 2014 年到 2016 年,该技术的专利申请数量波动较大,可能是由于市场对其需求和应用前景的不确定性所致。总的来说,“视线检测”技术的专利申
191、请数量从长期趋势上呈现逐年增长的态势,但在短期内可能会受到市场的波动影响。未来,我们需要关注该技术在市场中的实际应用情况,以及创新力度是否足够,进一步推动技术的发展。6.5.21 人脸识别主要专利情况主要专利情况根据数据统计显示,“人脸识别”技术的全球专利申请量约 679 个。106应用趋势应用趋势自 2013 年起,全球人脸识别技术的专利申请数量开始逐年上升,一直持续到 2020 年,申请数量达到 166 项的峰值。其中在 2015 年和 2016 年,提升速度尤为明显,分别从 5 项和 16 项突破至 27 项和 44 项。然后在 2017 年至 2020 年期间,专利申请数量呈现了一直上
192、涨的趋势。但 2021 年为 140 项,2022 年下降至 70 项,说明这个领域的申请量增长已经开始缓和,甚至有下降趋势。这可能是由于该技术领域已经开始趋于成熟,已有大量的专利被申请,市场需求下降,进而导致专利申请量的减少。6.5.22 多风格文本生成主要专利情况主要专利情况根据数据统计显示,“多风格文本生成”技术的全球专利申请量约 11 个。应用趋势应用趋势“多风格文本生成”技术在 2013 年至 2015 年期间专利申请量相对较少,而后在 2016年至2019年间全球没有专利申请。但是在2020年至2022 年这三年里,该技术的专利申请量有所恢复,且逐年增加。这表明该技术在近年来得到了
193、更多的关注和研究,并在专利申请方面得到了更多的投入然而,上述数据并不足以确定该技术的发展趋势,因为专利申请数量并不能完全说明技术的优劣和应用前景。还需要考虑到该技术的商业化前景、研究投入、市场需求等因素。6.5.23 自定义唤醒主要专利情况主要专利情况根据数据统计显示,“自定义唤醒”技术的全球专利申请量约 52 个。应用趋势应用趋势该专利申请的数量在 2013-2014 年之间基本保持不变,但在之后的几年内数量有所增加。特别是从 2018 年到 2021 年,数量增长迅速,其中 2021 年和 2022年的数量更是达到了 12 项,呈现出一个显著上升的趋势。这表明“自定义唤醒”107技术在近年
194、来受到越来越多的重视,越来越多地关注此技术并进行专利申请,也反映人工智能技术在语音交互方面的不断创新和发展,对行业产生了积极影响。6.5.24 行人检测主要专利情况主要专利情况根据数据统计显示,“行人检测”技术的全球专利申请量约 183 个。应用趋势应用趋势“行人检测”技术专利申请数量在2013年到2022年间呈现出不断增长的趋势,尤其是在近年来,增长速度更加迅速。具体来说,该技术在 2013 年和 2014年的专利申请数量还比 较稳定,分别为 3 和 2 件。但是,从 2015 年到 2016 年,申请数量突然增长到 4 倍,从 4 件增加到了 21 件。这一阶段的增长可以归结为人工智能技术
195、在计算机视觉领域的快速发展和广泛应用,行人检测技术是其中的重要应用场景之一。在 2017 年和 2018 年,行人检测技术专利申请数量相对稳定,分别为 9 件和 17 件,但依然维持着一个相对较高的水平。而到了 2019 年,该技术的专利申请数量略微回落到 10 件。不过,从 2020 年开始,行人检测技术的专利申请数量再次获得快速增长,从 33 件增加到了 2021 年的 30 件和 2022 年的21 件。总体而言,从 2013 年到 2022 年的十年间,“行人检测”技术专利申请数量呈现出稳定增长的趋势,尤其是在 2020 年之后增长速度更加迅速。这反映了行人检测技术在智能交通、智能安防
196、等领域的广泛应用,以及其在人工智能技术发展中的重要地位。6.5.25 车内通话降噪主要专利情况主要专利情况根据数据统计显示,“车内通话降噪”技术的全球专利申请量约 243 个。应用趋势应用趋势“车内通话降噪”技术专利在过去 10 年间呈现出了较为明显的波动性增长趋势。2013 年至 2014 年间,专利申请数量呈现出较为缓慢的增长趋势,这可能108是由于当时这个技术还比较新,且市场需求不够强烈。但是从 2014 年开始,专利申请数量开始快速增长,特别是在 2018 年和 2019 年,数量增长非常迅速,可能是由于公路交通的发展增加了车内通话的需求。但是自 2020 年起,此技术的专利申请数量有
197、所下降,标志着这项技术的竞争格局正在发生变化,人们对这个技术的需求也在下降。最后,从未来的趋势来看,车内通话降噪技术仍将持续发展,并且随着无人驾驶技术的不断发展和普及,该技术可能会有更广阔的应用场景和商业价值。6.5.26 多音区分离主要专利情况主要专利情况根据数据统计显示,“多音区分离”技术的全球专利申请量约 298 个。应用趋势应用趋势“多音区分离”技术专利的申请量从2013年至2022年呈现出明显的波动性增长趋势。在 2013 年至 2014 年,申请量从 4 到 14 增长幅度较大,随后在 2015年至 2016 年期间,略有回落。但从 2017 年起,申请量再次开始增长,且增速逐年加
198、快,2020 年达到峰值;然而到了 2022 年,申请量又降至 9 件,低于前几个年份的确定趋势。因此,可以发现该技术的专利申请量在过去 10 年间呈现出波动增长的趋势。对于未来的发展,需要结合实际情况进行评估。6.5.27 硬件虚拟化主要专利情况主要专利情况根据数据统计显示,“硬件虚拟化”技术的全球专利申请量约 101 个应用趋势应用趋势“硬件虚拟化”技术专利申请的数量在过去十年呈现出不断增长的趋势,从最初的 2 项专利申请到 2020 年的 18 项专利申请,数量增长了 9 倍以上。同时,数据还表明该技术专利申请在某些年份存在明显的峰值,可能与相关技术的研究热度和商业应用需求有关。具体而言
199、,2017 年的 9 项专利申请和 2019 年的 15109项专利申请都是历史上的高峰。这表明“硬件虚拟化”技术在这些年有着重要的发展,同时也证明了该技术在未来的发展中将会继续保持较大的投入和应用。110第七章 自动驾驶第七章 自动驾驶7.1.产业定义自动驾驶汽车(Autonomous vehicles;Self-driving automobile)又称无人驾驶汽车、电脑驾驶汽车、或轮式移动机器人,是一种通过电脑系统实现无人驾驶的智能汽车。自动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让电脑可以在没有任何人类主动的操作下,自动安全地操作机动车辆。7.2.主要技术
200、点分类1117.3.主要技术在产业的应用7.3.1 PnC自动驾驶决策控制与规划,是自动驾驶汽车的关键技术之一。决策模块负责根据感知模块提供的信息,对车辆的行为进行决策,确定车辆应该执行的动作;规划模块则负责将决策模块给出的动作进行具体的规划,包括行驶路径规划、速度规划等。7.3.2 定位自动驾驶定位是自动驾驶汽车的关键技术之一。它涉及到车辆确定自身位置和方向的精度,以便确定其行驶路径和方向。自动驾驶定位通常采用多种技术,包括 GNSS(全球导航卫星系统)、IMU(惯性测量单元)、雷达、激光雷达、视觉等。这些技术可以单独使用,也可以组合使用,以提高定位精度和鲁棒性。1127.3.3 感知自动驾
201、驶感知是自动驾驶汽车的关键技术之一。它涉及到车辆感知周围环境的能力,包括车辆周围的障碍物、道路标志、车道线等。感知模块一般由多种传感器组成,包括激光雷达、毫米波雷达、超声波雷达、摄像头等。感知模块将传感器获取的信息进行融合和处理,识别和跟踪车辆周围的环境和障碍物,为车辆的决策和规划提供必要的信息。7.3.4 地图自动驾驶地图是自动驾驶汽车的关键技术之一。它是一种高精度地图,包含车辆所在区域的所有道路、车道、路口、障碍物等详细信息。自动驾驶地图通常由传感器(如激光雷达、摄像头等)获取数据,然后通过计算机对数据进行处理113和建模,生成详细的地图信息。自动驾驶地图可以帮助车辆确定自身位置和方向,识
202、别和跟踪车道线和障碍物,并提供车辆行驶路径和方向的建议。7.3.5 平行驾驶平行驾驶由云领航员在智能驾舱观察当前车辆周围实时 360 度视频流信息,判断环境合适后直接下发控制指令,达到“平行驾驶”的效果。为保证云领航员误操作或通讯异常等情况下的安全运行,智能驾舱执行单踏板策略,若车辆未收到动力踏板的控制命令则自动执行刹车。在远程控制过程中自动驾驶主系统、自动驾驶冗余系同时实时关注车辆周围环境,遇到危险情况如网络断联、突发碰撞风险等会立即启动相应安全保障机制,采取缓刹、急刹等策略确保车辆行驶安全。7.3.6 安全冗余自动驾驶安全冗余系统是自动驾驶车辆中重要的组成部分,它采用全线冗余设计,包括传感
203、器、计算单元和控制系统等。这些组成部分都是互为独立冗余的,能够避免单点故障,提升系统的可靠性和安全性。在遇到危险或紧急情况时,自114动驾驶安全冗余系统能够及时响应,通过告警、缓刹、靠边停车、紧急制动等方式让车辆进入最小风险状态(Minimal Risk Condition,MRC)。同时,在计算单元方面,安全冗余系统采用两套互为独立的计算单元,以支持算法的持续控制和风险最小回退。车辆底盘控制系统也具备冗余能力,包括转向、动力和制动等关键部件,能够在单一系统故障失效时,切换到备用系统控制车辆,帮助安全停车,防止车辆失控的发生。7.3.7 信息安全自动驾驶信息安全是自动驾驶汽车的关键技术之一。它
204、涉及到自动驾驶汽车的网络安全和数据安全,包括防止黑客攻击、数据泄露、篡改等方面。在自动驾驶汽车中,信息安全涉及到车辆的硬件、软件、数据等多个方面。信息安全模块一般由加密算法、防火墙、入侵检测和响应系统、安全协议等组成。加密算法用于保护数据的机密性和完整性;防火墙用于隔离内部网和外部网,防止黑客攻击;入侵检测和响应系统用于检测和应对已经发生的入侵行为;安全协议用于保证车辆与外界的通信安全。1157.3.8 OTA自动驾驶 OTA 是自动驾驶汽车的关键技术之一。它是指通过软件更新来升级自动驾驶汽车的相关系统,包括车辆的传感器、计算机和控制系统等。通过OTA,车辆可以像手机或电脑一样进行软件更新,增
205、加新的功能,修复已有的漏洞和 bug 等,实现持续的改进和升级。自动驾驶 OTA 涉及到车辆的硬件和软件等多个方面,需要打通云端通信、V2X 蓝牙通信、网络管理、安全管理等技术,实现车辆与云端服务器、与其他车辆、与道路基础设施之间的数据交换和通信。7.3.9 人机交互自动驾驶人机交互是自动驾驶汽车的关键技术之一。它是指自动驾驶汽车与车内乘客之间的交互方式。在自动驾驶模式下,车内乘客可能会感到不安全或不舒服,需要车辆提供相应的信息或提示。同时,车辆也需要了解乘客的需求和状态,以便提供更好的服务。自动驾驶人机交互包括视觉、听觉、触觉等多种方式,可以提供车内乘客与车辆之间的交互和沟通。在人机交互中,
206、需要考虑乘客的情感因素,了解他们的需求和情绪,以提高交互效果和用户体验。1167.4.产业技术成熟度分析7.4.1 学术界与产业界成果四象限图1177.4.2 热度-供给图与阶段-供给图1187.5.技术分析7.5.1 PnC(自动驾驶决策与规划)主要专利情况主要专利情况根据数据统计显示,驾驶决策技术的全球专利申请量约 3520 个。应用趋势应用趋势自动驾驶决策与规划是自动驾驶汽车的关键技术之一,其应用趋势主要包括以下几个方面:融合多种传感器和算法,提高感知和识别精度:自动驾驶决策与规划需要结合多种传感器和算法,包括激光雷达、毫米波雷达、超声波雷达、摄像头、GPS等,以实现精准的环境感知和识别
207、。未来,自动驾驶决策与规划将进一步融合多种传感器和技术和算法,以提高感知和识别的精度。优化路径规划算法,提高路径规划效率和安全性:自动驾驶决策与规划需要为车辆规划出一条安全、高效和节能的行驶路径。未来,自动驾驶决策与规划将进一步优化路径规划算法,以提高路径规划的效率和安全性。优化交通流控制算法,提高交通流控制效率和安全性:自动驾驶决策与规划需要对车辆进行有效的交通流控制,实现与其他车辆、行人、自行车等交通元素的协调和协同。未来,自动驾驶决策与规划将进一步优化交通流控制算法,以提高交通流控制效率和安全性。开发自主决策算法,提高自动驾驶汽车的自主性和智能化水平:自动驾驶决策与规划需要开发出自主决策
208、算法,使车辆能够根据环境和路况进行智能、灵活和安全的驾驶。未来,自动驾驶决策与规划将进一步开发和改进自主决策算法,以提高自动驾驶汽车的自主性和智能化水平。综上所述,自动驾驶决策与规划的应用趋势是融合多种传感器和算法,优化路径规划算法和交通流控制算法,开发自主决策算法,以提高自动驾驶汽车的安全性、效率和智能化水平。1197.5.2 定位主要专利情况主要专利情况根据数据统计显示,同步建图与定位技术的全球专利申请量约 19086 个。应用趋势应用趋势自动驾驶定位是自动驾驶汽车的关键技术之一,其应用趋势主要包括以下几个方面:融合多种定位传感器和算法,提高定位精度和鲁棒性:自动驾驶定位需要结合多种定位传
209、感器和算法,如 GPS、IMU、激光雷达、摄像头等,以实现精准的车辆定位和建图。未来,自动驾驶定位将进一步融合多种定位传感器和算法,以提高定位精度和鲁棒性。开发高精度地图和定位模块,提高定位精度和实时性:自动驾驶定位需要使用高精度地图和定位模块,以实现精准的车辆定位和导航。未来,自动驾驶定位将进一步开发高精度地图和定位模块,以提高定位精度和实时性。应用实时动态差分技术,提高定位精度和鲁棒性:自动驾驶定位需要使用实时动态差分技术,以实现精准的车辆定位和建图。未来,自动驾驶定位将进一步应用实时动态差分技术,以提高定位精度和鲁棒性。开发自主定位算法,提高自动驾驶汽车的自主性和智能化水平:自动驾驶定位
210、需要开发出自主定位算法,使车辆能够根据环境和路况进行智能、灵活和安全的定位和导航。未来,自动驾驶定位将进一步开发和改进自主定位算法,以提高自动驾驶汽车的自主性和智能化水平。综上所述,自动驾驶定位的应用趋势是融合多种定位传感器和算法,开发高精度地图和定位模块,应用实时动态差分技术,开发自主定位算法,以提高自动驾驶汽车的定位精度、鲁棒性和智能化水平。7.5.3 感知主要专利情况主要专利情况根据数据统计显示,自动驾驶的感知技术包括多种技术融合,主要包括多传感器融合技术的全球专利申请量约 403 个;视觉目标检测技术的全球专利申请120量约 18044 个;信号灯检测技术的全球专利申请量约 3162
211、个;交通标识检测技术的全球专利申请量约 3451 个;车道检测技术的全球专利申请量约 1736 个。应用趋势应用趋势自动驾驶感知是自动驾驶汽车的关键技术之一,其应用趋势主要包括以下几个方面:融合多种传感器和算法,提高感知精度和鲁棒性:自动驾驶感知需要结合多种传感器和算法,如激光雷达、毫米波雷达、超声波雷达、摄像头、GPS 等,以实现精准的环境感知和识别。未来,自动驾驶感知将进一步融合多种传感器和算法,以提高感知精度和鲁棒性。应用高分辨率激光雷达,提高感知精度和细节:自动驾驶感知需要使用高分辨率激光雷达,以实现精准的环境感知和识别。未来,自动驾驶感知将进一步应用高分辨率激光雷达,以提高感知精度和
212、细节。开发点云数据处理算法,提高感知效率和准确性:自动驾驶感知需要对点云数据进行处理和分析,以实现精准的环境感知和识别。未来,自动驾驶感知将进一步开发点云数据处理算法,以提高感知效率和准确性。应用计算机视觉技术,提高感知精度和鲁棒性:自动驾驶感知需要使用计算机视觉技术,如图像处理和识别等,以实现精准的环境感知和识别。未来,自动驾驶感知将进一步应用计算机视觉技术,以提高感知精度和鲁棒性。开发自主感知算法,提高自动驾驶汽车的自主性和智能化水平:自动驾驶感知需要开发出自主感知算法,使车辆能够根据环境和路况进行智能、灵活和安全的感知和识别。未来,自动驾驶感知将进一步开发和改进自主感知算法,以提高自动驾
213、驶汽车的自主性和智能化水平。综上所述,自动驾驶感知的应用趋势是融合多种传感器和算法,应用高分辨率激光雷达,开发点云数据处理算法,应用计算机视觉技术,开发自主感知算法,以提高自动驾驶汽车的感知精度、鲁棒性和智能化水平。1217.5.4 高精地图主要专利情况主要专利情况根据数据统计显示,高精地图核心同步建图与定位技术的全球专利申请量约19086 个。应用趋势应用趋势自动驾驶高精地图的应用趋势主要包括以下几个方面:提升道路安全性能:自动驾驶高精地图能够为自动驾驶汽车提供高精度、高分辨率的地图信息,包括道路形态、道路标志、车道线、障碍物等,从而提升自动驾驶汽车的安全性能。提高出行效率:自动驾驶高精地图
214、能够为自动驾驶汽车提供超视距的道路信息,例如道路拥堵情况、路口规划等,从而帮助自动驾驶汽车选择更加高效、畅通的行驶路线,提高出行效率。促进智慧城市建设:自动驾驶高精地图可以为城市提供更加全面、细致的道路信息,例如交通信号灯、路标等,从而帮助城市管理部门更好地规划和管理城市交通,促进智慧城市建设。推动汽车产业升级:自动驾驶高精地图是自动驾驶汽车的重要组成部分,其应用可以推动汽车产业升级,促进自动驾驶汽车的发展和普及。改善人类出行体验:自动驾驶高精地图可以为人类出行提供更加便利、高效的服务,例如自动驾驶出租车、自动驾驶公交车等,从而改善人类出行体验。总之,自动驾驶高精地图的应用趋势非常广泛,未来将
215、在智慧交通、智能制造、智慧城市等多个领域发挥重要作用。122以下自动驾驶领域的技术点将仅展示其应用趋势。7.5.5 平行驾驶应用趋势应用趋势自动驾驶平行驾驶应用趋势包括以下几个方面:提高道路安全性能:自动驾驶平行驾驶技术能够为自动驾驶汽车提供高精度、高分辨率的地图信息,包括道路形态、道路标志、车道线、障碍物等,从而提升自动驾驶汽车的安全性能。提高出行效率:自动驾驶平行驾驶技术能够为自动驾驶汽车提供超视距的道路信息,例如道路拥堵情况、路口规划等,从而帮助自动驾驶汽车选择更加高效、畅通的行驶路线,提高出行效率。促进智慧城市建设:自动驾驶平行驾驶技术可以为城市提供更加全面、细致的道路信息,例如交通信
216、号灯、路标等,从而帮助城市管理部门更好地规划和管理城市交通,促进智慧城市建设。推动汽车产业升级:自动驾驶平行驾驶技术是自动驾驶汽车的重要组成部分,其应用可以推动汽车产业升级,促进自动驾驶汽车的发展和普及。改善人类出行体验:自动驾驶平行驾驶技术可以为人类出行提供更加便利、高效的服务,例如自动驾驶出租车、自动驾驶公交车等,从而改善人类出行体验。总之,自动驾驶平行驾驶技术的应用趋势非常广泛,未来将在智慧交通、智能制造、智慧城市等多个领域发挥重要作用。7.5.6 安全冗余应用趋势应用趋势自动驾驶安全冗余技术的应用趋势如下:提高自动驾驶系统的可靠性:自动驾驶系统要求 24 小时不间断地运转,因此可靠性是
217、至关重要的。采用冗余设计,可以降低系统故障率,提高系统的可用性和可靠性。123增强自动驾驶系统的安全性:自动驾驶系统的安全性至关重要,因为系统故障或错误可能会导致严重的后果。采用冗余设计,可以确保系统的安全性和稳定性。支持 L3 及以上自动驾驶的实现:L3 及以上自动驾驶需要更高的安全性和可靠性,因此需要采用冗余设计。随着自动驾驶技术的不断发展,冗余技术将变得越来越重要。为自动驾驶系统的未来发展提供支持:自动驾驶系统的发展需要不断的技术更新和升级。采用冗余设计,可以为未来的技术升级和发展提供支持,确保系统的长期可用性和可靠性。总之,自动驾驶安全冗余技术的应用趋势非常广泛,未来将在自动驾驶系统中
218、发挥重要作用。7.5.7 信息安全应用趋势应用趋势自动驾驶信息安全技术是保障自动驾驶系统安全和可靠性的重要手段。随着自动驾驶技术的快速发展,自动驾驶信息安全技术的应用趋势如下:强化网络安全:自动驾驶系统需要实时收集和处理大量数据,包括车辆、交通道路和行人等,因此要重点保障系统的网络安全。未来,自动驾驶信息安全技术将加强对网络安全保护的研究和应用,提高自动驾驶系统的可靠性和安全性。采用多层次的冗余设计:多层次的冗余设计是自动驾驶系统中的一项重要安全机制,可提高系统的可靠性和安全性。未来,自动驾驶信息安全技术将采用更加复杂和严密的冗余设计,以防止系统故障和攻击。应用密码学技术:密码学技术是保障自动
219、驾驶系统信息安全的重要手段。未来,自动驾驶信息安全技术将应用更加先进的密码学技术,如国密算法、量子加密等,以提高系统的加密强度和安全性。实施全面的数据隐私保护:自动驾驶系统需要收集和处理大量的数据,因此要重视数据隐私保护。未来,自动驾驶信息安全技术将实施更加严格和全面的数据隐私保护措施,确保用户数据的隐私和安全。124与人工智能融合:自动驾驶系统需要处理大量数据,并依靠人工智能技术进行决策。因此,自动驾驶信息安全技术将与人工智能技术进一步融合,以提高系统的安全性和可靠性。总之,自动驾驶信息安全技术是自动驾驶系统中的重要组成部分,未来将在不断发展和完善中发挥重要作用。7.5.8 OTA应用趋势应
220、用趋势自动驾驶 OTA 技术是指通过在线升级(OTA)对自动驾驶系统进行更新和升级。这种技术可以提高自动驾驶系统的可靠性和安全性,并增加新的功能和特性。自动驾驶 OTA 技术的应用趋势如下:持续优化软件 BUG 修复:通过 OTA 技术,自动驾驶系统可以实时在线升级,从而修复部分软件 BUG,提高系统的可靠性和安全性。增加新的功能和特性:随着时间的推移,自动驾驶系统将不断推出新的功能和特性。通过 OTA 技术,这些新功能和特性可以快速部署到实际车辆上,增加车辆的实用性和竞争力。改善车辆性能:随着自动驾驶系统使用时间的增加,车辆的性能可能会受到一定的影响。通过 OTA 技术,可以对车辆的性能进行
221、优化,从而提高车辆的效率和性能。增强车辆安全性:自动驾驶 OTA 技术可以修复车辆中存在的安全漏洞和BUG,提高车辆的安全性能,保障乘客的安全。促进自动驾驶系统的发展:自动驾驶 OTA 技术可以促进自动驾驶系统的发展,加速自动驾驶技术的普及和应用。总之,自动驾驶 OTA 技术是自动驾驶系统的重要组成部分,未来将在不断发展和完善中发挥重要作用。1257.5.9 人机交互应用趋势应用趋势自动驾驶人机交互技术是自动驾驶系统中的重要组成部分,它可以让自动驾驶汽车与乘客之间建立更加紧密的联系。随着自动驾驶技术的快速发展,自动驾驶人机交互技术的应用趋势如下:语音交互:随着语音识别技术的不断进步,自动驾驶人
222、机交互技术将更多地采用语音交互方式。乘客可以通过语音控制自动驾驶汽车的各种功能,而无需手动操作。这将提高乘客的舒适性和便利性,同时减少驾驶员的分心。视觉交互:自动驾驶人机交互技术还将应用更多的视觉交互方式,如手势、面部表情等。乘客可以通过手势或面部表情来控制汽车的功能,这也可以提高驾驶的安全性。触摸交互:自动驾驶汽车还将应用更多的触摸交互方式,如触摸屏、智能表面等。乘客可以通过触摸屏幕或智能表面来控制汽车的各个功能,这也将提高驾驶的便利性和舒适性。生物传感器交互:自动驾驶汽车还将应用更多的生物传感器交互方式,如红外线传感器、超声波传感器等。这些传感器可以感知乘客的身体状态,如心率、呼吸等,从而
223、为乘客提供更加个性化的服务。虚拟现实交互:自动驾驶汽车还将应用更多的虚拟现实技术,如车载 VR 等。这些技术可以让乘客体验到更加丰富的娱乐内容,同时也可以提高驾驶的趣味性。总之,随着自动驾驶技术的快速发展,自动驾驶人机交互技术的应用趋势应用趋势将变得更加广泛和个性化。126第八章 智能服务机器人第八章 智能服务机器人8.1.产业定义智能服务机器人是在非结构环境下为人类提供必要服务的多种高技术集成的智能化装备。近年来,随着人工智能、5G、云计算、物联网、大数据的快速发展,以及场景需求的不断拓展,在包括计算机视觉及语音交互、伺服驱动器、定位导航、运动规划及控制等技术的加持赋能下,具有感知、分析及处
224、理来自外部环境的信息等智慧能力的成为智能服务机器人的标配。从应用场景和产业发展进行划分,本报告将智能服务机器人产业可以分为面向家庭的消费类服务机器人产业以及面向公共商用环境的商用服务机器人产业两大类,其中又细分为综合家庭助理机器人、家务服务机器人、养老康护机器人、教育娱乐机器人、讲解接待机器人、餐饮酒店机器人、云平台机器人等智能服务机器人子产业。其中,以智能清洁机器人品类为代表的家务服务机器人产业,已经取得了爆发式的发展。中国智能机器人产业起步较晚,但受益于我国产业政策大力支持和引导发展迅速。政府相关部门已颁布一系列利好政策推动智能机器人产业的发展,中国服务机器人的销售额增速持续高于全球服务机
225、器人销售额增速,保持良好增长态势。1278.2.主要技术点分类8.3.主要技术在产业的应用8.3.1 综合家庭助理机器人综合型家庭助理机器人是单一服务向融合多种角色服务、从“功能”走向“智能”的服务机器人产物,是 AI 技术产业化的新突破。由于高技术门槛,目前综合服务类机器人落地的产品较少,相关产业尚属蓝海市场,但前景广阔。在家庭场景下,综合型家庭服务机器人可以为用户提供智能生活助理、家庭管理、安全卫士128和科技玩伴等服务,包括家电联动、家庭环境感知、人体行为感知、家庭安全守护和家庭娱乐中心等服务,通过 AI 智能语音、机器视觉、行为习惯学习和 AI决策算法等核心技术,建立可视化的 3D 数
226、字家庭,可在室内全自主导航避障,具备多模态人机交互能力,解决日常家庭生活中的智能化需求。亚马逊、三星等巨头近期发布家庭服务机器人落地计划,美的集团已于 2022 年底量产上市销售业界首款综合型家庭助理机器人,但将智能语音、处理器、AI 算法、通讯、大数据、物联网等技术融合,创造出更加轻便、智能以及更强环境感知与人机交互能力的家庭服务机器人,是行业持续面临的挑战。8.3.2 家务服务机器人家务服务机器人是用于家庭劳动服务的机器人产品,可以用于扫地、拖地、擦窗、割草等室内外家居清洁和保养维护需求,可连接到家庭 Wi-Fi 网络,提供互联网生态服务。扫拖机器人是当前商业化普及化最为成功的家务服务机器
227、人,主要厂家包括美国 IRobot(被亚马逊收购),中国科沃斯、石头科技等。具有自主导航能力的扫地机器人通常采用视觉或激光 SLAM 技术对家庭环境进行实时建图和机器人自我定位。通过多传感器融合如:激光雷达、里程计、陀螺仪、碰撞传感器、下视传感器、超声传感器、双线激光等,对机器人在室内的清扫运动轨迹进行规划,包括沿边、弓字、避障、脱困、回充等运动模式。同时通过对轮组电机转速的精准控制,机器人在家庭环境能跟进不同的地面材质,如瓷砖、地板、地毯进行自适应的变速和转向,并控制风机吸力、滚刷转速、边刷转速、拖地抹布转速/振动实现清洁效果。配备摄像头的扫地机器人能通过深度学习算129法对家庭的障碍物,家
228、具、场景、用户进行识别,生成带有语义信息的家庭地图,并制定不同场景下的清洁策略。近年来传统家电巨头如美的、海尔也加入到扫拖机器人赛道,布局全屋智能家电移动控制中心,将各品类智能家电,如空调、冰箱、洗衣机、微波炉等,进行系统级互联互通,从终端感知、边缘计算、云服务,自下而上的整合数字化智慧家庭生态服务。除扫拖机器人外,当前市面上家务服务机器人还有炒菜机器人、擦窗机器人、泳池机器人,割草机器人等,为用户打造舒适、健康、节能、安全的全方位美好生活。8.3.3 养老康护机器人养老康护机器人是人工智能与养老服务深度融合的智慧结晶,也是人工智能与机器人和医疗技术相互结合的产物,旨在满足日益增长的养老需求,
229、市场前景广阔。养老康护机器人通过机器学习、人机交互、虚拟现实、视觉识别、自然语言处理和情感识别等技术,以监测老年人群及具备康复需求人群的生理指标、帮助其进行康复评估和训练、辅助行动、协助日常生活活动、提供社交互动和心理支持,甚至紧急救援等。当前随着养老康护场景中“空间-人-服务”协同交互的多样化、多元化和个性化,亟需将物联、数联、智联等多维度数据、智能传感单元、智能控制器件、意图识别与理解、人机交互控制及生机电系统等进行融合与集成,形成小型化、高度智能化及人机协同友好型养老康护机器人。1308.3.4 教育娱乐机器人教育机器人一般指用于教学的机器人,或者有教育属性的机器人。教育机器人包括多关节
230、机器人、移动机器人或自动驾驶汽车。可以从小学到研究生课程教授教育机器人和人工智能技术,还可用于激发和促进其他通常是基础性主题的教学,例如计算机编程、人工智能或工程设计。娱乐机器人是以供人观赏、娱乐为目的机器人。除具有机器人的外部特征,可以像人,像某种动物,像童话或科幻小说中的人物等;还可以行走或完成动作,可以有语言能力,会唱歌,有一定的感知能力。教育娱乐机器人是一种结合了教育和娱乐功能的综合型服务机器人,也是人工智能技术产业化的新兴市场。与传统的教育工具和玩具不同,教育娱乐机器人具备智能化、交互性和可编程性等特点,能够通过语音交互、机器视觉、情感识别和动作控制等技术,提供个性化的教育和娱乐服务
231、,帮助儿童提高学习能力、培养创造力和交际能力,同时也能为儿童提供有趣的娱乐体验。教育娱乐机器人在 STEM 教育中扮演着重要角色。它可以以互动、趣味的方式教授科学、技术、工程和数学概念,帮助学生理解抽象的概念并将其应用于实际情境中。这些机器人通常配备传感器、执行器和编程接口,使学生能够与它们进行交互,并通过编程指导它们执行各种任务。学生可以通过与机器人的互动来学习编程、机械原理、电子电路等知识,从而培养他们的创造力和解决问题的能力。在机器学习技术方面,教育娱乐机器人可以帮助学生了解机器学习的基本原理和技术,并通过实践和反馈来加深学习。例如,一个机器人可以教授机器学习知识,让学生自己编写机器学习
232、算法并观察机器人的反应。这种实践性的学习体131验不仅有助于提高学生的技能和实践经验,还可以帮助他们更好地理解机器学习的应用领域和挑战。教育机器人市场正在加速规模化与市场化的建设,但同时教育机器人的本体目前仍处于产业发展的初期阶段。从教育市场发展趋势看,K12 教育线下培训市场规模不断增长,线下培训机构呈现智能化、场景化、效率化发展趋势,教育机器人扮演的角色也越来越重。在产品功能、教学模式等方面,教育机器人也不断升级优化,满足多样化的教学需求。到 2025 年中国教育机器人市场空间预计将达到 3000 亿,并成为全球最大的机器人市场。8.3.5 讲解接待机器人讲解接待机器人是基于云平台提供商用
233、服务的机器人,可提供定制化的 AI服务机商务场景定制应用,在多模态交互、导航避障、客流引导、智能问询、视频会议、人脸识别、智能监控等方面具备领先的技术优势。讲解接待机器人以机器人硬件为载体,依托云平台强大的智能服务技术,引入智能语音交互系统、大数据分析系统、智能视觉识别系统,真正实现“能听、会说、能思考、会判断、看得见、认得出”的智能化服务。讲解接待机器人成为服务机器人市场的焦点,是因为它具有自主问候、语音交互、远程遥控、人脸识别等功能,可以通过移动应用程序客户端独立欢迎客人,还可以让机器人按照主人的指令行走巡逻,大大提高了服务机器人的实用性,讲解接待机器人在未来也迎来一个发展趋势。随着技术实
234、力的不断提升,各个行业都会通过机器人来代替部分人工进行工作,帮助各行各业带来新的发展机遇。1328.3.6 餐饮酒店机器人餐饮酒店服务机器人作为商用服务机器人中发展较早且较快的一个大类,具有多种功能属性与产品形态,如用餐移动引领机器人、餐厅用餐饮配送机器人、包厢制(如 KTV)餐饮配送机器人、酒店物品配送机器人等。随着近年来餐饮酒店行业对服务机器人的接受度越来越高,该类型的机器人也迎来了平稳的增长期,随着越来越多的餐饮酒店用户对无接触配送、安全配送需求持续不断增加,且现阶段餐饮酒店服务机器人整体渗透率还不高,餐饮酒店服务机器人仍有广阔的发展前景。餐饮酒店服务机器人可以为用户提供智能配送服务,包
235、括场景环境感知、行人感知与避让、电梯系统联动、电话系统联动、自动售货柜联动等功能。通过端到端控制、图像识别、语义地图、单目避障、任务决策规划、激光导航、视觉导航、轨迹预测等技术的应用,餐饮酒店服务机器人能够实现在复杂多变场景中的自主移动、自主避障及多点配送等与自主移动相关的重要功能。通过声学前端、语音识别、语义理解、语音合成、多通道用户界面交互、对话交互、智能133问答等技术,餐饮酒店服务机器人能够实现在特定场景中的语音交互、触摸交互、灯光交互等与用户交互相关的重要功能。通过 Sim-to-Real 模拟到现实方法、机器人仿真及数据生成、故障自诊断、系统安全等技术,餐饮酒店服务机器人能够实现在
236、大批量、高分散、多样化的实际运行场景中远程获取场景或问题数据、云端模拟仿真分析、远程部署训练模型等与智能提升、运维故障处理等相关的重要功能。通过智能调度、多机协同等技术,餐饮酒店服务机器人能够实现同一场景中多台机器人的协同工作。8.3.7 服务机器人云服务平台当前服务机器人无法普及的根本原因是其智力水平低,服务能力差,无法满足用户的应用需求。采用云-边-端分布智能架构的云服务机器人是唯一解决方案,云-边-端各负其职,智能协同,高效运转,推动服务机器人行业的标准化,使得服务机器人可以轻装上阵,避免各自为战,重复研发和同质竞争,确保服务机器人产品物美价廉。服务机器人云服务平台简称智慧云脑,是云服务
237、机器人的核心和基础,为所有接入云平台的服务机器人提供智力服务。由于技术门槛高、涉及面广、系统复杂,国内外至今还未出现完全商用的公用云服务平台产品。该产品盈利路径清晰,应用前景广阔,是未来服务机器人发展的必然趋势。1348.4.产业技术成熟度分析8.4.1 学术界与产业界成果四象限图1358.4.2 热度-供给图与阶段-供给图1368.5.技术分析8.5.1 机器人端到端控制主要专利情况主要专利情况根据数据统计显示,“机器人端到端控制(深度强化学习)”技术的全球专利申请量约 65 个。该技术直接相关的重要论文发表 38 篇。应用趋势应用趋势机器人端到端控制技术是指使用以深度强化学习为代表的自主学
238、习方法,学习从传感器输入数据到机器人控制策略的一个直接映射。机器人的端到端控制主要应用在机械臂的控制或者机器人的导航和位置规划上。目前,机器人产业在硬件方面其实已经成熟,关键就在于人工智能算法被更进一步、更广泛、更深入的融合到机器人系统中。机器人的每一种动作背后,就是一个算法,像是走路、跳跃等,要把各种算法软件结合,进而协调双足/双臂自由度的运作。目前此项技术尚未实现产业化,仅在一些前沿研究中进行探索,目前该技术处于技术萌芽期。8.5.2 模拟到现实方法主要专利情况主要专利情况根据数据统计显示,“Sim-to-Real 模拟到现实方法”技术的全球专利申请量约 6447 个。该技术相关学术论文发
239、表约 46 篇,学术界较为活跃。137应用趋势应用趋势通过 Sim-to-Real 的方式,在高仿真度的环境中训练机器人策略,再通过迁移算法“零样本”或“少样本”迁移到真机上。该方法解决的问题为,强化学习自主在环境下采样的特点使其无法直接应用于机器人真机,一方面,真机下采样时间缓慢,无法满足深度强化学习的训练要求;另一方面,在初期探索阶段,随机化的策略会给操作人员以及机器人的安全带来威胁。目前,该技术已经在一些商用机器人上实现了应用,但以迁移学习为基础的Sim-to-Real 算法仍然处于技术萌芽期。如 UBTECH 的春晚机器人 Walker、导览机器人 Cruzr 等,均是在模拟器中训练策
240、略至收敛后,再迁移到真机上,节省训练时间,保证操作安全。8.5.3 新技能学习主要专利情况主要专利情况根据数据统计显示,“新技能学习”技术的全球专利申请量约 34 个。138应用趋势应用趋势当面对商业和家庭环境时,机器人很可能会不断遇到新出现的物体或者变化,因此,机器人必须拥有以下两种能力:1)能够面对新环境持续学习新技能的能力;2)不会遗忘已拥有的技能并且能够基于已拥有技能学习新技能的能力。持续学习这一领域致力于如何让智能体拥有以上两种能力。在当前综合助理机器人产业中,持续学习技术的使用仍处于技术萌芽期。大部分研发仍在模拟器环境或者内部可控环境下进行,尚未部署在真实商业和家庭环境中。目前持续
241、学习主要在以下 4 个方面面临挑战:1)机器人硬件。对于长期的使用,机器人通常是不稳定和脆弱的,需要人为重置状态或者充电。同时机器人只有有限的内存和计算资源,需要合理地规划使用。2)数据采集。和强化学习面临的问题非常类似,机器人需要自己在环境中采集数据,因此如何有效率地采集数据和探索环境是一个难点。3)数据标注。为了理解环境和任务,机器人需要一些反馈信号用于引导它的行为,单纯依靠人力进行数据标注是非常耗时耗力的,如何能够更加智能地标注数据非常重要。4)算法稳定性。在持续学习的环境中,一旦某个学习过程出现问题或者失败,通常会产生连锁反应,导致随后的学习过程也发生问题,需要算法能够帮助机器人回到未
242、产生问题前的状态。8.5.4 物体位姿估计位姿估计是机器人领域中的重要问题,它涉及到机器人在三维空间中的位置和姿态的估计。位姿估计技术在机器人导航、环境感知、物体识别和操作等方面具有广泛的应用。位姿估计可以通过视觉里程计、激光雷达里程计、惯性测量单元(IMU)深度学习模型等技术进行实现。视觉里程计利用机器人上搭载的相机获取图像信息,通过分析连续图像帧之间的视觉差异来估计机器人的位姿变化。常见的方法包括特征匹配、光流法和直接法等。激光雷达同时定位与地图构建(SLAM)是一种常用的位姿估计技术。激光雷达通过发射激光束并测量其回波时间来获取环境的三维点云数据,通过分析点云之间的关系来实现机器人的定位
243、和地图构建。IMU 是一种包含加速度计和陀螺仪等传感器的设备,用于测量机器人的加速度和角速度。通过将加速度和角速度的测量值积分,可以估计机器人的位姿变化。然而,IMU 在长时间使用时存在累积误差的问题,因此通常需要与其139他传感器(如视觉或激光雷达)进行融合使用。传感器融合是将多个传感器的测量结果进行整合,以提高位姿估计的准确性和鲁棒性。常用的融合方法包括扩展卡尔曼滤波(EKF)和粒子滤波(PF)等。近年来,深度学习在位姿估计领域取得了显著的进展。通过使用深度神经网络,可以将传感器数据直接输入网络,从而实现端到端的位姿估计。深度学习方法可以用于视觉数据(如图像或点云)的位姿估计,也可以与传感
244、器融合方法结合使用。主要专利情况主要专利情况根据数据统计显示,近5年“物体位姿估计”技术的全球专利申请量约525个。应用趋势应用趋势随着技术的不断进步,物体位姿估计应用正朝着以下几个趋势发展:深度学习的广泛应用:深度学习方法在计算机视觉领域取得了巨大成功,也在物体位姿估计应用中得到了广泛应用。通过深度学习模型,可以从图像或点云数据中直接提取物体的位置和姿态信息,从而实现高精度的位姿估计。深度学习方法还可以处理复杂的场景和遮挡问题,提高物体位姿估计的鲁棒性和准确性。传感器融合:为了提高物体位姿估计的准确性和鲁棒性,将多个传感器的数据进行融合已成为一种趋势。例如,将视觉数据与激光雷达数据或者 IM
245、U 数据进行融合,可以结合各个传感器的优势,弥补各自的不足,从而实现更准确和稳健的位姿估计。140实时性能的提升:实时性对于物体位姿估计应用非常重要,特别是在机器人导航和操作等实时场景下。近年来,随着计算硬件的进步和优化算法的提出,物体位姿估计的实时性能得到了显著提升。例如,通过使用轻量级的神经网络模型、优化算法和并行计算等技术,可以在有限的时间内快速进行位姿估计,实现实时应用的需求。增强的几何和语义理解:传统的物体位姿估计主要关注物体的几何信息,即位置和姿态。然而,随着对环境理解需求的提高,物体位姿估计正朝着更加细粒度和丰富的理解发展。8.5.5 图像识别主要专利情况主要专利情况根据数据统计
246、显示,“图像识别”技术的全球专利申请量约 30 个。应用趋势应用趋势图像识别技术是人工智能领域的重要分支,它基于对图像/视频中的像素及其空间/时间上下文关系的分析处理,实现物体、场景、人脸、人体等的定位和分类预测。该技术赋予计算机类人的视觉感知能力,广泛应用于智能服务机器人。近年来,与图像识别相关的支撑性技术得到爆发式的发展,包括但不限于自监督学习、基础模型和多模态信息融合等。因此,图像识别在实际中将能够更加坚实地实现服务机器人应用对准确性和鲁棒性的要求。141在服务客户过程中,机器人可以识别客户的表情、姿态和行为等,判断其需求和情绪,进而提供有针对性的帮助。这些 AI 能力的准确性正在从大数
247、据、自监督的预训练中获益,应对真实复杂背景和干扰的水平也显著提高,究其根本是见多识广之后具备了支撑大量下游识别任务所需的通用性表征能力。在家居、餐饮和陪护等场景下,机器人能够通过强大的特征提取网络和基础模型对环境和其中的物体进行语义分割和目标实例分割,从而支持细粒度的场景感知,为人机交互提供可靠的先验信息。其中,以医疗陪护中的应用为例,机器人需要对人的行为做识别,尤其是通过特定危险行为和状态的检测分类快速提供救助或报警等响应。诸如此类功能的落地要求有效控制漏检与误检,而在繁多且复杂的场景中再兼顾准确性与泛化性,通常需要采用能够表达和分析大量多样化关系的网络,而近年来 transformer 从
248、自然语言处理领域向视觉图像领域的渗透已拓展了传统卷积神经网络在感受范围和关系建模上的局限。另外,人机交互的服务场景中,将图像与自然语言等模态的信息进行融合,将能更加准确地区分多个类似目标,使机器人越来越像人类那样从模糊的指代中智能地进行理解、筛选和决策。综上,机器视觉的突飞猛进和图像识别能力的提升正在逐步从学术界研究成果向工业界面向机器人的应用做转化,可以期待细分类的各种服务机器人的能力将得以拓展。8.5.6 语义地图机器人导航的语义地图技术是指在机器人导航中,将环境信息与语义信息相结合,构建具有语义理解能力的地图,从而实现更智能、更高效的导航和路径规划。为了构建语义地图,机器人需要能够感知环
249、境中的语义信息。这可以通过使用各种传感器(如摄像头、激光雷达和深度传感器)来获取环境数据,并结合语义分割、目标检测和物体识别等算法来识别和分割不同的语义类别。语义地图可以采用不同的表示方式,如基于图的表示或基于网格的表示。基于图的表示方法使用节点和边来表示环境中的语义关系和拓扑结构,而基于网格的表示方法将地图划分为多个网格单元,每个单元包含语义标签信息。此外,语义地图通常需要进行更新和维护,以反映环境中的变化。这可以通过增量地更新语义标签、检测新的物体或删除已不存在的物体等方式来实现。同时,机器人还需要能够判断语142义地图的可靠性,并及时更新不准确或过时的信息。语义地图可以为人机交互提供更直
250、观和可理解的界面。通过在地图上显示语义信息,人们可以更容易地与机器人进行沟通和指导。此外,机器人还可以利用语义地图来理解人的意图和指令,从而更好地与人进行合作和协调。总体而言,语义地图技术在机器人导航领域的发展正在不断推进,通过将语义信息与环境感知和路径规划相结合,可以实现更智能、更高效的机器人导航系统。然而,仍然存在一些挑战,如语义理解的准确性、语义地图的实时更新和可靠性等,这些问题需要进一步的研究和发展。主要专利情况主要专利情况根据数据统计显示,近 5 年刚发展起来的“语义地图”技术的全球专利申请量约 67 个。应用趋势应用趋势语义地图技术在机器人导航领域具有广阔的应用前景,并且正在朝着以
251、下趋势发展:增强导航能力:语义地图技术可以为机器人导航系统提供更强大的能力,使机器人能够理解和推理环境中的语义信息。这将有助于机器人更准确地识别和避开障碍物,更高效地规划路径,并执行复杂的导航任务。143人机协作与交互:语义地图技术使机器人能够理解人类的语义指令和意图,从而实现更自然和高效的人机交互。机器人可以根据语义地图中的信息与人类进行沟通,并根据人类的需求进行导航和行动,提供更个性化的服务和支持。混合现实与增强现实:语义地图技术与混合现实和增强现实相结合,可以为用户提供更丰富的导航体验。通过在现实场景中叠加语义信息,用户可以通过可视化界面直观地了解导航路径、地点信息和导航指示,从而更容易
252、实现目标导航和定位。多模态感知与融合:语义地图技术将不仅限于视觉感知,还可以整合多种传感器,如深度传感器、声音传感器和触觉传感器等。通过融合多模态数据,语义地图可以更全面地理解环境并提供更准确的导航和定位信息。自主探索与建图:语义地图技术可以帮助机器人实现自主的探索和地图构建。机器人可以根据语义信息主动选择感兴趣的区域进行探索,识别和标记不同类型的物体,从而构建具有语义理解能力的地图。多机器人协同导航:在多机器人系统中,语义地图技术可以促进机器人之间的协同导航和合作。机器人可以共享语义地图信息,相互协调行动,避免冲突,并实现分布式任务的协同执行。总之,语义地图技术在机器人导航领域的应用趋势是朝
253、着更智能、更自适应、更人性化的特性系统发展。通过融合语义信息和多模态感知,机器人能够更好地理解和应对复杂的环境,提供更优质的导航服务。随着技术的不断进步,语义地图技术将在日常生活、工业应用、医疗保健等领域发挥越来越重要的作用。8.5.7 目标检测与跟踪在机器人领域,目标检测和跟踪技术使机器人能够识别和跟踪其环境中的各种目标,包括人、物体甚至特定的环境特征。例如,自动驾驶汽车使用这些技术来跟踪其他车辆、行人和路标,以安全地导航其环境。同样,工业机器人可能需要跟踪特定的零件或工具,以执行其任务。在家庭环境中,服务机器人可能需要跟踪各种家居物品,如家具、玩具或食物,以提供有效的服务。目标检测和跟踪技
254、术在机器人领域的应用是多样化的,它们为机器人提供了理解和交互其环境的关键能力。目标检测与跟踪在机器人领域扮演着至关重要的角色,特别是在设计144用于动态环境的自主机器人时。这些机器人需要能够实时准确地感知动态障碍物,以安全地导航环境。为此,已经有许多研究在试图提高目标检测与跟踪的效率和准确性。例如,一种方法是使用一种基于 RGB-D 相机的 3D 动态障碍物检测和跟踪(DODT)方法。这种方法采用了新的集成检测策略,将多个计算高效但低精度的检测器组合起来,以实现实时高精度的障碍物检测。此外,该系统还引入了一种新的基于特征的数据关联方法,用于防止错误匹配,并使用具有恒定加速度模型的卡尔曼滤波器来
255、跟踪检测到的障碍物。目标检测和跟踪算法的设计基于机器人的传感器和数据表示。传感器的选择可以根据机器人平台的不同而不同,其中 RGB-D 相机是室内机器人最常用的传感器之一。在使用 RGB-D 相机的方法中,主要有两种常见的方式:基于图像的方法和基于点云的方法。但是,由于图像、点云和复杂环境结构的噪声,这两种方法都可能会出现误检测。因此,研究者提出了一种新的集成方法,以克服每个简单检测器的缺点,并建议将基于学习的方法作为一个可选的和辅助的模块,而不是必需的端到端的障碍物检测和跟踪工具,使我们的方法适用于具有各种计算资源的机器人。未来,目标检测与跟踪技术的发展将更加注重实时性、精确性和鲁棒性。例如
256、,我们可能会看到更多的研究集中在如何在复杂和动态环境中进行高效的目标检测和跟踪。此外,随着机器人技术的普及,我们也可能会看到更多的研究关注如何保护用户的隐私和安全。主要专利情况主要专利情况根据数据统计显示,“目标检测与跟踪”技术的全球专利申请量约 317 个。145应用趋势应用趋势在服务机器人领域,目标检测与跟踪是通过摄像头检测出目标物体,包括但不限于:手势、人脸、人体、家居异常、家居物体等等,而对于移动目标,则尝试对其进行跟踪,实时描述它的状态。目标检测与跟踪是家庭助理机器人的基础能力,是机器人高级功能实现用户场景的重要支持,可以实现如手势控制、用户定位跟踪、家居安全巡检、用户站坐卧姿态,等
257、等。该技术与 AI 大模型相结合在未来机器人领域具有巨大的潜力,将为众多行业带来颠覆性的创新。目标检测与跟踪技术日趋完善,近三年年学术界未见重大突破,在工业界应用广泛,目前技术处于生产成熟期。但值得注意的是,在开发和部署这些技术时,必须考虑到数据隐私、伦理道德和法规方面的问题,以确保在尊重个人隐私和社会道德的基础上广泛应用。在推进物体识别和目标追踪技术与 AI 大模型相结合的过程中,我们需要关注并解决一系列挑战,包括但不限于数据隐私、信息安全、伦理道德和法规遵循等问题。例如,在公共安全领域应用监控技术时,需确保个人隐私受到充分保护;在医疗行业使用这些技术时,要遵守相关法律法规,确保患者信息安全
258、。同时,各利益相关方应持续沟通和合作,制定严格的政策和行业标准,引导技术向着有益于社会和谐发展的方向前进。只有在解决这些挑战的基础上,我们才能充分发挥物体识别和目标追踪结合 AI 大模型的技术优势,推动许多行业的高效发展。8.5.8 三维重建三维重建,通过视觉图像序列组合其他传感器数据进行纹理匹配从而估计机器人的位置以及还原三维环境的生成,典型代表有 bundleFusion、KinectFusion、Voxblox、NeRF 等。三维重建技术与 AI 结合,在导航与避障、物体识别与抓取、远程操作与监控等场景应用前景广阔。主要专利情况主要专利情况根据数据统计显示,“三维重建”技术的全球专利申请
259、量约 57 个。146应用趋势应用趋势三维重建技术是一种将二维信息转化为三维模型的先进技术,具有广泛的应用前景,如数字遗产保护、智能制造、虚拟现实等领域。在实际应用场景中,三维重建可以根据输入的图像或扫描数据生成精确的三维模型,包括物体表面结构、纹理和光照信息。利用 AI 技术、计算机视觉、图像处理和几何建模等核心技术,可以实现对现实世界的忠实呈现,为用户提供更丰富的交互体验。当前该技术正面对多角度拼接、精确建模、实时渲染、易用性等技术挑战。尽管谷歌、微软等科技巨头纷纷投入研究和开发三维重建技术,但在算法优化、硬件兼容性及跨平台通用性等方面,仍面临诸多挑战,目前市场上的三维重建产品较少,呈现出
260、蓝海市场特征,随着技术不断突破和成熟,其应用前景十分广阔。为了打造集轻便、易用、高精度于一体的三维重建解决方案,持续推动技术创新和产业应用成为未来行业发展的关键,将在自动导航移动机器人、家庭服务机器人、医疗机器人、教育培训机器人中发挥关键应用。三维重建技术及其在机器人领域的应用将为我们的生活带来诸多便利,同时也对各行各业产生深远影响。在这一过程中,需要积极面对挑战,推动技术创新,逐步实现科技与人类生活的深度融合。8.5.9 全景分割全景分割是一项先进的计算机视觉技术,它结合了语义分割和实例分割的特点,旨在解决现实世界中的场景理解问题。全景分割的目标是对图像中的每一个147像素进行标注,标注信息
261、不仅包括像素所属的类别(如人、车、建筑等),还包括像素所属的实例(如“第一个人”,“第二个人”等)。这样,全景分割技术能够提供一种全局视角,同时保留丰富的细节信息,有助于机器更好地理解和分析场景。该技术特点主要有高级视觉理解、实时性、全局和局部视角的融合、端到端学习等。主要专利情况主要专利情况根据数据统计显示,“全景分割”技术的全球专利申请量约 279 个。应用趋势应用趋势全景分割是机器人三维重建领域的关键技术之一,主要用于提取场景中各个物体的轮廓,并将它们与背景进行区分。该类技术已大量普及在各类产业中,典型代表为 YoLo 系列,成熟的场景分割算法主要应用在自动驾驶领域典型代表有DeepLa
262、b 系列,该技术为生产成熟期技术。结合 AI 技术,在服务机器人领域,全景分割将在智能交通、安防监控、文娱产业、零售业及物流、建筑与城市规划等方面发挥更大作用。总的来说,全景分割技术是一项有巨大潜力的计算机视觉技术,但也面临着许多挑战,如计算复杂度、实时性和鲁棒性等。未来的研究需要在提高模型的准确性、实时性和泛化能力,减少对标注数据的依赖,以及处理边缘物体和小物体等问题上取得进展。同时,也需要在硬件和算法层面进行优化,以满足实际应用中对计算效率和资源消耗的要求。1488.5.10 单目避障单目避障算法是现代综合型家庭助理机器人应对复杂家庭环境导航挑战的核心技术。作为 AI 技术的重要组成部分,
263、单目避障算法通过使用单个摄像头实现环境感知、物体识别和路径规划,从而确保家庭助手机器人在室内进行自主导航时安全高效地完成任务。主要专利情况主要专利情况根据数据统计显示,“单目避障”技术的全球专利申请量约 856 个。应用趋势应用趋势单目避障技术目前已由 iRobot 公司应用到扫地机器人上,通过两个相机组成的双目系统可以轻易实现稳定避障效果,但是由于机理限制,目前单相机在业界还无法做到稳定避障,深度估计,旨在通过图像的内容估计还原出每个像素的深度信息,由于多相机系统可以通过几何方法计算深度,故这里特指单一相机的深度估计,目前代表技术有 MonoDepth 等,但是由于该技术无法估计稳定的尺度信
264、息,导致应用受阻,但是由于单相机系统在移动机器人中应用普遍,该技术近期被广泛研究,目前属于期望膨胀期。在未来,单目避障结合 AI、大模型和计算芯片硬件发展将为机器人领域带来显著的技术进步和应用广泛性,在自动驾驶汽车、无人机、服务型机器人、智能家居设备辅助设备等方向实现产业化落地,推动相关产业的高质量发展。1498.5.11 人体关键点检测主要专利情况主要专利情况根据统计结果显示,人体关键点检测是智能服务机器人的新晋技术,仅在2021-2022 年间可见 3 篇专利,发表论文 4 篇。应用趋势应用趋势人体关键点检测,主要是对视频或图像中的人员的身体关键点(主要是关节点、脸部五官等)的检测,用于更
265、好的识别人的动作、姿态。在综合家庭助理机器人产业中,人体关键点检测在家庭辅助机器人有简单的应用,从养老陪护、儿童陪伴等需求来看,在未来有望快速普及。但人体关键点技术在开放环境、3D测量上仍有许多不足,仅在学术界相对活跃,工业界也有一定的应用,判断其处于欲望膨胀期。8.5.12 语音唤醒主要专利情况主要专利情况根据统计结果显示,语音唤醒技术在2021-2022年间共申请相关专利25件,均有国内机构申请;发表相关论文 5 篇。应用趋势应用趋势语音唤醒是指用特定的命令词唤醒对应的产品。在综合家庭助理机器人产业中,语音唤醒是普遍使用的技术。语音唤醒的难点,主要在于低功耗要求和高唤醒率之间的矛盾,如何在
266、小模型上提升唤醒率,降低误唤醒率是未来技术的发展150方向。语音唤醒的应用领域十分广泛,如机器人,音箱,汽车等,目前该技术应用已属于生产成熟期。8.5.13 离线命令词识别主要专利情况主要专利情况暂无专利数据,论文 3 篇应用趋势应用趋势离线命令词识别可以通过特定的命令词去控制机器的特定行为。离线命令词识别由于不受网络限制,通常响应速度较快,但算力和模型大小有限。在综合家庭助理机器人产业中,已普遍使用离线命令词识别,如何提升离线命令词识别模型的泛化性能是未来的发展方向。离线命令词识别已应用于很多智能家居,如空调,冰箱,风扇等,属于生产成熟期。8.5.14 在线语音识别主要专利情况主要专利情况根
267、据统计结果显示,在线语音识别相关技术专利申请和学术研究活跃度较高。该技术在 2021-2022 年间全球共申请相关专利 1034 件;发表相关论文 27 篇。应用趋势应用趋势语音识别指与机器进行语音交流,让机器明白目标人在说什么,从而做出相应的动作。在线语音识别使用云端引擎,有更高的识别率和鲁棒性,但时延较高。151对于综合家庭助理机器人产业,使用在线语音识别可以满足更高要求的场景,但在线语音识别模型相对体积较大,成本较高,且响应速度较慢,如何提升这些劣势是未来的发展方向。在线语音识别已应用于许多智能产品,属于生产成熟期。8.5.15 语音合成主要专利情况主要专利情况根据统计结果显示,语音合成
268、相关技术共申请专利 254 件。发表相关论文49 篇。应用趋势应用趋势语音合成技术是指将文字转化为语音的一种技术,能让机器人像人一样说话,是机器人的人工“嘴巴”。语音合成技术作为人工智能领域的一项重要技术,其发展前景非常广阔,目前语音合成技术在智能语音助手、互联网广播、社交媒体等场景落地,如读小说,读新闻等。在家庭助理机器人产业中,也已普遍使用语音合成技术,未来的语音合成会更倾向于拟人化程度更高和带有情感的语音,如个性化语音合成、情感语音合成、交互式语音合成,语音合成技术将会在数字化和智能化生活中扮演更为重要的角色。该技术属于生产成熟期。8.5.16 声学前端主要专利情况主要专利情况根据统计结
269、果显示,声学前端技术在 2021-2022 年间共申请相关专利 213件;发表相关论文 26 篇。152应用趋势应用趋势在语音交互任务中,语音会受到复杂声学环境干扰,如,扬声器回声,房间混响,非目标人的人声干扰,背景噪声等。这些不利的声学因素会影响语音识别的效果,故对麦克风采集到的语音信号进行预处理能有效提升语音质量,提高语音识别准确率。在机器人产业中,目前的声学前端信号处理主要包括回声消除、Beamforming、声源定位、语音分离、去混响和降噪等操作,采用了传统信号处理和深度神经网络相结合的方式。声学前端信号处理属于生产成熟期。8.5.17 多通道用户界面交互主要专利情况主要专利情况根据数
270、据统计显示,“多通道用户界面交互”技术的全球专利申请量约 54 个。153应用趋势应用趋势人机交互技术是指人与计算机的信息交换,以有效的方式实现人与计算机对话、人与计算机之间的触觉反馈等。当前,人机交互技术已经应用于智能机器人的虚拟现实交互、语音交互、运动意图识别等方面,例如:应用于可穿戴式设备、浸入式游戏等的动作识别技术,应用于虚拟现实、遥控机器人及远程医疗等的触觉交互技术,应用于呼叫路由、家庭自动化及语音拨号等场合的语音识别技术,对于有语言障碍的人士的无声语音识别,应用于重症患者、神经损伤患者等的眼动跟踪技术,针对有语言和行动障碍人开发的“意念轮椅”采用的基于脑电波的人机界面技术等。目前,
271、人机交互虽然应用到了不同的领域和方向,但其主要以被动交互为主,主动交互的识别精度和速度还需不断改进,例如:基于视觉的手势识别率低,实时性差,需要研究各种算法来改善。此外,眼睛虹膜、掌纹、笔迹、步态、语音、唇读等人类特征的研发应用、多通道的整合也将是人机交互技术突破的方向。基于以上,人机交互技术正处于稳步爬升复苏期。8.5.18 激光导航机器人激光导航技术是指利用激光传感器获取环境的几何信息,以实现机器人的导航、定位和避障等任务。激光传感器在机器人激光导航中起着至关重要的作用。近年来,激光传感器的技术不断进步,包括更高的分辨率、更大的测量范围、更快的采样速率和更低的噪声水平。这些进步提高了激光传
272、感器的精度和可靠性,有助于更准确地感知环境。激光导航技术常常与实时建图和定位相结合。通过激光传感器获取的点云数据可以用于构建环境的二维或三维地图,同时结合激光雷达的扫描数据进行机器人的定位。现代激光导航算法采用高效的建图和定位方法,可以在实时性要求下处理大量的激光数据。激光传感器提供了环境中物体的准确位置和距离信息,使机器人能够实时检测障碍物并规避它们。通过结合激光数据和导航算法,机器人可以自主规划合适的路径来达到目标位置。主要专利情况主要专利情况根据数据统计显示,近 10 年“物体位姿估计”技术的全球专利申请量约 3574个。154应用趋势应用趋势激光导航在机器人、自动驾驶、增强现实等领域有
273、着广泛的应用,特别是扫地机器人对于该技术的使用已经较为成熟,传感器选择偏向廉价的单线激光雷达;自动驾驶行业利用该技术(可能结合高精地图)实现车辆实时定位,传感器选择偏向多线激光雷达及固态激光雷达。该技术目前处于稳步爬升复苏期,同视觉方案相比各有优劣、暂时无法由其中一方完全替代另一方。未来,随着传感器技术的发展,激光传感器越来越小巧轻便,这使得激光导航技术可以应用于更多的移动设备,如无人机、手持设备等。同时,激光导航技术通常与其他传感器,如相机、惯性测量单元(IMU)等进行融合,以提高定位和建图的准确性和鲁棒性。深度学习技术在计算机视觉和机器学习领域取得了巨大的成功。将深度学习与激光导航相结合,
274、可以提高对激光数据的处理和分析能力,进一步提升定位和建图的准确性和鲁棒性。8.5.19 视觉导航视觉导航技术是一种基于视觉感知和图像处理的导航方法,它通过分析环境中的视觉信息,实现机器人、车辆或其他移动设备在未知环境中的定位、路径规划和导航功能。视觉导航技术通过使用相机或其他视觉传感器来感知环境中的视觉信息。这些视觉信息可以是图像、视频流或点云数据。通过对视觉数据的处理和分析,可以提取出环境中的特征,如边缘、角点、目标物体等。在视觉导航中,通常需要提取环境中的特征,并将其与先前存储的地图或参考图像进行匹配,以155确定机器人的位置。特征可以是局部特征,如 SIFT、SURF、ORB 等,也可以
275、是全局特征,如地标或目标物体的特征。基于提取的特征和匹配算法,视觉导航技术可以实现机器人的定位和建图。一旦机器人确定了当前位置并建立了地图,视觉导航技术可以根据目标位置或任务需求进行路径规划和导航。路径规划算法会考虑地图的特征和机器人的运动能力,生成一条最优路径或避开障碍物的路径。导航控制算法则会将路径转化为实际的机器人运动指令,实现机器人的导航和运动控制。主要专利情况主要专利情况根据数据统计显示,近 10 年“视觉导航”技术的全球专利申请量约 5713 个。应用趋势应用趋势视觉导航技术在自动驾驶、无人机、机器人、AR/VR 等领域都有着广泛的应用。自动驾驶车辆是视觉导航技术的一个重要应用领域
276、。随着计算机视觉和深度学习的发展,视觉导航可以帮助车辆实现准确的环境感知、道路检测、障碍物识别等,从而实现更安全和高效的自动驾驶。视觉导航技术在机器人领域也具有广泛的应用。机器人可以通过视觉感知环境、识别目标、构建地图等,实现自主导航、室内定位、避障等功能。视觉导航使得机器人可以在未知环境中进行任务执行和路径规划。视觉导航技术在无人机导航和遥感领域有重要作用。通过视觉导航,无人机可以实现自主的飞行、目标跟踪、地形感知等功能,用于航拍、搜索救援、农业巡查等应用。视觉导航技术在 AR 和 VR 应用中也有着潜力。通过156结合视觉导航和 AR 技术,可以在真实场景中叠加虚拟信息,如导航路径、地标标
277、识等,提供用户导航指引。在 VR 应用中,视觉导航可以用于虚拟环境中的自主导航和交互体验。视觉导航技术可以用于智能家居和物联网系统中的定位和导航功能。通过将相机或其他视觉传感器集成到智能设备中,可以实现家居设备的定位、人体追踪、室内导航等,为用户提供更智能的居家体验。总的来说,视觉导航技术在自动驾驶、机器人、无人机、AR/VR、智能家居和物联网等领域有着广泛的应用前景。随着计算机视觉、深度学习和硬件技术的不断发展,视觉导航将变得更加精确、智能和实时。8.5.20 毫米波导航毫米波导航是一种基于毫米波雷达技术的导航方法,它利用毫米波信号的特性进行定位、导航和避障。毫米波信号具有较短的波长,因此可
278、以实现较高的空间分辨率和精确的定位。通过利用毫米波雷达系统进行测距和角度估计,可以实现对目标物体的精确定位,提供高精度的导航信息。毫米波信号在大气和障碍物中的传播受到较小的干扰,相比于其他频段的雷达系统,毫米波雷达具有更好的抗干扰性能。这使得毫米波导航在复杂环境下具有更可靠的定位和导航能力。毫米波导航适用于高速移动的场景,如高速列车、航空器等。由于毫米波信号的高频特性,它可以提供快速的响应时间和准确的位置更新,满足高速移动物体的导航需求。毫米波雷达系统可以探测到障碍物并提供高分辨率的障碍物图像,从而帮助导航系统规避碰撞,并提供安全的导航路径。主要专利情况主要专利情况根据数据统计显示,近 10
279、年“毫米波导航”技术的全球专利申请量约 260 个。157应用趋势应用趋势毫米波导航在智能交通系统中有广泛应用。它可以用于车辆自动驾驶、交通流量监测、智能停车管理等。毫米波导航可以提供准确的车辆定位和环境感知,实现安全、高效的交通系统。该技术属于技术萌芽期。现阶段家居场景下,24G/60G/77G 毫米波雷达用于避障尚属初步探索阶段,未有具体产品先例。在后期也更多是作为一种感知传感器补充,用于感知其他传感器无法感知到的类似透明玻璃和黑色吸波材料等等。包含频段的合规问题还待相关部门商讨制定,相关政策合规预计需要 3-4 年时间完成。同时尽管毫米波雷达低成本的优势,但在家居场景下,存在多径反射、虚
280、警等难以解决的问题,目前还无法在毫米波感知底层算法上做有效滤除。基于这些因素,毫米波雷达应用于家居环境还需要累计相应的工程经验与落地测试实践。8.5.21 机械臂/灵巧手操作主要专利情况主要专利情况根据数据统计显示,“机械臂/灵巧手操作”技术的全球专利申请量约 46 个。应用趋势应用趋势机械臂与灵巧手操作是指结合视觉及力感知等反馈信息,利用运动规划与控制技术实现机械臂及灵巧手操作或移动物体。机械臂与灵巧手主要应用于智能工厂、服务领域、医疗领域等行业应用方向。目前,机械臂在软硬件方面已经相对成熟,在智能工厂等场景化领域已经实现规模化应用,在服务和医疗等领域的协作机器人需要在软硬件方面进一步研发,
281、探索协作机器人软硬件技术方案。灵巧手在两指夹具等软硬件方向已经相对成熟,在智能工厂也已经落地应用,但三指158和五指灵巧手软硬件还处于研发初级阶段,需要在结构传动、末端传感器等方向需要进一步研发,在算法层面,需要在力控规划操作、模仿学习及深度强化学习等方向作为重要技术方向,实现拟人化操作,进而更深入的集成到机器人系统中。在当前综合家庭助理机器人产业中,机械臂与灵巧手操作技术的使用仍处于技术萌芽期。大部分实验研发仍在模拟器环境或者内部可控环境下进行,尚未部署在真实商业和家庭环境中。因为在实验环境下很难复现各种可能出现的家居场景,所以很难产生足够好且多的示教数据来覆盖所有场景,这会导致机器人在真实
282、用户家庭中执行任务的失败。对于家庭助理机器人,一种可能的方案是需要用户手动教导机器人如何完成任务,但这一过程更加不可控。另一种方案是尽可能地搜集多的开放世界的示教数据,例如从网上下载教程视频进行筛选和学习。8.5.22 家居物体/家庭场景重建主要专利情况主要专利情况根据数据统计显示,“家居物体/家庭场景重建”技术的全球专利申请量约 105个。近五年专利数量进入申请高速期。同时,与该技术直接相关的重要论文发表仅见 2 篇。应用趋势应用趋势家居物体/家庭场景重建的目标是重建三维对象的表面。它需要一个传感器捕捉物体以构建三维(3D)模型。家庭场景重建需要带传感器的移动机器人穿越家庭复杂场景,并全面收
283、集并重建整个场景的信息。随着进一步发展,物体和159场景重建将真实场虚拟化以提供更好的仿真环境,加速机器人的训练效率的同时降低训练成本。上述任务可以帮助机器人获取更好的场景理解。目前,该技术在智能服务机器人领域尚处于萌芽阶段。虽然随着深度学习的发展,端到端的神经重建和渲染显著提升了场景重建效果和效率,但对视角规划的严苛要求和泛化性的不足依然限制其发展。此外,对物体物理特性的捕捉困难也阻碍其重建物体和场景在仿真环境中的使用。8.5.23 机器人仿真及数据生成(自我感知)主要专利情况主要专利情况根据数据统计显示,“机器人仿真及数据生成”技术的全球专利申请量约 156个。应用趋势应用趋势机器人仿真及
284、数据生成技术点认为是机器人对自我感知系统的构建,通过研发设计中预置的多种类型传感器,收集运行过程中的自身数据为后期建模仿真与自身健康感知甚至数字孪生系统提供数据支持。该技术在餐饮酒店机器人已经应用,现阶段主要用于规模化的运维支持场景,以及为知识计算提供足够的数据输入,也会应用于算法的仿真分析与建模过程中的模型优化。作为服务机器人专有技术,该技术萌芽期/期望膨胀期。1608.5.24 语音语义识别主要专利情况主要专利情况根据数据统计显示,“语音语义识别”技术的全球专利申请量约 222 个。应用趋势应用趋势语音语义识别技术在当前大语言模型取得重大进展的背景下,正呈现出爆发式增长,并在许多领域展现出
285、全新的应用趋势,如虚拟助手和语音交互、文本生成和内容创作、虚拟现实和增强现实、跨语言交流、信息检索和智能推荐、教育和培训等,从改善交互体验到自动化处理任务。值得注意的是,尽管语音语义识别技术在很多领域中具有潜在的应用趋势,但在实际应用中仍然存在一些挑战,例如多语种识别、背景噪声处理、生成内容的真实性和隐私安全等问题。8.5.25 文本语法语义分析主要专利情况主要专利情况根据数据统计显示,“文本语法语义分析”技术的全球专利申请量约 191 个。161应用趋势应用趋势文本语义语法分析是自然语言处理中的一个重要领域,它旨在识别并分析文本中的词汇、语法结构和语义信息,以便更好地理解文本的意义。文本语义
286、语法分析是目前自然语言处理中的热点领域之一。近年来,基于深度学习的模型在文本语义语法分析领域中得到了广泛应用。这些模型,比如循环神经网络(RNN)、卷积神经网络(CNN)和注意力机制(Attention mechanism)等,可以自动学习并捕捉文本中的语义和语法信息,从而提高分析的精度和效果。此外,在文本语义语法分析领域还涌现出了一些新的技术和方法,比如迁移学习、强化学习等,这些技术和方法可以实现针对不同特定任务或语言的文本分析,如情感分析、命名实体识别和机器翻译等。文本语义语法分析领域目前正处于快速发展阶段,不断涌现出新的技术和方法,为自然语言处理提供更加准确和高效的解决方案。随着大数据、
287、人工智能等技术的发展,文本语义语法分析的应用趋势越来越明显,涉及到金融、医疗、教育、工业等各个领域,具体用于智能客服、情感分析、知识图谱构建、舆情检测、自然语言生成等场景。8.5.26 对话交互技术主要专利情况主要专利情况根据数据统计显示,“对话交互技术”的全球专利申请量约 1320 个。应用趋势应用趋势对话交互技术是指通过自然语言交互,使人类和机器人之间建立高度复杂的交互关系,从而实现更加智能化、便捷化和高效化的服务。人机对话技术历经半162世纪的发展有了一些突破和进步,目前对话交互技术在语音助手、智能音箱和闲聊软件等方面有广泛的应用,通过对话交互技术,智能体可以实现自我学习和自我完善,能够
288、以此改善人机交互体验,并不断提高自身的智能化水平,但整体目前还在于初期阶段(泡沫破裂低谷期)。未来还需要在通用语言理解和语言生成技术、深度融合知识和常识信息、记忆机制、多模态的对话技术等方面进行攻克,使机器能够掌握更加完整的语境信息并结合记忆信息辅助对话决策、语言生成时融合多模态信息,使对话更加生动形象。未来研究及应用趋势是如何实现多模态、全双工交互,增强机器在多任务、全场景、全领域的灵活对话能力。8.5.27 智能问答主要专利情况主要专利情况根据数据统计显示,“智能问答”技术的全球专利申请量约 46 个。应用趋势应用趋势智能问答系统是一种具有很大应用潜力的技术,在个人助手、客户服务、医疗健康
289、、金融行业、教育领域都具有广泛的应用。随着机器学习和自然语言处理技术的不断发展,智能问答系统利用大数据和物联网的技术优势将能够更准确地理解和回答人类提出的问题。未来,智能问答系统将向移动设备智能化方向发展,为用户提供便捷、个性化的服务,并通过可视化呈现用户提出的问题和答案,为用户提供更好的使用体验。1638.5.28 知识图谱构建主要专利情况主要专利情况根据数据统计显示,“知识图谱构建”技术的全球专利申请量约 77 个。应用趋势应用趋势知识图谱是采用语义形式表达的特定领域知识,具有系统化、结构化、集成化的特点。其能够通过数据标注、分类、扩充等方式将知识参与到计算,把各种形态的知识,借助一系列
290、AI 技术进行抽取、表达、计算,进而产生更为精准的模型,并能进行规则推理,再次赋能给机器和人,实现知识的获取、建模、管理和应用。得益于图卷积网络等技术,利用知识图谱已经可以进行“可解释的”知识发现,进一步提升了知识图谱在医养康护等领域的应用潜力。目前该项技术已经应用在 AI 处方推荐、疾病早期诊断等方面,但由于数据的获取、治理困难、知识来源管理、知识储存和更新、知识产权保护、知识的智能化应用等方面存在多方面的问题,尤其是在 chatGPT 等模型出现后,知识图谱模型的构建、发展和应用面临着较大的挑战,该行业技术处于泡沫破裂低谷期。未来知识图谱的发展方向或将呈现多元化趋势,创新的知识图谱形态,构
291、建多模态知识图谱,拓展知识图谱的应用场景和领域。8.5.29 知识搜索主要专利情况主要专利情况根据数据统计显示,“知识搜索”技术的全球专利申请量约 93 个。164应用趋势应用趋势知识搜索是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。知识搜索能够帮助智能服务机器人获取庞大的知识和信息资源。通过连接到知识库、知识图谱、互联网和其他数据源,机器人可以快速检索和获取各个领域的知识和信息,通过不断优化和训练知识搜索模型,使智能服务机器人能够更好的理解交互信息,并且提供更加智能化、精准化和个性化的交互服务。
292、知识搜索的发展将推动智能服务机器人在各个领域的广泛应用,为用户带来更便捷和高效的智能服务体验。8.5.30 云脑发育主要专利情况主要专利情况根据数据统计显示,“智慧云脑”技术的全球专利申请量约 30 个。165应用趋势应用趋势云脑是云服务机器人的公用大脑,为所有接入云平台的机器人提供资源和智力支持。云脑发育是指云脑对采集的海量多模态数据进行知识挖掘获取“知识和技能”,动态构建完备的可高效检索的知识图谱,通过知识共享机制,云脑加速迭代,促进个体机器人智力的增强、机器人群体的进化和整体服务水平的提高。由于服务机器人面临的许多问题具有不确定性、脆弱性和开放性,即使为云脑提供无限的数据资源,也难以让它
293、做到真正像人一样的学习和思考,将人的作用引入到云脑中,形成人机协同的混合-增强智能形态,这种形态是人工智能发展的重要趋向,也是云脑可行的、重要成长模式。目前,此项技术在国家重点研发计划项目支持下取得了较大进步,但尚未实现产业化。8.5.31 故障自诊断主要专利情况主要专利情况根据数据统计显示,“机器人故障自诊断”技术的全球专利申请量约 35 个。应用趋势应用趋势机器人故障自诊断技术是依据采集的机器人传感器数据,结合机器人的机理特性、运行环境及历史运行数据对其将要发生或正在发生的故障进行预警,并定位机器人故障的位置,给出故障的时间,分析故障的具体原因。至今,机器人已广泛应用于社会各行各业,机器人
294、故障自诊断技术将为机器人的安全可靠运行提供坚实保障,已成为提高机器人安全水平的有效方式之一,发展前景广阔。但由166于机器人自身系统复杂,机载传感器类型多样、数量众多,机器人故障自诊断仍然面临着巨大的技术挑战。目前,此项技术还处于起步期,处于稳步发展阶段。8.5.32 智能控制主要专利情况主要专利情况根据数据统计显示,“智能控制”技术的全球专利申请量约 34 个。应用趋势应用趋势智能控制技术是人工智能和自动化技术来实现系统的自主决策和智能控制的方法和技术。它结合了传感器、算法、模型和反馈机制,以使系统能够感知环境、分析数据、做出决策并执行相应的控制操作。智能控制技术的核心目标是使系统能够在不同
295、的环境和任务下自动适应和优化其行为,以实现高效、安全、可靠和智能化的操作;已经在工业自动化、交通运输、能源管理、智能家居、智慧医疗等方面进行了应用。智能控制技术的应用也推动着服务机器人朝着智能化、自主化、灵活化和协作化方向发展,提供更智能、个性化的服务。目前跟发达国家相比,我国智能控制技术还处于初级阶段,处于稳步爬升复苏期,未来随着传感技术、神经网络与模糊系统优化组合、机器人自主学习等相关技术突破后,智能控制技术将会不断的进步和发展。1678.5.33 任务决策规划主要专利情况主要专利情况根据数据统计显示,“任务决策规划”技术的全球专利申请量约 4661 个。应用趋势应用趋势任务决策是基于感知
296、信息比如视觉感知、语音指令等,对机器人的进行任务进行决策和规划,以实现远程辅助或监护、风险预警等方面的技术应用。目前此技术在较广泛应用于酒店、娱乐场所、机构及居家环境等场景,实现物资配送、自动巡护、跌倒预警等功能。此项技术目前还处于初级发展阶段,处于稳步爬升复苏期。8.5.34 轨迹预测轨迹预测是一种关键的机器人技术,尤其在自动驾驶、无人机航行和物流机器人等领域具有广泛的应用。其主要目标是预测移动物体(如行人、车辆、机器人等)的未来运动轨迹。预测结果能够帮助机器人进行决策,例如规划路径、避免碰撞等,从而在复杂的环境中安全有效地运行。该技术主要包括预测未来、虑环境信息、处理不确定性、实时性、支持
297、决策、处理不确定性、实时性、预测范围、多目标预测、模型训练、模型泛化能力等特点。主要专利情况主要专利情况根据数据统计显示,“轨迹预测”技术的全球专利申请量约 85 个。168应用趋势应用趋势轨迹预测技术在未来有多种可能的发展趋势和应用领域,主要包括自动驾驶、机器人导航、无人机、智能交通系统、虚拟和增强现实、AI 安全系统等。总的来说,轨迹预测技术是一项关键的机器人技术,随着深度学习和其他 AI 技术的发展,轨迹预测技术的应用领域和影响力预计将进一步扩大。未来的研究需要在处理不确定性、提高处理速度、利用环境信息、扩大预测范围、处理多目标预测、改进模型训练和提高模型泛化能力等方面取得进展。同时,为
298、了应对复杂和不确定的环境,研究者需要开发更强大和灵活的预测模型,也需要与其他技术(如感知、决策和控制等)紧密结合,以实现在复杂环境中的安全有效运行。8.5.35 语义导航主要专利情况主要专利情况根据数据统计显示,“语义导航”技术全球专利申请量约 424 个。169应用趋势应用趋势语义导航是让智能体跟着自然语言指令进行导航,这个任务需要同时理解自然语言指令与视角中可以看见的图像信息,然后在环境中对自身所处状态做出对应的动作,最终达到目标位置。机器人要对目标物体进行操作的时候,比如机器人从冰箱里拿出可乐,在传统方法中,一般是需要进行环境感知,机器人知道周围环境以及它目前所处的位置、位姿,以及目标的
299、位置,接着进行路径规划,然后是决策控制。可以看出为了解决这一系列的问题,需要进行较多的步骤。将先验场景信息进行编码,加入到端到端的视觉导航中,直接就可以完成去找杯子、去厨房等的语义导航能力。目前这部分技术还处于探索阶段。8.5.36 智能调度主要专利情况主要专利情况根据数据统计显示,“智能调度”技术的全球专利申请量约 5160 个。应用趋势应用趋势智能调度技术主要是借助多个单体机器人的联网或云端网管,使群组机器人能够协同完成规定任务。该技术在餐饮酒店机器人中主要为移动机器人的多机协同和调度提供支持,暂不涉及多单体机器人的自组网智能。该技术发展进入爬升期和成熟期。1708.5.37 多机协同主要
300、专利情况主要专利情况根据数据统计显示,“多机协同”技术的全球专利申请量约 51 个。应用趋势应用趋势多机协同技术是能够达成机器人之间交流和活动的体系,系统优于单机器人,多用于康复训练、多机协作等方面。多级协同技术在空间结构、功能实现、信息交互、资源配置和应对复杂环境等方面有明显的优势,但与此同时,由于多机协同系统复杂性高、动态性强、存在时变及耦合的问题给系统的设计及后续开发带来了不少问题,其中又以分布式人工智能的控制问题,多机器人之间的通信问题等最为常见,这些问题正是多机器人相互协调协作的主要研究目标。多机器人协作系统研究的最终目标在于最大化的实现多机器人系统的优势,使整个系统能够在环境不稳定
301、和任务实时性强的情况下能够做出相应调整,高效可靠地完成任务。目前此类技术还处于发展期,稳步爬升复苏期。8.5.38 系统安全主要专利情况主要专利情况根据数据统计显示,“系统安全”技术的全球专利申请量约 1062 个。171应用趋势应用趋势该技术主要通过操作系统、网络安全和信息安全的一些手段,通过主动或被动的方式,使机器人本体操作系统和云端网管系统及周边系统获得整体安全可信能力。该技术在餐饮酒店机器人系统中主要借助现有网络安全和信息安全的手段。随着服务机器人数量的不断增加,体积与功率的不断加大,对安全可信系统的要求会不断提高,机器人安全可信体系系统要实现由被动向主动、由静态向动态的整体安全防御。
302、现有的安全系统技术为成熟期;服务机器人专有的安全可信系统技术为萌芽期/期望膨胀期。8.5.39 数据安全主要专利情况主要专利情况根据数据统计显示,“数据安全”相关的全球专利申请量约 524 个。172应用趋势应用趋势数据安全是指通过一系列的技术、策略和措施,保护数据的机密性、完整性和可用性,以防止未经授权的访问、修改或破坏。它涉及加密和身份验证来保护敏感数据的传输和存储,使用安全传输协议确保数据在网络传输中的安全性,实施访问控制和权限管理限制对数据的访问,进行数据备份和灾难恢复以应对意外情况,并遵守相关法规和标准确保数据处理的合法性和合规性。数据安全的目标是保护用户隐私,防止数据泄露和损坏,以
303、及确保数据在需要时能够安全可靠地使用,为用户和组织提供可信赖的数据环境。数据安全已经广泛应用于与人工智能相关的各个领域;目前相关技术及应用还处于初级发展阶段,属稳步爬升复苏期。173第九章 智能客服第九章 智能客服9.1.产业定义智能客服是指应用人工智能技术,代替人工进行客户服务,实现信息的智能化处理。这一技术是在大规模知识处理基础上发展起来的一项面向行业应用的技术手段,具有行业通用性,不仅为提供了细粒度知识管理技术,还为与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段;同时还能够为提供精细化管理所需的统计分析信息。往往以机器人为主导,采用语音识别、自然语言处理、知识图谱等技术,
304、将服务对象的需求自动识别,并针对性地反馈答案,从而达到高效、快捷、准确的服务目的。该技术的引入不仅令的业务运营得到了全面升级,也使客户的服务体验得到了质的提升。智能客服以机器人为主导,通过人工智能算法,进行无间断的服务,实现智能化的客户服务理念,极大地提高了客户与之间的互动质量。本文将对智能客服的概念、特征以及应用进行全面解析,带领读者了解智能客服这一变革性技术给我们带来的机遇和挑战。根据客服形态差异,智能客服可以分为三类,分别为在线客服、语音客服、视频客服。其描述如下:1.在线客服。在线客服是指通过网站、APP 等互联网媒体,为用户提供实时的咨询和解答服务,包括文字、图片、语音等模式的服务。
305、特别是现在疫情可能随时宣布封锁,利用在线客服功能,不仅能够为顾客提供快速、准确的服务,也可以简化的客户服务难度,减少成本。2.语音客服。语音客服是指利用语音通讯技术,将服务对象的声音转化为电信息,从而实现客户咨询的自动化处理,为客户们提供更贴近人性话语,能够更好的提高客户对的忠诚度。3、视频客服。视频客服是普通网页在线客服的一个升级版,当然,视频客服具有普通在线客服的一些功能。主要功能:视频展示,语音和视频的畅通交流,实时的和网站访问用户进行在线沟通运用的领域:培训网站,视频购物、视频导购、网站监视等。1749.2.主要技术点分类1759.3.主要技术在产业的应用9.3.1 高性能鲁棒语音识别
306、语 音 识 别(speech recognition)技 术,也 被 称 为 自 动 语 音 识 别(AutomaticSpeechRecognition,ASR)、电脑语音识别(Computer Speech Recognition)或是语音转文本识别(Speech To Text,STT),其目标是以电脑自动将人类的语音内容转换为相应的文字。在真实场景下,语音识别需要解决噪声,混响,口音,外文混杂,快速解码等各方面的挑战因素。高性能鲁棒的语音识别技术能够大幅提升语音识别系统的抗噪能力、说话人口音快速适应能力和语音识别解码速度。9.3.2 方言及口音语音识别语音识别技术,又称为自动语音识别(
307、Automatic Speech Recognition,ASR),它是以语音为研究对象,通过语音信号处理和模式识别让机器理解人类语言,并将其转换为相应的文字。采用迁移学习的技术和标注数据相结合的方式,解决方言及口音识别的复杂性、相似性和数据的稀缺性问题,提升语音模型对方言和口音的识别能力。1769.3.3 高质量和高表现力语音合成语音合成是通过机械的、电子的方法产生人造语音的技术。TTS 技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。9.3.4 多音色语音合成TTS(Text-To-Speech,语音合成)技
308、术是将文字信息转变为可以听懂的、流利的语音;多音色语音合成是在语音合成的基础上,通过不同音色的训练数据利用小样本进行迁移学习,根据需求生成不同的音色模型,如:男声、女生、特定声线的模仿等。9.3.5 声纹识别声纹是指电声学仪器显示的携带言语信息的声波频谱,具有特定性和相对稳定性。成年人的声纹几乎不会再变化,并且任何两个人的声纹之间都有着一定差异。声纹识别是指通过专用的电声转换仪器将声波特征绘制成波谱图形,与已经177注册过的声纹模型对比,从而区分不同的个体,实现身份校验功能。按照应用场景,又可以分为一对一、一对多、多对多等多种类型。9.3.6 静音分析用户不说话时,智能客服系统应当能识别出“现
309、在没有人在说话”,并根据当前情况给予用户指示。即这项技术是识别出语音交互过程中,用户没有回答的时间段,或是将用户说话和不说话两种状态区分开的一种技术。其可能要面对的难点在于如何排除环境背景音,以及当用户说话声音过小时如何处理等。9.3.7 语速分析在语速分析中,通常将指标量化为每分钟所说的字数。在一些领域的应用中,也可能当一句话少于若干字时不进行语速分析。当语速过快时,人声的频谱可能会产生粘连,进而导致难以进行梅尔倒谱系数等语音处理方面参数的准确计算。9.3.8 声源定位178声源定位即用于确定声源方向和距离,主要应用于语音交互设备对声源进行定位和海洋声学中的声源定位或方位估计。主流方法包括波
310、束形成,超分辨谱估计和 TDOA 等。可以在语音客服和视频客服中联合使用,以尝试估计用户在三维空间中的位置。可以考虑和这面部捕捉、动作捕捉技术联合使用,以更好地构建用户的 3D 模型。9.3.9 语音唤醒在连续语流中实时检测出说话人特定片段,将设备从休眠状态激活至运行状态。实现方法有基于置信度、基于识别和基于垃圾词网络的唤醒;目前主流应用类型有:先唤醒再指令、将唤醒词和指令一同说出、将常用用户指令设置为唤醒词等。这一技术可以应用于一些较简单的客服任务中,比如内置在某些产品中,作为离线状态下的客服手段,也可以减少一部分人工工作量。9.3.10 模型压缩针对大规模预训练模型,采用蒸馏、剪枝等方式,
311、在模型效果损失较少的前提下,减小模型参数量,使得模型变小,易于在生产环境中进行加载。1799.3.11 全双工对话全双工是通信学科中的一个术语,意为允许数据在两个方向上同时传输,应用在智能语音语言行业,即为实时的、双向的语音信息的交互,这是人们进行即兴自由交互情境下的对话模式。相比于单轮对话和多轮对话的技术,双全工语音只需一次唤醒即可保持进行连续的语音流分析,即机器保持听+想的状态,即使在它回话的时候也同步在听和想。9.3.12 小样本学习针对领域小样本数据集,采用大规模预训练模型进行迁移学习,充分利用预训练模型已有语义特征,实现对小样本的理解,提升小样本领域问答效果。9.3.13 视觉问答视
312、觉问答(Visual question answering)是计算机视觉领域和自然语言处理领域的交叉方向,视觉问答任务是以图像(或视频)和与图像(或视频)有关的文本问题的多模态信息作为计算机的输入,计算机根据图片得到问题的正确答案.1809.3.14 视觉摘要视觉摘要(visual abstract)指的是将科学信息转化为更易在社交媒体快速传播的图形格式。包括关键帧融合、视频片段拼接等。9.3.15 视觉推理视觉推理(Visual reasoning)里主要是限定在 VQA(Visual QuestionAnswering)的问题上,也就是让计算机看一副图,然后给出一个问题,让其回答。相比传统
313、的 VQA 问题,视觉推理问题的要求是要让问题难度提升,必须经过推理才能回答。9.3.16 动作捕捉动作捕捉(Motion capture),简称动捕(Mocap),又称运动捕捉。是指记录并处理人或其他物体动作的技术。它广泛应用于军事,娱乐,体育,医疗应用,计算机视觉以及机器人技术等诸多领域。其中,较为基础、应用较为广泛的技术模181型为 SMPL(Skinned Multi-Person Linear model),即多人线性蒙皮模型。这一模型可以在给出了人体关键点位的情况下,根据预先设置的参数建立人体的三维模型。此外,较为点型的技术还有 AMASS(Archive of Motion Ca
314、pture asSurface Shapes),它统一了 15 个不同的基于光学标记的 mocap 数据集,在一个共同的框架和参数化中表示它们,将很多原本并不通用的小数据集通过一套表示方式构建成了一个更大的数据集。这一技术是基于 SMPL 和 Mosh+的。现有的很多数字人模型对手部的处理并不是很精细,这也是由于手部本身体积小、遮挡多、自由度高等因素导致的。但也有一些地方使用了 MANO(handModel with Articulated and Non-rigid defOrmations)及其衍生模型来对手部进行较好地建模。这是一个关节连接与非刚性变形的手部模型,较好地处理了手与身体连接
315、以及手部本身动作捕捉的问题。9.3.17 面部捕捉面部动作捕捉(Facial Motion Capture),有时也被称为面部表情捕捉(Facial Expression Capture)。它是动作捕捉(Motion Capture)技术的一部分,指使用机械装置、相机等设备记录人类面部表情和动作,将之转换为一系列参数数据的过程。9.3.18 意图识别意图识别(Intent recognition)是理解数据符号的语义信息,或在具体业务场景下的需求表达,并按照要求输出正确反馈结果的过程。182意图识别,本质上是一个文本分类问题。智能问答客服系统中,通过识别用户咨询问题的意图,匹配对应回答。多意图
316、识别(Multi-intent recognition,MIR),在实际场景中,用户通常在同一语音中具有多个意图,通过结合意图识别和槽位填充任务,在一轮用户交互中实现多个预定义的意图槽位填充。9.3.19 槽位填充槽位填充是系统通过槽位识别、反问澄清等技术向用户收集关键信息的过程。通过槽位填充,将模糊或缺失的意图补全,槽位值就是用户表达的具体关键信息。9.3.20 多模态知识图谱多模态就是指视觉、听觉和语言等不同模态通道的融合。能够充分融合和利用语言、视觉和听觉等多种模态来源数据的知识图谱叫作多模态知识图谱。传统知识图谱主要集中研究文本和数据库的实体和关系,而多模态知识图谱则在此基础上构建了多
317、种模态下的实体,以及多种模态实体间的多模态语义关系。1839.3.21 跨模态语义搜索以一种类型的数据作为查询去检索另一种类型的数据,通过模型融合方法有效处理“异构鸿沟”问题,主要方法有图文匹配、公共空间特征学习方法等。9.3.22 多模态情绪识别通过对不同的信息来源,如:语音、图像、文字等不同模态的数据进行统一建模,充分提取不同模态中的数据特征,分析识别用户的情感倾向。在实际应用场景中,可结合客户的语音、语气、语义等多方面的特征,分析客户情感倾向,根据客户情绪,识别用户真实意图,提供个性化的服务。9.3.23 用户画像通过机器学习和统计分析手段,对海量客户数据进行分析,根据对话上文或用户历史
318、对话数据,提取用户特征标签,沟通偏好、交互态度等,以形成对用户的综合认识和理解,并据此为用户提供个性化的服务。1849.3.24 多轮对话管理多轮对话管理功能,主要通过识别和追踪客户的对话状态,不断根据当前的状态决策下一步应该采取的最优动作,协调客服机器人的各个部分,澄清需求、引导用户、询问、确认,完成对话任务。9.3.25 对话状态追踪对话状态追踪(dialogue state tracking,DST)作用是根据用户意图、槽位取值、上文状态以及之前的动作等来追踪当前对话状态。其能够结合对话历史、当前对话、前一轮对话状态等信息,推断并更新当前对话状态的过程,以便系统能够准确理解用户意图并提供
319、连贯的回答。根据使用的模型,对话状态追踪可以分为基于规则、生成式模型、判别式模型的方法。而其中又用到了自然语言理解(NLU)的技术。9.3.26 对话策略学习对话策略学习(Dialogue Policy learning,DPL)基于当前对话状态决定系统需要采取动作,是继续了解意图,还是确定意图,又或者其他动作。这种学习185可以帮助智能客服系统更好地理解用户意图、提供准确的回答,并以更智能、人性化的方式与用户进行交互。9.3.27 检索式对话生成检索式对话生成是一种基于检索技术的对话生成方法,根据对话管理部分产生的非语言信息,自动生成面向用户的自然语言反馈,检索式对话生成技术从已有的人人对话
320、语料库中通过排序学习和深度匹配找到适合当前输入的最佳回复。这种方法的局限是仅能以固定的语言模式进行回复,无法实现词语的多样性组合。9.3.28 生成式对话生成根据对话管理部分产生的非语言信息,自动生成面向用户的自然语言反馈,生成式对话生成技术在已有的人人对话中学习语言的组合模式,通过机器学习算法构建深层语义模型,让模型从大量的已有对话中学习对话规则,是通过类似机器翻译中常用的“编码-解码”的过程去逐字或逐词地生成一个回复,优点是简单、可扩展,能够更好地理解上下文,内容丰富,但结果的可控性差。1869.3.29 结构化知识问答基于结构化知识组织方式实现与用户的端到端问答交互,包括基于问答对知识库
321、的 FAQ 问答、基于表格的表格问答、基于知识图谱的图谱问答。其中,FAQ问答通过将用户问题与频繁问答对知识库进行语义匹配,实现与用户的一问一答交互;表格问答通过表格信息解析实现端到端的人机交互;图谱问答基于知识图谱和关系推理实现。9.3.30 对话式阅读理解理解用户对非结构化文档的提问,从非结构化文档中提取答案,依托深度阅读理解等技术实现非结构化文档到用户问答的端到端过程。对话式阅读理解技术可以使系统能够更好地理解用户问题,并从大量的知识资源中提取准确的答案或信息。它有助于提高对话质量和用户满意度,使智能客服系统更具人性化和智能化。1879.3.31 知识图谱构建基于关系抽取、实体识别、序列
322、标注等技术,得到图谱三元组,采用图知识库构建领域知识图谱,可通过自动化流程实现一站式构建知识图谱。9.3.32 文本纠错采用预训练语言模型,实现对用户问题的有效纠错,提高语义理解准确性。现有的常见文本纠错有语法纠错,拼写纠错等,是提升 ASR 识别准确率的重要方法。语义纠错可以基于文本或是音频进行。在音频上的的语义纠错模型可以基于 Transformer 结构,其中用到了发音词典、双音素结构、HMM 等重要模型,并采用在 NLP 领域应用广泛的 Kaldi 工具进行训练。9.3.33 智能对话平台通过对话平台,能够定义语音交互体验,在现有产品或平台基础上,创造语音助手、智能客服、聊天机器人等。
323、智能对话平台提供了一种高效、灵活和可扩展的方式来实现智能客服系统的对话功能。它能够支持复杂的对话场景,并提供个性化、准确和人性化的服务,提升用户体验和满意度。1889.4.产业技术成熟度分析9.4.1 学术界与产业界成果四象限图1899.4.2 热度-供给图与阶段-供给图1909.5.技术分析9.5.1 高性能鲁棒语音识别主要专利情况主要专利情况根据数据统计显示,高性能鲁棒语音识别技术的全球专利申请量约2126个。应用趋势应用趋势高性能鲁棒语音识别技术专利的申请数量从 2013 年至 2021 年间呈现逐年上升的趋势,其中 2019 年到 2020 年申请量的增长幅度较之前几年更大。2022
324、年,申请量较前一年有比较明显的下降。基于以上数据的变化趋势,可以看出该技术在 2010 年代末期受到了更多的关注,专利申请数量逐步上升,但在 2022 年却出现了下降。其中 2019 年的申请量增长加速,可能是由于行业发展的迅速和技术的迭代加速,促使对该技术的创新和研发产生了更大的需求。但在技术应用和市场落地的过程中也遇到了很多挑战,可能是导致最近申请量下降原因之一。9.5.2 方言及口音语音识别主要专利情况主要专利情况根据数据统计显示,方言及口音语音识别技术的全球专利申请量约1599个。应用趋势应用趋势方言及口音语音识别技术从2012年到2020年整体大致呈现出增长的趋势,只有 2013 年
325、到 2015 年有轻微下降。在 2021 年和 2022 年,申请量相对于前一年均有所下降。其中 2019 年申请量的增长幅度非常明显,与之前几年的申请量相比增加了很多。分析可能原因是在之前几年语音识别技术不断年发展和进步,提高了方言及口音语音识别技术的准确率;同时随着智能客服、智能家具、车载系统等领域的快速发展,该技术得到了广泛应用,带动了专利申请数量的增长。从应用场景和领域的角度来看,此类技术的应用非常广泛,包括语音翻译、智能客服、自动驾驶等多个方面。1919.5.3 高质量和高表现力语音合成主要专利情况主要专利情况根据数据统计显示,高质量和高表现力语音合成技术的全球专利申请量约4471
326、个。应用趋势应用趋势从数据变化幅度来看,高质量和高表现力语音合成技术专利申请量 2012 年至 2018 年呈现缓慢增长趋势,而 2019 年至 2021 年这三年该技术专利申请量较前几年增长显著。然而,2022 年申请量较前一年减少,但仍较高于 2019 年前数量,可能与新冠疫情影响有关。从专利申请量近些年变化趋势可以看出,2012 年至 2018 年语音合成技术仍在发展中,对于提高合成质量和表现力的技术基础仍不成熟,到 2019 年随着技术积累和发展,高质量和高表现力语音合成技术及相关应用有了较为明显的进步。9.5.4 多音色语音合成主要专利情况主要专利情况根据数据统计显示,多音色语音合成
327、技术的全球专利申请量约 7867 个。应用趋势应用趋势从 2012 年到 2021 年,全球多音色语音合成技术的专利申请呈现逐年增长的趋势。其中 2018 年和 2019 年分别较前一年增幅明显,2019 年到 2021 年专利申请数量显著高于前几年申请数量。但 2022 年申请数量降到之前水平。多音色语音合成技术广泛应用于智能客服、语音助手、虚拟偶像等领域,这些领域近些年迅速发展,市场需求进一步推动了该技术的发展和专利申请数量的增加。专利申请量增长趋势表明了该技术的研究和开发日益受到重视,并在不同领域得到广泛的应用。9.5.5 声纹识别主要专利情况主要专利情况根据数据统计显示,声纹识别技术的
328、全球专利申请量约 12531 个。192应用趋势应用趋势从 2012 年到 2020 年,声纹识别技术的专利申请数量逐年增长,但在 2018年呈现出爆发式增长,2018 至 2021 年该技术专利申请数量一致保持较高的水平,均超过了 1000 个。受新冠疫情影响,2022 年声纹识别技术的专利申请数量出现了下降。从整体上看,声纹识别技术专利申请数量呈现出上升趋势,特别是从 2018 年起开始每年都有大量相关技术专利申请,这表明声纹识别技术受到越来越多的关注和投资。综上所述,声纹识别技术在未来可能会得到更多的发展和应用,这也意味着声纹识别技术的市场潜力巨大,有望成为未来重要技术之一。9.5.6
329、静音分析主要专利情况主要专利情况根据数据统计显示,静音分析技术的全球专利申请量约 6529 个。应用趋势应用趋势从 2012 年到 2021 年,静音分析技术的专利申请数量整体呈现增长的态势。其中 2015 年到 2020 年均保持比较快的增长水平。2021 年较 2020 年该技术专利申请数量有轻微下降但两年相差不大。2022 年受疫情影响,专利申请数量回落到 2017 年的水平。“静音分析”技术的应用范围在不断拓展和深化,为多个领域和应用场景的智能化、高效化提供技术支持。从专利申请数量的变化趋势也可以看出,近些年该技术研究和应用整体呈现较快的发展趋势。9.5.7 语速分析主要专利情况主要专
330、利情况根据数据统计显示,语速分析技术的全球专利申请量约 19708 个。应用趋势应用趋势在过去的十年里,语速分析技术的专利申请数量不断增长,从 2012 年的 385个到 2021 年的 2431 个,呈现出了超过 6 倍的增长趋势。其中从 2016 年开始到 2021 年保持较快的增长趋势,可以看出语速分析技术的研究一直得到较高的重视。由于近些年语音合成、语音识别等技术得到了较为显著的进展,语速分析193技术也相应得到了进一步的提高。同时随着技术的不断成熟以及人们对于语音交互需求的日益增长,越来越多的应用场景也得到了开发和拓展,促进了专利申请数量的增长。9.5.8 声源定位主要专利情况主要专
331、利情况根据数据统计显示,声源定位技术在全球专利申请数量约为 7955 个。应用趋势应用趋势声源定位技术,从 2012 年到 2019 年呈现出缓慢增长的趋势,从 2012 年的285 个增长到 2019 年的 526 个。2020 年和 2021 年较之前申请数量有微小的下降,具体申请数量分别为 501 个和 504 个。可能由于该技术相对比较成熟,创新性不如其他技术领域,造成了专利申请数量增长较为缓慢的原因。但随着智能客服、智能家居、智能汽车、虚拟现实等智能化应用场景的持续扩展,可以预见该技术整体仍会呈现持续发展的态势。9.5.9 语音唤醒主要专利情况主要专利情况根据数据统计,语音唤醒技术的
332、全球专利申请数量约为 1636 个。应用趋势应用趋势从 2012 年到 2019 年语音唤醒技术呈现除了快速的增长趋势,从 2012 年的 12 个增长到了 2019 年的 309 个。2020 年和 2021 年较 2019 年虽有微小下降,但仍保持较高的水平,分别为284 个和 295 个。2018 年专利申请明显加快,可能与语音交互技术的落地和大规模应用场景的扩展有关系,极大地促进了语音唤醒技术的应用与发展。9.5.10 模型压缩主要专利情况主要专利情况根据数据统计显示,“模型压缩”技术的全球专利申请量约 2191 个。194应用趋势应用趋势在过去的十年中,模型压缩技术的专利申请数量呈现
333、出逐年增长的趋势。从2012 年的 23 个专利申请数量到 2021 年的 517 个,增长了将近 22 倍。2012 年到 2017 年增速较为平缓,而 2018 年和 2019 年的增长速度加快,分别为前一年的 1.98 倍和 1.56 倍,这可能与人工智能技术的快速发展和应用有关。2020 年专利申请数量增长速度更是加快,具体为 404 个,较前一年增加了168 个。这与近几年深度学习技术的快速发展,模型参数量和计算量的不断增长有很大关系。并且近年人工智能在移动设备、物联网等领域快速发展,这些应用场景对模型大小和性能有特定的需求,因此模型压缩技术的研发越来越受到重视。9.5.11 全双工对话主要专利情况主要专利情况根据数据统计显示,“全双工对话”技术的全球专利申请量约 12836 个。应用趋势应用趋势该技术专利申请数量整体上呈现出了一个逐渐增长的趋势,从 2012 年的344 个专利