1、技术展望2024AI拐点重塑人类潜力2概要技术展望2024|AI拐点:重塑人类潜力技术展望2024开卷,欢迎阅读!本报告的核心理念源于两大新现实:首先,技术推动的重塑浪潮正在席卷每家企业,并影响企业的方方面面;其次,新兴技术呈现出越来越“人性化”的特性,提供了前所未有的能力,从而真正让人类发挥出巨大潜力。这两大新现实的共同作用将重塑我们的工作和生活方式。试想一下这种种可能。过去,我们适应技术,比如改变我们的习惯来适应新的应用程序或计算机界面,但现在技术开始适应我们的需求。生成式人工智能创造出实实在在的文本和图像,仿佛出自人手。新的空间计算设备融合了物理空间与数字世界,使人们可以跨越多个空间开展
2、活动。而脑机接口和环境计算等的身体感应技术,正以从未有过的方式读取并理解我们的所思所想。正是在技术创新蓬勃发展的大背景下,我们迎来了今年的技术展望。从提高生产力的新方法到开展业务和应对重大挑战的全新方式,这些技术创新为企业领导者创造了许多机遇。我们不仅明确了当前需要采取的行动,也勾勒出了未来的前进之路:技术将从被动的代理人,转变为主动的合作者,以更加自然的交互模式与我们互动。技术朝着更加人性化的方向发展,也引发关涉人类的问题。在今年的技术展望中,我们将从各个维度探讨这一问题,并强调技术设计要以人为本。技术可以提升人类的创造力和生产力,让我们能为企业中最重要的部分人,创造积极的影响。和我们一起来
3、,探索未来的技术发展,塑造技术的使用方式。我们相信,人性化设计正是未来之路。沈居丽(Julie Sweet)埃森哲董事长兼首席执行官杜保洛(Paul Daugherty)埃森哲首席技术和创新官前言重塑人类潜力AI拐点概要技术展望2024|AI拐点:重塑人类潜力3AI伙伴 从知识到智识的革新 人们正在向生成式AI聊天机器人获取信息,这一趋势将改变现有的搜索业务,也将对软件和数据驱动型企业的未来产生影响。智能体 AI互联的生态系统 智能体将能够自主决策和行动,大量互联的人工智能将组成一个大型网络,但在此之前,人类需要给予其足够的引导和监督,以确保其行为符合我们的价值观和目标。空间计算 发掘虚拟实感
4、的价值 空间计算技术领域正在迅速发展,但要成功利用这种新媒介,企业需要先找到王牌应用。人机互通 技术解码人类意图 从眼动追踪到机器学习再到脑机接口(BCI),许多技术开始以更深入、更以人为中心的方式理解人类。目录概要:AI拐点 重塑人类潜力未来几年,企业将拥有数量和种类多到惊人的技术选择。但总体而言,技术,正在变得更加人性化。4-1213-2728-4344-5960-774概要技术展望2024|AI拐点:重塑人类潜力AI拐点人类与技术正处于一个历史的拐点。你是否见过描绘1000年后的人类的反乌托邦图片?那时人类的脊背是弯曲的,皮肤是蜡黄的,眼睛大而敏感这些都是人类长时间呆在室内、与自然世界过
5、分疏离的结果。这些图像反映了艺术家们对当下人类与科技的关系的看法。这些令人震惊的图片虽然出自艺术家的想象,却源于人类内心真实的恐惧,因为人们担心过多的屏幕时间和科技对认知的影响。尽管我们越来越多地使用技术,但也越来越担心技术控制我们的生活,或者失去对技术的控制。但未来不一定如艺术家想象的那样糟糕。如果我们重塑人与技术的关系,如果我们的技术设计更能具有人之为人的秉性而不是舍弃人性,人类不必担心陷入艺术家们所担忧的那种未来。因此,是时候让技术设计变得更加人性化了。重塑人类潜力5概要技术展望2024|AI拐点:重塑人类潜力这是一个重塑的时代。未来几年,企业拥有的技术选择,无论是数量还是种类,都将多到
6、惊人。这将释放更多人类潜能,提高生产力和创造力。自动化的智能体可以代表我们行动;人机互通的智能界面改变了我们与信息及软件交互的方式;空间计算技术将数字世界与现实世界融合,或者能将我们从办公桌前立即传送到工厂或山顶;甚至连脑机接口这样曾经听起来像科幻小说里的技术也逐渐在企业中找到了相关、可行的应用。具有前瞻眼光的企业已经开启了这场竞赛,目标瞄准一个拥有更高价值和能力的新时代。虽然每个企业的策略各不相同,但他们都认识到一个共同的趋势,即技术正在变得更加人性化。人们不禁要问,技术不就是由人制造、并为人制造的吗?从创造、应用到推广,技术的发展一直以来都是由人类主导的。人类创造和运用技术来拓展自身的能力
7、。事实上,创造扩展人类能力的工具正是人类的独有特征之一。有人认为,正是这种能力把人类与其他物种区别开来。1然而,从本质上讲,我们创造的工具通常显然是不具有人性的。无论是外形还是行动,他们都不像“人类”,而这原本却一直是工具被创造出来的目的。作为人类,我们有追求,但也有限制:心想耕耘,但不善开垦;欲登九天,却难离尘土;我们试图解决问题,但无力处理复杂或庞大的数字。所以,工具的价值在于弥补我们自身的能力限制,实现我们难以企及的愿景,从而彻底改变了我们的生活。例如,汽车实现了我们的出行自由,起重机让我们得以建造摩天大楼和桥梁,乐器和播放器则帮助我们创作、传播和欣赏音乐。科技 不是一直都是为人而生的吗
8、?6概要技术展望2024|AI拐点:重塑人类潜力技术“非人”的特点也可能是它的缺点。长期使用手工工具会导致我们患上关节炎,长时间盯着屏幕会导致眼睛近视。导航仪虽然先进,但在开车使用时仍会分散我们的注意力。技术在我们的生活环境中的应用也会引发一系列问题:在设计家庭和办公空间时,人们常常考虑如何获得更好的网络连接和带宽;内燃机可能满足了某些人的需要,但对另一些人来说却意味着污染。尽管人们一直在努力创造出更符合人体工学或更方便好用的工具,但我们仍然经常基于机器的需求和限制来做出决策,而不是优化人类的潜力。这就是为什么在艺术家想象的人类进化的未来世界里,人类与技术之间充满冲突。技术增强了我们的能力,让
9、我们可以超越局限,但其“非人”的特点同样会对我们产生影响。但如今,人类的技术设计理念发生了前所未有的变化。这并不意味着我们要远离技术,而是说我们要拥抱更具人性化的新一代技术。这些技术在设计上更加直观,更符合人类的思维和行为方式,也更接近人类的智能,与我们生活的方方面面紧密融合。我们的世界正在成为原子和比特相融合的世界。如果我们想帮助人们创造更美好的生活,我们需要设计出能够放大人类特质的技术。过去的一些技术发明已经朝着这个方向迈出了重要的步伐,比如图形用户界面(graphical user interface,简称GUI)的出现使得电脑界面更友好、更直观;智能手机将计算机的功能和性能集成到了一个
10、小巧的设备中,使人们能够随身携带并在任何地方使用;而人工智能(AI)最有影响力的用途之一是跨语言翻译。而现在,这股涓涓细流即将形成一个巨大的设计浪潮。以生成式AI和Transformer模型对我们周围世界的影响为例,ChatGPT和Bard等聊天机器人一举成名,如今已成为技术发展的推动力,使其变得更加直观、智能,并易于所有人使用。例如,Adobe的人工智能图像生成模型套件Adobe Firefly加强了Photoshop的生成式填充(Generative Fill)和生成式扩展功能(Generative Expand)。2这些创新使任何人都可以使用简单的文本提示对图像进行非破坏性的添加、扩展或
11、删除。用户现在可以验围绕不同的概念进行构思,并比以往更快地产生数十种变化效果,从而验证自己的想法。人工智能曾经专注于自动化和例行任务,现在正通过与人类合作,转向更多辅助和增强的功能,改变人们的工作方式。在过去,许多高级技术和专业知识工作只能由受过高度训练或财力雄厚的人才能够使用和应用。然而,随着人工智能的发展,这些技术和知识工作正变得更加普遍、可用。阅读人人可用的生成式人工智能,了解更多关于人工智能演进的内容。95%的受访企业高管认为 更具人性化的技术将显著扩大 每个行业的发展机会。概要技术展望2024|AI拐点:重塑人类潜力05001,0001,5002,0002,5002022Q11,62
12、51,5081,3331,3211,3721,9332022Q22022Q32022Q4公司数量总提及数2022年11月ChatGPT发布2023Q12023Q22023Q3总提及数公司数量2,24740,00035,00030,00025,00020,00015,00010,0005,0000概要7生成式AI的影响力不仅仅局限于完成特定的任务,它还将深刻重塑组织和市场。例如,谷歌云最近发布了一款生成式AI搜索工具,用来帮助医生和护士快速查找可能存储在多个系统且不同文件格式的患者信息这是多年来困扰医疗保健系统的大难题。3 麻省理工学院CSAIL 研究人员开发了一种生成式人工智能计算工具 Fra
13、meDiff,它可以合成自然界不存在的蛋白质结构,从而为药物开发开辟新的可能性。4对于软件公司来说,GitHub的“Copilot”(一种帮助编写代码的生成式AI助手)等工具也使软件工程师们对自己的工作满意度不断提高。5 事实上,在许多情况下,生成式AI工具使用起来非常直观,员工会非常迅速地采用这些工具。无需组织建立正式的计划或培训,它们就已经自下而上地渗透到工作场所。阅读埃森哲未来生活趋势2024,了解互动体验变化的趋势。生成式人工智能的影响力 不仅仅局限于完成特定的任务。人工智能的关注度如何?自2022年11月ChatGPT发布以来,财报电话会议记录中提到人工智能的次数增加了7倍。来源:埃
14、森哲商业研究院对28,629家公司和30,904份财报电话会议记录(S&P Global Transcripts)进行的自然语言处理分析:2022年1月至2023年9月。在2022年第一季度至2022年第三季度的财报电话会议记录中提及人工智能的公司数量以及总提及次数8概要技术展望2024|AI拐点:重塑人类潜力除了人工智能之外,还有许多其他技术也在朝着更加人性化的方向发展。这些技术将解决横亘在我们与技术之间的许多痛点,帮助我们释放更大的人类潜力。为了解决数字工作固有的难题(例如容易造成视频疲劳),微软对用于创建数字和物理融合沉浸式空间的Microsoft Mesh进行了重大更新。6 微软试图用
15、沉浸式体验来解决当今痛点并推动新的协作工作方式的办法。由于认识到社交媒体在许多人的生活中重要性,以及它可能产生的问题,社交媒体新手Discord和Mastadon建立了一种更类似我们日常生活中建立的社区和关系的社交网络,而不是那种由集中式推荐算法驱动的社交网络。波士顿动力公司长期以来一直走在让机器人更加人性化的前沿,致力于让机器人与我们周围的世界更加顺畅地融合。例如,他们的双足机器人Atlas接受过各种任务的训练,从而从而使其能够像人类一样移动和感知环境。7更重要的是,这些机器人不仅仅在行为上模仿人类,在社交上也如此。由于人类与机器人进行交互时使用的是复杂的代码行和令人费解的机器逻辑,这让不懂
16、这些工具语言的人和机器人交流时常常陷入彼此无法沟通的僵局。如今,研究人员发现了一种方法,在波士顿动力机器人上搭载ChatGPT,这样人们可以使用自然语言来指挥机器人或向它查询之前的工作任务,并获得用简单的英语回复的清晰答案。8这就是为什么对企业来说打造和使用人性化技术如此重要。当技术更加人性化时,它就更容易使用,并使人们工作更加高效、联系更加紧密。而我们又渴望做更多的事情,制造更多定制产品、拓展到更多市场,并与更多合作伙伴合作。我们再来谈谈数字技术给各个行业带来的大规模扩张的机遇。可以这样理解:在18世纪,工业革命给了我们带来了比从前更丰富的物质财富,并改变了世界的运作方式和我们的生活方式。随
17、着技术的人性化,它变得更容易与之合作,并将在业务的各个维度中引发技术的融入。我们已经看到它对我们创造能力的影响。最近的创新技术已经使数字艺术、音乐和产品设计呈现出爆炸式发展。人性化的技术也带来了全新的可能性,如智能体等数字助手,或可以让我们打破物理定律来进行构建和创造的数字空间。将人类与先进技术相连接,在其中建立直观的桥梁,每个行业都将实现生产力和价值创造的指数级增长。无论是对企业还是消费者来说,这都将是一个充满新想法和新行动的全新宇宙。当技术更加人性化时,它就更容易使用。9概要技术展望2024|AI拐点:重塑人类潜力人性化的技术设计将使更多人能够接触和利用技术,扩大他们获取知识的机会,参与到
18、持续创新中。这将重新塑造更多我们拥有的东西,但它也将能够创造出企业从未有过的事物和想法。曾经因为技术的复杂性而被隔绝在外的人群也有望参与为数字革命做出贡献。随着技术变得更加直观和易于使用,我们还可以吸引这些人群成为新客户和新员工。如此,他们的知识财富将首次可为企业所用。当每个人都成为数字化转型的一部分时,也将会使数据、产品、劳动力等现代化的力量持续增强。领导这种转变的企业将获得创新机会。随着大量使用改变数字世界工具的新人加入,企业将收获新的思维、创意和知识,推动其在数字领域的发展和变革。尽管经济增长和整个人口的赋权将塑造我们未来的世界,但我们对这个世界的塑造仍然没有确定下来,企业有责任将其打造
19、成一个我们想要生活的理想世界。领导者仍然要面临老生常谈的问题,例如哪些产品和服务已经成熟到可以扩大规模、哪些新数据可以使用、可以采取哪些变革行动,但他们还将面临一些可能从未预料过的问题:如何监督人工智能?谁将参与数字化转型?我们对生态系统中的人们承担什么样的责任?人性化设计不仅仅是对功能的描述,更是对未来的要求。在企业寻求重塑其数字核心的过程中,符合人类需求的技术将是获取成功的关键。每个企业都将看到潜在的新兴技术将重塑其数字化工作的核心。生成式AI、空间计算等技术的成熟和规模化将改变数字体验、数据和分析、产品。在这数字化的重塑时刻,企业可以制定新的战略,最大限度地发挥人类潜力,消除人与技术之间
20、的摩擦。人工智能将为未来提供动能,但未来必须为人类智能而设计。新一代的技术将赋予企业更强大的能力,可以做更多的事情,因而他们做出的每一个选择也变得更加重要。你会成为一个榜样还是一个警示?全世界都会关注。10概要技术展望2024|AI拐点:重塑人类潜力如果要问:人何以为人?那是因为我们能思考、能行动、能感受并理解彼此。而现在,技术开始体现人类的这种专属经验。这种转变将重置我们与技术的关系,并彻底改变我们使用技术的方式和方向。去年的技术展望探讨了原子和比特的融合如何为我们的新现实奠定基础。我们描述了这样一个世界:在这个世界中,数字和物理现实之间的障碍正在消失,几乎在所有技术领域都开启了全新的创新,
21、而重要的是,这些部分将如何成为企业核心向前发展的关键部分。在今年的技术展望中,我们研究了影响数实融合发展的最关键要素:人。物质世界和数字世界的进一步融合推动了更多人性化技术的涌现。今年的四大趋势指出了趋向人性化的几个关键维度,并说明了组织需要如何做好准备。首先,我思故我在。我们收集、存储和获取信息的方式一直是人类经验中根深蒂固的一部分。在“AI伙伴”中,我们探讨了技术如何开始模仿人类处理信息的方式。技术开始具备类似人类大脑的记忆和学习能力。这些变化最初始于搜索领域,并将彻底改变我们获取和管理知识的方式。自主性和行动能力是人类本能的一部分。在人类历史的早期阶段,人们没有写作或建造的能力,但他们仍
22、然能够狩猎、采集食物,做出决策,并与周围的世界互动。如今,智能体可以作为自动化助手为个人提供帮助,同时也有潜力在企业间构建智能体生态系统,为整个商业环境提供支持。空间计算打破物理和数字之间的界限,使得数字世界能够与物理世界相互融合和交互,数字世界不再是一个与我们隔离的陌生环境,而是能够与我们的身体和感知相连接的环境。技术理解人类一直是一个挑战,虽然技术可以追踪和观察人们的行为,但往往无法准确捕捉到人们的意图和目的。人机互通正在摒弃以往不自然和繁琐的技术交互方式,寻求更加自然和直观的方式与人类交互,更准确地读取和理解人类的行为、意图和情感。思考、行动、感受和理解是人类与生俱来的能力特质。通过使用
23、能够与我们相似的工具和技术,我们能够更好地理解和与世界互动,使我们与世界之间的联系更加紧密和深入。同时,这也赋予了个人、公司和政府更多的权力和能力,使他们能够在塑造世界中发挥更重要的作用。2024年趋势技术人化11概要技术展望2024|AI拐点:重塑人类潜力人性化设计的技术可以为人们和企业带来深远的好处,但前进的道路并不那么简单。我们将迎来技术历史上最大的转折点。企业及其领导者的决策对我们如何应对这样的转折、如何在这样的转折中前进至关重要。我们经历了很多增长和创新,但不是所有的发展都是正向的、有益的,伴随着增长与创新而来的也可能是更多欺诈现象、错误信息和安全漏洞。因此,如果我们设计的工具仅仅有
24、人类的能力,但没有人类的智慧,甚至人类的良知,那么我们可能会创造出对社会和个人利益都有损害的东西。更多的人性化技术意味着更多的道德问题,其中许多问题在我们能继续前进前就需要找到答案。我们创造了能够与人类一样说话和行动的智能体,用令人印象深刻的方式扩展了人类的能力。但ChatGPT发布后,我们也立即看到那些充满恐惧的新闻标题。机器会消解人类的创造力吗?他们会抢走我们的工作吗?他们会试图摧毁我们吗?这不仅仅是反对新技术的卢德分子的猜测,许多领先的人工智能研究人员对人工智能的潜在危险提出了关切并停止了相关研究。9,10 当元宇宙的概念被提出时,立刻引发了人们对元宇宙的潜在负面影响的担忧。元宇宙的吸引
25、力是否会导致我们从此宅居家中,影响我们的心理健康?11 脑部扫描可以用来解码人们的思维。12 这种技术的潜力可能被用于对人们有利或不利的目的。技术和人类 都处在变革时刻,而世界正等待重塑。这些问题都没有明确的答案,但企业在面对这些新技术和新趋势时,需要积极参与并找到解决方案。尽管有些技术看似难以置信、深不可测,但它们正在从科幻小说中变成现实,并成为董事会讨论的话题。在人类技术的时代,企业推向市场的每一种产品和每一项服务都可能改变生活、赋能社区并引发变革,无论是变得更好还是更坏。同时,是采取快速行动还是谨慎的态度?竞争对手或其他国家会不会拒绝分担责任或者或同样戒备?对此,企业要学会保持微妙的平衡
26、。正向工程:我们的技术十字路口12概要技术展望2024|AI拐点:重塑人类潜力企业领导者做出的选择、他们所秉持的价值观以及制定的优先事项所影响的将远远不止是利润率和股东回报,因此企业以有意义的方式进行创新比以往任何时候都更加重要。我们在努力让技术变得人性化的同时,需要将安全视为一种推动因素、一种在人与技术之间建立信任的必要方式,而不是一种限制或要求。我们在创造技术的时候不能回避其对人类的意义或者本末倒置。这个概念我们称之为“正向工程”。在过去的几年里,道德伦理问题已经在技术领域中逐渐浮现,涉及技术领域的方方面面,如包容性、无障碍、可持续、职业安全、创新知识产权保护等等。每个问题其实都源于同一个
27、问题,即:在我们用技术能够实现的目标与我们作为人类想要实现的目标之间,我们该如何取得平衡?有人是第一次接触数字世界,而有人已经走得越来越深入,公司必须重视他们的福祉、隐私和安全。努力实现技术包容性的公司将弥合社会鸿沟,填补组织、员工和客户之间存在的空白。当技术变得更加人性化并助力企业增长时,它们也必须为人们提供更多机会和发展空间。技术和人类都处在一个变革的时刻,而世界正等待着你去帮助它、塑造它。93%的受访企业高管认为:随着技术的快速发展,对组织来说,在创新过程中追求更广泛的目标和价值 已变得前所未有的重要。技术展望2024|AI拐点:重塑人类潜力AI伙伴从知识到智识的革新AI?14技术展望2
28、024|AI拐点:重塑人类潜力19962022166519982023176820011873200820251967201020272012201920282029203119751990Ask Jeeves创立。8OpenAI发布ChatGPT。15第一本科学刊物出版。1谷歌PageRank算法上线。9 微软Bing Chat亮相公众视野。16大英百科全书 第一版问世。2维基百科问世。10阿默斯特学院图书馆管理启用杜威十进制系统。3Stack Overflow开始众包编程问答。11一家领先航空公司宣布,客户对聊天机器人客服和人工客服的满意度相差无几。大英百科全书 第一版问世。4Micros
29、oft面向企业发布SharePoint。12 数据中毒(将恶意数据植入机器学习模型)成为企业面临的头号网络安全威胁。ORBIT数据库搜索服务推出,专用于检索研究摘要。5谷歌正式提出知识图谱的概念,迈出了语义搜索之路的意义重大的一步。13研究人员提出K-BERT构想,一种基于知识图 谱 的 大 语 言 模 型(LLM)。14大多数企业启用专属聊天机器人协助知识管理、开展研究和执行工作任务。人工智能咨询工具的搜索量超过传统搜索引擎。将基于应用程序的界面替换为基于智能体的界面的智能手机发布。俄亥俄州立大学实施了第一个主要的数字目录。6加拿大麦吉尔大学的三名学生发明了史上第一款搜索引擎Archie。7
30、1967AI伙伴15技术展望2024|AI拐点:重塑人类潜力概览我们与数据的关系正在发生变化,人类的思维、工作以及与技术交互的模式也随之发生深刻变化。数字化企业的整个基础正在经历一场颠覆性的变革。随着数据的重要性日益凸显并深入到社会经济各个层面,我们的生活和工作正经历一场由数据引发的全面革新。AI伙伴16技术展望2024|AI拐点:重塑人类潜力这绝非夸大其辞。遥想15年前,大西洋月刊7月版的封面故事标题赫然是:谷歌让我们变愚蠢了吗?文章作者尼古拉斯卡尔(Nicolas Carr)认为网络搜索破坏了他的思维方式、专注力和阅读深度。17 而到今日,我们可以斩钉截铁地答复他:“不会”。使用谷歌并未导
31、致我们的智力降级。但有一点毋庸置疑:获取信息的方式确实会塑造个人行为。搜索几乎改变了它所触及的一切,成为人们和企业与数据交互的主要途径。它极大开阔了人们获取知识的宽度和广度,将检索时间从数小时缩短到数分钟,并促进了企业的转型变革。它透过广告和搜索引擎优化为客户的生活带来了新突破,开创了服务和发现产品的新路径,成为员工体验不可或缺的内在构成。我们如此依赖搜索,它早已在不知不觉中深入到了生活的方方面面。几乎70%的网站流量都始于搜索。18 网络串联起每一条信息,使之交织构成庞大的图书馆。20多年来,搜索一直担当着图书馆管理员的角色。2022年底,风向骤变,搜索巨头们进入高度警觉状态。19 人类与数
32、据多年来平静的联结关系第一次泛起了涟漪。“图书馆管理员”模式逐渐退场,新型“智能顾问”模式开始大行其道。人们不再单凭搜索来生成结果,转而向生成式AI聊天机器人索求答案。这一趋势最早始于2022年11月OpenAI推出ChatGPT的时候。这款应用程序一跃成为有史以来用户增长最快的应用程序。20 大语言模型(LLM,Large Language Model)虽已在用多年,但ChatGPT凭借直接对话答疑的创新模式,一夕间博得万众眼球。OpenAI的合作伙伴微软迅速嗅到商机,于2023年2月乘势推出Bing Chat。21 他们不是单纯地将它定位为搜索工具,而是冠以“网络智能搭档”的威名。紧接着,
33、Salesforce在3月推出了Einstein GPT。该生成式AICRM技术能利用公司存储在Salesforce应用程序中的所有客户数据,生成个性化营销材料或知识文章等内容。22 到2023年6月,医疗保健软件公司Epic已开始将GPT-4内嵌到旗下产品中,协助临床医生快速撰写患者病历摘要。23 我们如此依赖搜索,它早已在不知不觉中深入到了 生活的方方面面。AI伙伴17技术展望2024|AI拐点:重塑人类潜力人们访问数据和数据交互方式正在持续更迭中,以迅猛之势影响你我的世界。它不仅给传统搜索公司敲响警钟,更是让所有公司都感受到了紧迫的变革需求。受到生成式AI的影响不仅仅是网络搜索引擎,也包
34、括所有广义上的搜索,从搜索电子邮件或文件到在CRM数据库中查找客户详细信息等形式都包含其中。数据是塑造当今数字业务的一大核心要素。聊天机器人整合海量信息来提供答疑和推荐意见,它采用多元的数据模式,完整记住历史对话,甚至能提出下一步该问什么问题,从而颠覆了传统意义上依赖于单一、线性数据流程的业务运作模式。许多长期存在的企业职能,例如数字营销、广告宣传和产品发现等等,势必经历新生变革。除了开放网络,公司上下各处蕴藏着大量价值信息,等待客户、员工、合作伙伴和投资者的发现、采集和应用。然而,我们往往因为记不清正确的搜索词、不擅长描述查询诉求、数据分散孤立,抑或是文档太密集,导致很多信息难以访问或提取。
35、对于当今的数据驱动型业务来说,生成式AI激活了无限的潜在价值,有待进一步挖掘和开发。然而,真正的颠覆不仅仅体现在我们访问数据的方式,它甚至还会令整个软件市场为之改变。倘若应用程序和数字平台的界面统统换位给生成式AI聊天机器人,未来会怎样?倘若它变身为我们读取、写入和与数据交互的新方式,成为所有平台的一大核心能力,未来又如何?搜索领域的突破和进展势必会颠覆软件、以及它在企业以及整个数字世界中扮演的角色。如今,企业亟待把握住时代契机,重构信息在整个组织中的运作方式,创新开拓新一代数据驱动型业务。如果企业不是只被动把自己定位在搜索结果之中,而更主动担当起可靠咨询师的角色,客户体验和互动将会因此有所不
36、同。当员工能够及时地按需获取信息和答案时,内部工作流程会随之发生转变。企业在不断推出新颖产品和服务的过程中,整个价值主张会随之转变。这其中蕴藏着无穷商机,更是大势所趋。例如,试想:当今的汽车制造商几乎可以确保旗下新车及车型名称出现在“2024年新车”的搜索结果中但当潜在客户向人工智能询问时下应购买哪款新车时,人工智能会给出同样的回答吗?注意力机制令Transformer模型如此强大,它同时也在提醒人类需要关注什么。如果企业不因势利导,人类与数据关系的这种转变可能会导致各种不良后果,诸如内部信息不能无缝共享、无法与客户直接接触,直至失去对自身品牌的掌控。AI伙伴18技术展望2024|AI拐点:重
37、塑人类潜力每家企业都会制定信息化战略,并通过企业使用的软件、对外传播的市场信息和内部信息使用方式等来定义和体现。从广义上讲,过去几十年来,搜索的发展演进为这些战略奠定了坚实基础。但日复一日,时光流转,在有意无意之间,人们开始从搜索转向问答,更多的企业希望与客户进行远程沟通,将生成式AI聊天机器人整合到自身的业务平台中,使其成为客户接触和使用企业服务的新途径。在企业中实施LLM和生成式AI聊天机器人现已衍生出多样化选择,但就技术推广角度来说还远不够简单。要想切实从生成式AI中获益,打造数据和人工智能驱动的未来式企业,从根本上重新审视核心技术战略相当有必要。需重新思考如何收集和构建数据、构筑广阔的
38、数据架构以及如何部署技术工具及其应用的功能范围等,并从一开始就要落实好培训、消除偏见和人工智能监督等新实践。前路的确任重而道远,但坐以待毙只会被时代淘汰。人们总想要一套简单易用的问答系统。还有谁还记得90年代的Ask Jeeves?问答的需求始终存在,但在过去,支持后端却难以响应。今天,生成式AI的出现让数字管家终于成为可能。人类与数据交互乃至生活、工作和思考的方式都在发生变化。企业也需要灵活求变,随着新一代数据驱动型企业强势崛起,无法跟上时代步伐的企业将惨遭淘汰。生成式AI的出现,让数字管家终于成为可能。AI伙伴19技术展望2024|AI拐点:重塑人类潜力技术:解锁数据驱动型企业毋庸置疑,数
39、据是为数字化业务赋能的底层驱动力。各行各业的企业都在努力寻找转型突破口,以更多稳健可靠的新方式为构建基于数据的实践。然而,最基本的诉求仍然未能兑现:找到所需的数据。正因如此,人们开始倾向于采用提问的方式来获取信息。Gartner近期一项调查显示,“47%的数字工作者很难找到高效执行工作所需的信息或数据。”24 员工总是在苦苦搜罗信息:在团队的文件共享中查找文档,在公司知识库中搜索政策或福利信息,搜索CRM以深入洞察客户和销售现状。此外,其他利益相关者也总在设法获取企业信息:客户浏览产品或搜索帮助论坛,股东搜寻ESG文件,合作伙伴努力寻求许可验证。对这些有信息需求的相关人员而言,许多企业尚不具备
40、建立强大搜索的实力。25所以我们不难理解用户行为模式为什么会自然而然地从关键词搜索逐渐转变为自然语言提问。行业的游戏规则正在发生新转变,真正贴近企业的迫切需求。采用拥有丰富企业知识的LLM咨询工具及时为员工答疑解惑,可充分释放数据的潜在价值,最终支持企业实现数据驱动型业务的潜能最大化。当然,这并非转动旋钮切换至新模式那么轻而易举。生成式AI将成为基于企业庞大数据架构构建的交互接口,而企业若想充分受益其中,革新员工访问信息的方式,从根本上要构筑强健的基础。AI伙伴20技术展望2024|AI拐点:重塑人类潜力95%的高管认为 生成式AI将助益企业实现 技术架构现代化。好消息是,采用新技术和新工艺有
41、助于企业夯实数据基础,蓄势待发,积极拥抱数据驱动型业务的未来。事实上,部分先锋企业已抢先破势发力,推动实现数据战略现代化。但残酷的是,许多企业仍在苦苦挣扎,知识管理系统严重落伍。无论从何处入手,LLM咨询工具要求企业着力构筑史上最易于访问、贴合上下文的数据基础。知识图谱在这方面是最重要的一大技术利器。作为图结构数据模型,它通过对更广泛的上下文和含义进行编码,反映不同实体及其相互之间的关联。知识图谱聚合多来源信息,优化个性化支持,还可通过语义搜索增强数据访问的结果。26夯实数据基础思科公司的例子展现知识图谱和语义搜索的硬核潜能。和众多国际大企业一样,思科销售团队充分发掘海量内容的优势力。但由于缺
42、乏元数据,他们很难通过索引驱动型搜索找到相关文档。为此,他们利用Neo4j来创建元数据知识图谱。他们没有使用LLM,而是依托于自然语言处理(NLP)来创建本体和机器标记服务,以此方式分配文档元数据并存储在图形数据库中。如今,销售人员查找信息的用时减少了一半。凭借增强型知识管理功能,思科的销售人员每年节省了超过400万个小时的时间。27在知识图谱之外,其他数据管理策略也同样举足轻重。数据网格和数据编织可有效映射和组织企业在更新整体架构时应考察的信息。向量数据库是通过表征高维数据推断关系和相似性的关键构成之一。此外,建立企业的数据基础是赋能LLM咨询工具接口的大前提,但LLM也是支持创建和维护这一
43、基础的重要工具。例如,创建知识图谱的第一步是确定本体或相关实体及其相互之间的关联。LLM可从原始文本中提取数据,实现这一过程的自动化。28 LLM还可接受自然语言文本提示,基于本体生成关联的模式和数据库结构,以及填充图形数据库。因此,随着复杂的数据基础愈发体现其重要性,它们同时也更易于维护和保持实时更新。29“垃圾进,垃圾出”一直被奉为机器智能的永恒真理。在当前这个越来越依赖于向LLMs提问以获取答案的时代,这个问题显得尤为尖锐。当企业开始将LLM咨询工具引入业务时,他们如何管理数据输入并确保信息质量,将在很大程度上决定这些AI工具应用的成功或失败。AI伙伴21技术展望2024|AI拐点:重塑
44、人类潜力知识图谱、数据网格和数据编织本身可谓企业知识管理系统的一大突破式飞跃。然而,仅停留在这些层面还不够,将知识管理从“图书管理员”模式转变为“顾问”模式是下一步的重大变革。设想一下,员工无需使用搜索栏,而是在企业各大网站和应用程序中运用自然语言提问,获得明确的解答。这意味着建立一个既易于访问又具有上下文感知能力的数据基础架构,使得企业可以根据需求随时随地获取关键业务信息。通过这样的数据基础,企业可以开始构建智能问答系统或类似的人工智能助手,目前有几种不同的方法和技术可供探索。首先,企业可选择从零开始自行训练LLM,但这种方法因需要大量资源投入而鲜少被采用。一些企业巨头堪称AI能量工厂,亚马
45、逊、OpenAI、谷歌、Meta、AI21和Anthropic均位列其中。彭博社也采用了这种方法。它利用自身庞大的金融数据知识库以及公共数据集,专门为金融行业训练了一个包含500亿参数的LLM,即BloombergGPT。30 它即将在彭博终端上面向客户开放可用。31 对于拥有海量资源的大企业来说,从零开始自行训练LLM或许是确保竞争优势的一计良策妙法。第二种方案是“微调”现成的LLM。究其本质,这意味着采用一种较为通用的LLM,基于一组专业文档对其加以深度训练,使之适用于特定目标领域。例如,可利用企业自有数据对OpenAI的GPT-3.5进行微调,将其优化成适用于特定任务的高度定制化或高效的
46、模型。32 亚马逊云科技(Amazon AWS)、Microsoft Azure和谷歌云(Google Cloud)等大型云服务提供商都有提供类似的服务,旨在赋能旗下客户利用自有数据来微调基础模型的私有版。33、34、35 这些模型随即可集成并部署到各种不同的企业应用程序中。虽然这比从零开始训练LLM所需的资源要少得多,但其弊端在于无法确保模型信息实时保持最新。若是没必要反映实时信息(例如设计或营销中的创意输出),此方案最为合宜。还有一种方案略有不同,同样备受关注。一些企业开始针对特殊用例微调小语言模型(SLM,Smaller Language Models)。DeepMind 公司的“Chi
47、nchilla”和斯坦福大学的“Alpaca”等SLM已经开始PK大模型,且只需投入少量计算资源。36 这些SLM的优点体现在效率高、运行成本低、碳足迹小,可加速训练并用在较小的边缘设备上。探索LLM的深度应用,建立新的数据接口AI伙伴22技术展望2024|AI拐点:重塑人类潜力最后,构建基于LLM的智能顾问的一种流行方法是通过“联系实际”来改进预训练的LLM,通常的做法是为它们提供更具针对性、与具体应用场景相关的更多信息。这种方法的核心技术之一就是检索增强生成(RAG,Retrieval-Augmented Generation)。顾名思义,该方案结合信息检索系统和生成式模型,可进行自我训练
48、,也可采用开箱即用的方式,经由API访问。从宏观角度来看,RAG的工作原理如下:首先,某位用户输入个人请求。下一步,该请求被用来搜索和检索相关文档作为向量嵌入无论是Word文档、聊天工具或PDF中的文本等非结构化数据,还是CSV或数据库表等结构化数据。随后,这些文档连同提示一并发送给LLM。当然,LLM最初基于海量数据接受了训练,但仅使用其接收到的特定信息来生成对这位用户的响应。透过情境学习和RAG实现LLM落地所需的时间和计算能力甚少。此外,相较于从零开始训练或微调LLM相比,所需的专业知识也少之又少。事实上,这种方法内置于Microsoft 365 Copilot中,后者是一款针对Micr
49、osoft 365应用程序和服务的AI助手。37 当连接到OpenAI的LLM或任何其他外部LLM时,Salesforce的Einstein GPT也采用这种方法来生成AI聊天机器人响应。38 此方案最适用于要求实时更新信息的用例,但其答案的准确性或许仍有待考量。生成式AI和LLM领域发展日新月异,或许就在您阅读本报告之时,构建生成式AI咨询工具的最佳新实践已横空出世。无论选择何种探索方式,有一点是永恒的真理:数据基础必须足够坚实且与上下文紧密关联,否则LLM咨询工具将永远无法完成使命。技术展望2024|AI拐点:重塑人类潜力AI伙伴23启示:企业知识的未来我们现已探索了人类与信息之间发生的变
50、化,以及企业数据实践如何发展方可与时俱进,当下亟需讨论它将帮助企业做什么。有一点笃定无疑,LLM智能顾问工具将助推新一代数据驱动型业务的崛起。然而,如何打造它却又是另一个重要课题。了解并缓解风险企业在开始探索LLM智能顾问工具打开的新可能时,最为关键的一大要务是需透彻了解相关风险。2023年3月,有律师向纽约法官提交了一份案情摘要。他在其中引用了多项先前的法院判决,表明他的委托人的案件不应被驳回。39 然而,问题来了:这些法院判决或相关引述均无迹可查。这些案例都是ChatGPT凭空编造的虚构故事。律师称自己并不知晓ChatGPT会捏造不实信息,但法官却根本不买账。法官对该律师和其他涉案人员处以
51、罚款,还勒令他们通知那些被认定撰写虚假案件的真法官。40 最令人尴尬的是:这个荒诞的错误还成了纽约时报头版的新闻故事。41AI伙伴24技术展望2024|AI拐点:重塑人类潜力这名律师的惨痛经历暴露出LLM的一个问题,即“幻觉”现象。LLM接受过训练,可以提供具有高度确定性的概率性答案,因而有时这些咨询工具会笃定不疑地传达不实信息。我们在访问和传递信息或与软件交互和集成中,日益变得越来越依赖于使用LLM应用程序,这可能造成严重的后果。无论如何,当你不确定读取的内容是否真实时,就会出现大问题。幻觉大概是LLM最受诟病的风险,但若考虑在企业中使用聊天机器人时,其实还存在其他隐患。如使用公共模型,必须
52、审慎保护专有数据以防泄露。如使用私有模型,则不可将数据共享给不应访问它们的员工。另一方面,计算资源的成本问题不容忽视。但最根本的问题是,鲜少有人拥有相关知识专长来妥善实施这些解决方案。尽管如此,上述挑战不应被视为负面的威慑,而应作为积极的呼吁,鼓励人们设法合理控制,以妥善实施技术。同时,我们也并不是从零开始。LLM治理和AI实施治理都不容小觑,必须两头兼顾,特别是在牵涉数据安全、准确性和道德问题等方面。无论训练还是提示,进入LLM的统统都应是高质量数据,即统一是最新、准确标注且无偏见的数据。训练数据应是零方且由客户主动共享的;或是第一方且由公司直接收集的。42 务必执行安全标准,全面保护个人或
53、专有数据。最后,数据权限必须给到位,确保允许用户全面访问为上下文学习检索的任意数据。在做到准确性之外,生成式AI聊天机器人的输出理应是可解释的,与品牌保持一致。实现这一目标的方法有多种。可以设置边界护栏,确保模型对敏感数据或不良词汇不予以响应,拒绝回答超限问题。此外,响应可以传达不确定性并提供验证来源。如今,生成式AI写作平台Writer就采取了这种做法。它利用知识图谱来突出显示应加以事实核查的AI生成内容,还能基于知识图谱中的相关信息,建议可能更准确地替换内容及其来源。43 最后,生成式AI聊天机器人应接受持续测试和人工监督。企业应投资于符合道德的人工智能,制定要严格遵循的最低标准。定期收集
54、反馈,适时为员工提供培训。鉴于生成式AI聊天机器人的强大功能,自然会衍生出更多风险,但目前这些最佳实践做法有助于缓解相关风险。2023年开发人员对生成式AI的关注热度激增ChatGPT推出后,Stack Overflow上与生成式AI相关的帖子激增了三倍。这有力表明了一个显著且持久的趋势:开发人员正在将生成式AI集成并采用到工作流程中。资料来源:埃森哲商业研究院对Stack Overflow数据的分析(2022年9月-2023年8月)提及生成式AI工具的每月发帖数:2022年9月-2023年8月2022-092022-102022-112022-122023-012023-022023-032
55、023-042023-052023-062023-072023-08(继ChatGPT推出后)3倍03006009001,2001,5003423723975267088461,1771,1081,1991,1971,3841,189AI伙伴24AI伙伴25技术展望2024|AI拐点:重塑人类潜力丰田是又一典范代表。它运用生成式AI来搜索车主手册,针对车主提出的汽车问题提供简洁直接的答案。45 目前,他们正执行一项概念验证,旨在支持驾驶员大声询问“如何禁用VSC?”之类的难题。丰田AI会给出明确指示,并告知驾驶员在手册的哪个页面可找到答案。研究表明,客服人员也有机会受益于生成式AI聊天机器人的
56、助力,诸如传播更多隐性知识等。46 研究结果表明,AI助手为员工赋能增效,平均每小时问题解决量增加14%,有效舒缓了客户情绪,提高员工留存率,也减少了发送给上级的咨询量。企业纷纷设法将生成式AI聊天机器人嵌入自家产品中。例如,社交平台Discord推出了人工智能生成的对话摘要,让用户快速了解他们错过的讨论内容。47 其审核工具AutoMod采用OpenAI LLM技术更准确地识别违反社区规则的内容,并且依据对话的上下文环境进行判断。此外,Snap还创建了一款最大型的消费者聊天机器人My AI,通过Snapchat获取。该机器人现已收到来自超过1.5亿人的超过100亿条消息。48 用户可透过My
57、 AI深入挖掘各自的兴趣爱好,培养朋友间的互动情感。从搜索到问答的转变将把我们带向何方?今时今日,是时候顺应时代潮流,把握好属于LLM智能顾问工具的新机遇。数据和软件与企业发展息息相关,无论是其运营方式还是功能上,企业如今有广阔的机会来实现进阶转型,提高工作成效。首先,把握住企业内部机遇,适机部署生成式AI聊天机器人,让员工和客户以前所未有的焕新方式获取新知,掌握贴合上下文的答案。新型的人机交互方式让他们能更加无缝地连接到所需信息,有利于促进内部知识共享、提升客户服务水平和改进产品功能等,在多个领域带来显著改善。例如,摩根士丹利拥有庞大的内部知识库,其中包括数十万份文档,覆盖从投资策略到市场研
58、究和其他洞察等广泛领域。44 这些文档分散在内部各大网站上,大部分为PDF格式,咨询师需投入大量时间和资源来扫描这些文档,才有可能找到所需的答案。然而如今,有了GPT-4的赋能支持,摩根士丹利创建了一个生成式AI聊天机器人,它擅长利用丰富的内部知识,助力咨询师即时提炼所需的洞察。AI伙伴26技术展望2024|AI拐点:重塑人类潜力上述几则示例简要说明:企业将海量数据与生成式AI的力量合体时,可触动商机无限。我们现已从中预见巨大的价值,诸如以超便捷的方式提供员工和客户所需的答案,节省大量时间和沟通成本,并帮助企业各部门制定更明智的决策等,而未来有待探索的空间依然开阔美好。再谈到企业外部机会:面对
59、想要购买企业产品或服务的客户,生成式AI聊天机器人如何改变企业信息被发现的方式?如果说人类与数据的关系正在发生激变,那么解决这些问题则刻不容缓。人们已启用Microsoft Bing Chat等生成式AI互联网搜索机器人替代传统搜索引擎,或启用Google SGE增强搜索体验,后者接收到人们的搜索需求时可以用人工智能驱动提供概述和回应。49,50 他们渐渐转向通过自然语言提问,获取直接答案。尽管页面上列出了引用来源,也显示了搜索结果,但问题是,真的有人会访问那些链接吗?要是没人访问那些链接,这对网站意味着什么?尤其是对商业网站意味着什么?企业如何确保其客户按需获得他们想要的目标信息,或有正确来
60、源链接的最新信息?这或许听起来仿佛不是机遇,更像是个问题,而这些正是未来数年人人都要好好解决的开放式问题。企业仍有时间赶超时代,重构触及客户的方式。一些企业正考虑使用插件来提供对外部数据的显式访问,优化ChatGPT和Bard等生成式AI聊天机器人的输出。例如,E和CarG等集合汽车库存、定价和评论信息的网站均推出了ChatGPT插件,旨在为潜在汽车买家提供指导与帮助。51 如此一来,客户获取的最新信息可以在他们熟悉的术语和语言环境中获取最新的信息和了解汽车,摆脱搜索字段的限制。如今,部署了Bard插件的公司包括Redfin、Instacart和Spotify。52 虽然目前插件是一种可行的选
61、择方案,但未来几年必然会出现新的趋势和技术应用,企业需随时做好准备,拥抱新生事物。唯有这样,方能屹立于变革潮头。从搜索到问答的转变预示着数据驱动型业务的新时代,它对企业营销和内容方法的影响,以及当前和潜在客户如何找到这些信息,或将决选出逐鹿新时代的赢家和输家。在已讨论过的新兴趋势包含的诸多安全影响中,企业还应思考LLM智能顾问工具如何改变用户数据动态。过去,搜索引擎提供商一直占据着主导地位,掌握关乎企业及客户的数据宝库,让人们对自己的信息会被怎用使用、会被谁访问到等问题者忧心。如今,我们有机会重塑搜索原则之根本,重建企业与客户之间的信任。企业现在要扮演好信息管家的角色,存储、保护、分析自有数据
62、和制度性知识,经由数字咨询工具直接传递给客户。有一项责任关系重大:企业务必要确保自有数据安全无虞,在咨询服务中提供高置信度的响应。其中蕴藏着更大的商机:无需搜索提供商介入协调信息交换,企业可作为信息源直接提供可靠的洞察,赢得客户的信任。安全影响AI伙伴27技术展望2024|AI拐点:重塑人类潜力结论:AI伙伴生成式AI是对传统数据和软件的颠覆。正如几十年前的搜索一样,LLM正在刷新我们与信息的关系,从企业如何接触客户到如何赋能于员工和合作伙伴,一切都在上演着新生变革。领先企业纷纷投入转型大潮,争相重塑新一代数据驱动型业务。不久的将来,这不仅仅只是行业先锋所采用的方式,而将成为数字化商业运作的标
63、准新范式。若您开始从崭新的维度审视信息交互的本质,那您已在探寻新时代脉络的过程中找准了前行的方向。技术展望2024|AI拐点:重塑人类潜力智能体AI互联的生态系统技术展望2024|AI拐点:重塑人类潜力智能体2920012023177020112025189220151961201720261995199620192028202220232030203219971999“自动”国际象棋棋手Mechanical Turk诞生。1美国国家科学院主办了一场基于智能体建模的研讨会。8ChatGPT重磅更新:可同时接收语音和图像输入。14苹果公司发布Siri。9Auto-GPT和BabyAGI推出。15
64、智能体编写的开源代码启用新的代码存储库。四分之三的知识工作者日常都会使用Copilot。第一家真正的无人汽车制造厂开业。半成的住房抵押贷款由智能体批准和服务。有关部门捣毁一个利用智能体收集受保护信息的内幕交易团伙第一台自动电话交换机安装成功。2嘉信智能投资组合(Schwab Intelligent Portfolios)自动咨询服务上线启动。10通用汽车成功地将Unimate机械臂集成到制造过程中。3研究表明,人工与软件智能体联合推出解决方案的速度要快55.6%。11BargainFinder成为首款比价购物智能体。4DeepMind的AlphaStar成为 星际争霸II 大师级玩家。12亚马
65、逊宣布推出首款全自动移动机器人Proteus。13纳斯达克使用基于智能体的模型来模拟股票市场。6一款自动在eBay出价的工具eSnipe正式发布。7微软发布了Clippy。5技术展望2024|AI拐点:重塑人类潜力智能体30人工智能能否完全代替人工,自主地完成一款新产品的上市流程?概览技术展望2024|AI拐点:重塑人类潜力智能体31虽然听起来似乎遥不可及,但未来可能会比您所预想的更早到来。企业已将人工智能嵌入到业务运营中。生成式AI令行业领先的创意工具Adobe得到进一步革新,助推了大众汽车发展产品概念。16,17 西门子和发那科将人工智能嵌入到机器人和工业流程中,重构了制造业的业态面貌。1
66、8,19 过去数年,基础模型的出现极大地扩展了人工智能在诸如市场营销和销售等业务部门的应用,快速创建新内容,加快产品上市。20 当所有这些智能技术触手可及时,企业需要自问:“人工智能可以来为我来发布下一款产品吗?”、“它可以来管理我的仓库吗?”、“它可以来重塑我的企业吗?”否则,局限的思想会给企业带来风险。人工智能正在突破其原有的辅助性角色,开始更多地通过实际行动去影响和改变世界。未来十年,我们将见证整个智能体生态系统的崛起,这个由众多相互连接的智能体组成的大型网络将推动企业以全新方式思考自身的智能和自动化策略。智能体的进化可以拿自动驾驶汽车的演进做 类比。多年来,车辆的操作一直是驾驶员全权掌
67、控(无人工智能)。后来,巡航控制或车道辅助等半自动化系统陆续登场(人工智能辅助)。接下来,先有驾驶员在有限的条件下使用自动驾驶,而后出现了完全不需要驾驶员的全自动驾驶汽车(行动力日益增强的智能体)。循此趋势,可以想象未来自动驾驶汽车将在道路上与其他汽车并驾齐驱(智能体生态系统)。对于汽车来说,这些进步并不是一蹴而就的,而是随着时间推移逐步积累改进的过程。智能体的发展也将遵循同样的轨迹。当下大多数人工智能策略都过于侧重于在任务和功能层面提供辅助。就人工智能的行动方式而言,它更多是作为独立的行为者存在,而非构成一个相互依存部分的生态系统。例如,我们可能会利用人工智能参与设计过程、发现生产缺陷或从消
68、费者反馈中提取洞见,但通常情况下,人工智能主要是提出建议而不是直接采取行动,并且往往被孤立使用,没有贯穿整个运营流程进行整合。这意味着人工智能并未作为一个整体运作的一部分,在不同环节之间实现无缝衔接和协同效应。但如今,情况开始有所改观。人工智能逐渐发展成智能体,自动化系统将主动决策并自行采取行动。智能体不仅会为人类提供建议,还会代表人类采取行动。人工智能依然会生成文本、图像和洞察,而智能体则将自行决定如何处理这些信息。以DoNotPay为例,这家公司致力于帮消费者省钱,其业务涵盖从申诉撤销停车罚单到识别未使用的订阅等。直到最近,DoNotPay发现了上述问题并敦促客户采取行动,但随后该公司将G
69、PT-4和AutoGPT集成到旗下软件中。21 这些新功能的第一位用户是DoNotPay首席执行官。他允许智能体访问他的财务账户,并提示它执行一项既简单又复杂的任务:帮我省钱。该智能体识别出81美元的不必要订阅费用以及37美元的异常的空中Wi-Fi费用。然后,它主动向订阅提供商自动发送取消通知,起草了一封对Wi-Fi收费提出异议的信函,并联系首席执行官进行核查。锦上添花的是,它还起草并发送了多封电子邮件,主动与有关方面协商,将首席执行官的有线电视和互联网费用削减20%。96%的高管认为,在未来三年内,利用智能体生态系统将为其组织带来重大机遇。技术展望2024|AI拐点:重塑人类潜力智能体32尽
70、管智能体的进化刚刚拉开帷幕,不少公司已然需要开始考虑下一步的发展战略。一旦智能体开始自主行动,用不了多久他们就会能开始彼此交流。未来,人工智能战略需全盘统筹整个系统中全体参与者的行动力:经过特定训练的专用人工智能、通用智能体、擅长与人类协作的智能体以及为优化机器而设计的智能体等等。这些智能体将相互取长补短,构成一套能改变企业生产方式和生产内容的生态系统。智能体能全盘掌控整个价值链,而不仅仅是使用人工智能来优化单独的业务流程。如今,人工智能可检测制造缺陷,而智能体则可实现真正的“黑灯工厂”。人工智能可以处理订单,而智能体则还能够推销产品并送货上门。正如流水线让福特重塑了汽车市场一样,智能体生态系
71、统将改变企业打造的产品和产品供应的方式。随着多部门的工作效率显著提高,您的价格是否会为新的目标受众所接受?凭借整个企业步步深入的洞察和想法,您能否打造一款征服全新市场的产品?凭借全面访问企业信息,智能体生态系统有能力开拓新机遇并快速生成解决方案,这一点远非孤立的人工智能乃至人类所能想象。但请注意:在智能体真正能够代表我们行动之前,或是与其他智能体协同合作之前,还有大量准备工作要做。事实上,智能体仍会遇到困难,出现工具滥用、响应不准确之类的问题,而这些错误会迅速累积,导致情况进一步恶化。如不采取适当的制衡措施,智能体可能会对您的业务造成严重破坏。创新型领导者将为智能体的成长提供所需的支持,使其逐
72、步赢得企业的信任,充分发挥潜力。企业将聘请人类员工作为第一批“试飞员”来决定何时何地允许内部智能体“单飞”。换言之,智能体需要人类为之创建支持系统,才能转变为可靠的参与者,而此举成功与否,将决定智能体成为企业的伙伴还是障碍。人类和智能体相互依赖;若想重塑人工智能战略,发掘智能体生态系统的最大潜能,那么重塑员工战略也就势在必行。目前,各行业40%的工作时间都会受到GPT-4等LLM的影响。22 这个数字可能还会增加。我们之前已讨论过在工作任务级别实行人机协同模式,但直到今日,我们才准备好利用人工智能来运营业务。随着智能体升级为我们的同事和代理,我们将与之携手重塑技术和人才的未来。这不止意味着培养
73、新技能,更在于如何确保智能体和我们抱持相同的价值观和目标愿景。智能体将帮助我们建立未来的世界,而我们要做的就是确保它创造的是我们想要的世界。如今,人工智能可检测制造缺陷,而智能体则可实现真正的“黑灯工厂”。技术展望2024|AI拐点:重塑人类潜力智能体33技术:从助手到生态系统参与者企业正在开启下一个十年最重要的转型之旅。人工智能进化过程中的每一次飞跃都会引入不同的技术,而这些技术各自本身蕴藏着巨大的创新潜能。但关键是,领导者们也认识到,这些技术属于一个更庞大的体系:智能体生态系统。作为助手的人工智能正在进化为可代表人类行动的代理。随着这些智能体的出现而带来的商机将依托于三大核心能力:对实时数
74、据和服务的访问能力、通过复杂的思维链进行推理的能力以及制造供智能体本身而非人类使用的工具的能力。在人类的指导和监督下,这一步步进化支撑着智能体生态系统完成现实和数字世界中的任务,为积极参与其中的每家企业创造无穷价值,而那些没有参与的企业则面临着即将被淘汰的命运。就访问实时数据和服务而言,当ChatGPT推出时,许多人误以为它是实时从互联网上查找信息来生成答案的。事实上,GPT-3.5(ChatGPT推出时的底层LLM)在训练阶段已经从极其庞大的知识库中吸取了海量数据,并通过理解这些数据之间的内在联系来提供答案。但我们生活在不断更新的当下,那时的ChatGPT无法获取或提供2021年9月之后产生
75、的新信息。技术展望2024|AI拐点:重塑人类潜力智能体34作,比如穿过房间去倒一杯水,背后实际上包含了一系列复杂的指令与操作步骤。而对于机器而言,要完成类似任务则需要理解一系列具体的概念(如杯子是什么),并能进行空间定位(在哪里找到杯子、如何到达指定位置)、执行物理动作(如何拿起杯子、如何将杯子装满水)以及对环境设施的认知(水槽在哪里)。这些都需要机器能够进行类似于人类的逻辑推理和问题解决。尽管人工智能已经在诸如下象棋或打包等特定任务中展现出执行复杂任务的能力,但这些任务环境通常是相对封闭且具有确定性的。一旦实际情况与预训练指令有偏差,人工智能往往就会面临失败。例如,如果无法在原来以为放杯子
76、的地方找到杯子,我们会灵活调整并寻找其他可能的位置。但狭义的人工智能面临类似情况,通常的编程是让它中止任务或重启任务。即便今天的LLM也会遇到类似的瓶颈。由于没有内在的记忆能力,对它而言,管理复杂序列一直是个难题。它或许不会中断回应,但它的操作可能是笃定自信地给出错误的答案。但人工智能研究已开始突破机器推理的障碍。思维链提示是一种可帮助LLM深度理解复杂任务步骤的方法。25 起初,研究人员认识到,可给出提示将目标任务分解为多个明确步骤,甚至提示(prompting)模型“分步思考”来获得优化结果。进一步研究表明,充分利用少样本技术,为模型提供多个链式推理示例,模型将适应在其他任务中遵循的类似步
77、骤。26 任何工具要成为有意义的智能体,都需要整合两方面的要素,一是根据历史记录中习得的能力,二是获取并整合最新信息的能力。2023年3月,OpenAI发布了ChatGPT支持的第一款插件。这款“插件”支持LLM查找信息、使用数字软件、执行代码和调用API,也支持模型访问网络,生成文本以外的输出。如今的ChatGPT不再仅仅依赖构成模型智能的权重和代币,而是可以搜索Expedia来获取旅行信息,访问Instacart来订购杂货,使用Wolfram(计算智能平台)来执行复杂的数学计算。23 短短数月后,ChatGPT即已能够访问数百款插件。24 当您阅读本文时,这个数字可能更是水涨船高。插件相当
78、于给原本只能基于训练数据运行的基础模型安装了一个接口,使其能够连接并操作现实世界的数字化工具和服务,从而真正成为能够在当前数字世界中自主导航和执行任务的智能体。插件本身就已具备强大的创新潜能,它在新兴智能体生态系统的崛起中还将扮演至关重要的角色。现在,插件支持人工智能访问我们最相关的数字工具;未来,插件还会支持智能体与强大的人工智能模型互动协作,从而开启前所未有的应用场景和功能组合。智能体进化的第二步是具备逻辑推理和思考的能力。对于人类来说,日常生活中看似简单的动技术展望2024|AI拐点:重塑人类潜力智能体35此类提示(prompting)最初可能需要人工输入,但后续研究表明,模型可以通过工
79、程设计实现自我批评和信息归档功能,从而有望自动化此类推理过程。27 AutoGPT和BabyAGI即是两款充分利用LLM,并实现思维链提示自动化的开源应用程序。它们接受广泛查询或指令,接着提示自己思考完成目标的步骤和方法,自行设计一套细化指令,随即运用这套指令完成初始任务。28,29 通过思维链推理和插件的使用,人工智能具备了更严格的逻辑能力,并有望借助网络上丰富的数字工具来处理复杂的工作。可是,如果处理工作所需解决方案或工具还没有,人工智能又该怎么办呢?人类在面临超出现有设备应对范围的挑战时,会设法获取或创建所需的工具。我们会跑到硬件商店去搜寻所需,编写一段代码,或通过其他可以利用的资源来克
80、服挑战。过去,人工智能的功能扩展和能力提升几乎完全依赖于人类设计和开发。然而,随着技术进步,我们现在看到的是智能体自主性发展的第三个维度,即人工智能开发自用工具的能力。谷歌的研究展示了人工智能快速扩展的行动力,更标志着多智能体交互时代的开始,伴随而来的是无限的机会。如今,LLM需要投入大量的计算资源,导致其开发和运行成本甚是高昂。LATM提出了一种专业化策略,使已解决的请求趋于常规,进而可利用轻量级模型来执行。“工具制造者”则负责承担繁重的工作负荷,缩减所需的计算成本。LATM并不是谷歌探索多智能体交互的唯一试水。2023年,谷歌开展了一项实验,将25个智能体放入一个虚拟城镇,每个智能体都配置
81、了个体的观点和背景故事。33 这些智能体被赋予了交互的自由,并将这些交互存储为记忆,以供日后参考。谷歌从中探寻到一系列新兴社交行为。当他们提示一名智能体举办情人节派对时,该智能体邀请其他智能体参加派对,而其他智能体又邀请对方来约会。以英伟达为例,该公司与多所大学的研究人员达成合作,潜心探索开发“具象智能体”的可能性。他们在Minecraft中构建了一个智能体,Voyager。Minecraft是一款背景设定在3D世界中的围绕生存和探索展开的热门游戏。30 在这个3D世界中,玩家需要谋取各方资源来铸造新工具,例如镐或灯笼,以此辅助他们进阶穿越并塑造专属环境。Voyager接收到玩家的探索指令,随
82、即会配备随时间积累扩充的技能库。每当Voyager遇到新障碍时,它会先了解需要哪些工具来攻克障碍,并将此信息存储在库中。当遇到更多的障碍时,它会越来越娴熟地从技能库中汲取知识,实际上这是一种有效的自学行为,让它可以更快地攻克障碍。31 这款游戏设置了技能和工具等级制度,玩家必须循序渐进、从低到高地提升等级。研究人员观察Voyager在技能树上的进阶情况,以透彻了解它的学习能力。工具制造智能体并不局限于虚拟世界,它们在现实世界同样拥有无限潜能。谷歌、斯坦福大学和普林斯顿大学的研究人员正在全力探索人工智能的这种工具制造能力。32 他们合著的论文大语言模型作为工具制造者(LATM)提到,这支研究团队
83、采用了一种新颖的方法来研究人工智能如何制造可重复使用的新工具来攻坚克难。他们开发了一套闭环系统。它由两个不同的人工智能模型构成:工具制造者和工具用户。LATM采用协作方法,而不是依赖单一模型来完成整个任务请求。当模型收到请求时,“工具制造者”会相应编写达成目标的Python函数。但自己并不使用这个功能函数,而是将其交给“工具用户”,一个更轻量级的独立人工智能模型。时间流转,工具用户日渐熟练地使用其不断增长的工具集来响应请求,而工具制造者则从类似的请求中不断学习来优化工具。工具制造智能体并不局限于虚拟世界,它们在现实世界同样拥有无限潜能。技术展望2024|AI拐点:重塑人类潜力智能体36智能体的
84、社会行为有利于增强整个生态系统。再看另一则示例,艾伦人工智能研究所的研究人员设计了一个实验,创建了三个智能体来模拟买方、卖方以及第三方监督员。34 第三方监督员对买卖双方互动过程进行评估,并提供反馈信息,买卖双方则根据这些反馈信息来调整谈判策略。这些来自多维度的观点可应用于以下用途:加强决策的制衡体系、提升生产力以及启发创新。从实时信息的快速捕获与处理,到深度推理、工具创新,乃至多主体间的复杂互动,智能代理领域的重大突破正在以前所未有的速度推进。正因如此,我们格外需要将视线牢牢锁定于整个生态系统的演变进程上。尽管每项单独的技术发展都各有各的价值,但当这些技术交融汇聚时,将在人工智能应用领域掀起
85、一场革命。例如,智能体已学会查找网络信息、查阅科学文献,调用云实验室中的科研设备,实现整个研究过程的自动化管理。35 谷歌的PaLM-E会接受自然语言命令,将其分解为一系列子任务,随即生成并执行命令来控制物理机器人。36 不难想象未来将有这样一个智能体独立负责整个制造工厂的运营管理。MetaGPT将产品经理、架构师、项目经理和工程师的角色融为一体,将任务分配给GPT阵列,实现整个软件开发流程的自动化。通过一行文本,MetaGPT就能生成用户故事、竞争分析、需求、数据结构、API、文档等。37 智能体生态系统的复杂性是显而易见的。毕竟,除了探讨智能体自主运行的三大核心能力之外,实现这样一个系统还
86、需要解决极其复杂的协调难题,即如何有效地整合各种智能代理的功能并确保它们协同工作。此外,企业必须对现有的人力资源进行大规模的转型和重塑,才能使上述一切成为可能。这种深度的技术变革可能会让领导者感到无所适从。好消息是,当下的数字化转型努力将极大地促进企业获得竞争优势。数据现代化和创建API库将成为企业系统集成到人工智能生态系统的两个关键。但切记,这些模型并非完美无缺,它们仍然存在生成错误或不准确响应的固有缺陷。此外,关于这些模型存在的潜在风险和网络安全影响,还有待深入研究。企业如何平衡人与机器的分工是个微妙的过程,首先需优先考虑人的需求和利益,而不仅仅追求技术所能实现的可能性。毋庸置疑,未来十年
87、,我们将目睹智能体生态系统的崛起。那些勇于接纳并积极融入这一革新体系的企业,无疑将在这场竞赛中取得显著优势,从而超越竞争对手。技术展望2024|AI拐点:重塑人类潜力智能体37启示:人力与科技之间的深度融合当智能体生态系统开始发挥作用时,会发生什么?无论是作为我们的助手还是代理,它都将显著提高工作效率,激发创新活力,全面重塑劳动力。作为助手或副驾搭档的智能体可显著提高个体员工的工作产出。对于始终依赖于人类的企业流程,智能体可以成为协作者。需要诊断医疗状况?智能体有能力提供帮助,但最终的诊断结果仍需要由医生与患者沟通交流。需要激励团队?智能体有能力撰写演讲稿,但真正激发团队热情并传达信息的任务仍
88、然要由人类来完成。作为副驾搭档,智能体和人类在各自擅长的领域发挥优势,形成互补关系。在其他场景中,我们将越来越多地依赖智能代理来代表我们执行任务。作为我们的“代理人”,它们有能力处理目前由人类执行的工作,并且展现出一大优势:单个智能体就足以掌握整个公司的全部知识和信息,它的知识储备远胜过最资深的人类员工,并且能够在任何地方、同时处理多种基于这些知识的任务。若是欠缺某方面的信息,它能够自我创造或获取信息。若是缺少合适的工具,它们则能够自行构建。人类的知识和行动力都有天然的局限性,而在智能体世界里,许多这样的束缚却可以被打破。技术展望2024|AI拐点:重塑人类潜力智能体38那么,当许多智能体一起
89、工作时会发生什么呢?设想一下,您需要提高一款滞销产品的销量。您的产品管理智能体与财务智能体会协作设定增长目标,业务开发智能体识别新的潜在客户,营销智能体制定相应的营销策略和广告活动。由此构成的智能体网络会持续执行任务和迭代优化,当未达成既定目标时,它们能够迅速做出反应,调整方向;在实现目标时会加大投入以进一步巩固成果。智能体生态系统是高产创新的不竭源泉。那些敢于将智能代理推至核心决策位置的企业,必将会开发出新的产品、服务和能力。我们为智能体赋予的价值链权力越高,它们创造的价值就越大。当我们为智能体提供信息和工具时,它们所展现的能力将在许多方面超越我们的想象,使得每一家企业乃至每一个个体都能实现
90、前所未有的创造和行动。如此一来,未来的数字市场将会呈现翻天覆地的变化。随着智能代理在商业领域中承担更多自主行动的角色,企业需要重新思考如何整合人力和技术手段来支持这些智能体的运作。从技术层面来看,一大主要考量因素是这些实体如何识别自己的身份。在当前的企业网络体系内,机器身份标识已占据总体比例的43%。38 然而,这些机器并非独立运作,而是遵循现有的安全框架与系统进行连接和交互。当智能体的行为越来越接近人类,就需要充分利用Web3等技术、去中心化身份或其他新兴解决方案,确保这些智能体正确识别和验证自己的身份。虽说技术框架是一大核心考量,但更需深度关注智能体对人类员工的影响:他们的新责任、角色和职
91、能。需要强调的是,人类不会被取代。智能体接手部分工作后,员工将获得更多余力专注于更高价值任务。人类将继续扮演制定规则并监督执行的角色,确保智能代理按照既定策略和伦理道德规范进行工作。因此,现在是时候重新规划人才战略,确保企业员工为这一新现实做好准备。在当前的企业网络体系内,机器身份标识已占据总体比例的43%。技术展望2024|AI拐点:重塑人类潜力智能体39重新思考人才智能体将为企业开辟怎样的美好新世界?答案将来自您的员工,而不是智能体。在智能体生态系统时代,企业中最具价值的员工将会是那些最擅长为智能体制定行动准则的人。当智能体开始自主行动时,人类必须担当起制定和执行规则的责任,确保智能体的行
92、为有利于企业发展和员工绩效的提升。当智能体赋能员工时,两者都必须牢记企业使命。无论员工如何选择和决策,无论好坏,其影响必然被放大。企业对自动化智能体的信任度决定了其价值创造的能力,企业中的人类员工有责任建立这种信任。智能体生态系统会在无人类介入的情况下行事,但它们的行动并非百分百正确合理。启用智能体之前,人类需要嵌入规则、知识和推理技能,随后执行严格测试,确保它能够胜任并作出合理决策。在智能体生态系统时代,企业中最具价值的员工将会是那些最擅长为智能体 制定行动准则的人。智能体生态系统持续进化演变,为了建立起对半自动化系统的信任,员工肩负着两大主要责任:构建智能体支持系统和完善机器推理。领先企业
93、的员工已开始对智能体的支持系统进行定制化配置和优化,引导自动化人工智能正确行动。现有的LLM已接受了海量信息的训练,这使得ChatGPT之类的工具能够以适中的准确度回答诸多问题。但若要让智能体能控制企业供应链,那么它首先需要学习供应链方面的专业知识,无关信息可能会误导它的行为。当员工将企业知识、专有数据和外部工具嵌入到自动化人工智能中时,相应的支持系统可引导人工智能优先去处理那些信息。投资研究公司晨星正是利用此类支持系统,成功地引导内嵌GPT-3.5的聊天机器人“Mo”专注于相关专有信息。39 通过对超过10,000份专有研究报告进行提示调优,Mo能够作为顾问为Morningstar的财务顾问
94、和客户提供服务。而这一切得以实现的原因在于Morningstar的人力团队在背后做了充分准备。具体来说,晨星的相关团队制定了一系列规则,规定Mo能回答和不能回答的问题,晨星的律师负责确保Mo的所作所为不逾越道德或监管界限。40 晨星主动部署人员为Mo设限,毕竟,当涉及提供财务建议时,被动试错是不可行的。技术展望2024|AI拐点:重塑人类潜力智能体40在智能代理时代,企业内部的知识和技能若要对智能体发挥价值,就不能仅仅停留在员工的头脑中。现在,企业的关键人才必须具备将自身知识和技能提炼、转化并传授给数字化智能代理的能力。继智能体学会如何获取正确信息之后,人类还要教会它们如何基于这些信息进行推理
95、和思考。人类将通过测试和纠正智能代理的推理过程来确保其准确性。如今,一些企业现已投入这类实践。例如,摩根士丹利基于100,000份内部文档对GPT-4进行了微调,创建了帮助财务顾问答疑的智能体。41 该公司员工定期向智能体抛出一系列“关键考题”,以确保其“思维”保持敏锐。每当系统回答错误时,知识经理就会复查训练文档,找出有待修复的内容。但单凭逻辑思维肯定是不够的,智能体还需要认识到自身的边界限制。智能体何时才算掌握有足够的信息,可独立行动?何时应在行动前先寻求支持?具体情况因智能体、企业和行业而异。但总体而言,人类将决定自动化系统的独立程度。人类有必要指导智能体如何确定自己掌握了哪些信息,但更
96、重要的是确定自己的知识盲区,这样智能体就能有针对性地查漏补缺,不断完善和进化。自我审查的智能体短时间内还不会出现在工作场所,但孕育新一代能够进行反思和自省的智能体的种子已经播下。基于LLM的规划工具现已能够判断某项行动的确定性,并在信心不足时寻求人力支持。42 当风险不高时,较低的置信度大概足以通关,比如创建营销材料的智能体不太可能涉及生死攸关的决定。但当风险确实很高时,唯一的选择就是要么果断采取行动,要么完全不作为。智能体汲取的人类知识和推理能力将决定其在整个生态系统中的竞争优势。换言之,智能体的价值实现能力取决于指导它们的员工。技术展望2024|AI拐点:重塑人类潜力智能体41在智能体生态
97、系统时代,什么样的人才会赋予企业竞争优势?答案是对企业的价值观和使命有透彻深入的了解,并能将这种愿景传递给智能体生态系统的员工。倘若员工、智能体和企业的目标不一致,各方参与角色努力的方向会南辕北辙,出现分歧。如此,轻则导致增长停滞,重则导致组织破坏。若是各方参与角色的目标一致,就会同向而行,加速企业实现远大目标。随着行动、工作效率和价值的潜在加速,企业需要决定如何统筹利用这一切。您会打造新产品,进军新市场吗?您会给员工加薪,或实施每周四天工作制?事实上,上述这些选择都大有裨益。再以福特引入流水线为例。自引入流水线生产后,福特能够为员工加薪并缩短工作时间,这极大地吸引了工人,也为他们提供了足够的
98、时间和薪水来购买自己亲手制造的汽车,驱车出游。放眼新时代,我们或已迎来人们期盼已久的工作范式转变,更可喜的是,人人皆可从中受益。智能体的价值实现能力 取决于指导它们的员工。技术展望2024|AI拐点:重塑人类潜力智能体42企业当下的可行之举您现在可以采取哪些措施,让员工和智能体共同取得成功?企业需要给智能体提供了解自身公司文化、业务知识的机会,并同时让公司也充分了解和适应智能体的运作方式。首先,企业可以从智能体的前代、LLM及其支持系统之间的关联性入手。目前市场上已存在众多成熟的生成式AI模型和一些数字副驾工具,它们可以与企业现有的关键人力资源、数据、工具和机器人进行集成。依据企业信息对LLM
99、进行微调,可让基础模型更快地理解和掌握该领域的专业内容。越早提供辅助智能体行动的基础设施和信息,未来的智能体即可越早发挥潜能,充当企业在内外部环境中的“人类代理”。现阶段,建议您重新审度数据管理实践,例如数据库向量化、提供新的API接口以访问数据,以及扩展工具来对接企业内部系统等。企业应引导员工适应未来与数字同事(即智能体)协同工作的场景。为了建立对未来的智能体的信任基础,公司可以教育员工学会利用现有的智能化技术进行推理和决策;激励员工迎接时代挑战,发现并打破现有自动化系统的限制;帮助员工制定明确规则,确定何时可以信任自主系统,何时不可信任。换言之,企业需提前做好准备,通过培训和提升员工技能,
100、确保他们在接管或与智能代理协作时能够从容应对,并且清楚地知道应该在多大程度上掌控这些智能工具。最后,需要确保企业的核心价值与使命清晰无误,智能体采取的每项行动都要与其相呼应。因此,应尽早在企业上下各层运营中贯彻价值观。当智能体代理开始加速并放大人类员工的工作效能时,它们会一直运转直到实现既定目标。如今的当务之急是明确设定相关目标。依据企业信息对LLM进行微调,可让基础模型更快地理解和掌握 该领域的专业内容。从安全的角度来看,智能体生态系统需要确保流程和决策的透明度。例如,就像软件物料清单(软件应用程序所有代码组件和依赖项的清晰列表)的日益普及一样,它清晰地列出了构成一个软件应用的所有代码组件及
101、其依赖关系,以便让企业和机构能够深入了解其内部结构。同样,构建智能体物料清单有助于解释和跟踪智能体的决策过程。智能体遵循什么逻辑做出决策?是哪个智能体打的电话?写了什么代码?使用了哪些数据以及与谁共享这些数据?我们越能追溯和理解智能体决策过程,就越能信任代智能体代表我们行动。当智能体犯错或过度共享时,这些漏洞只有在智能体决策过程可被破译的情况下才能识别出来。这个道理并不像听起来那么深奥:随着人类不断完善智能体思维过程和记忆,智能体逐渐学会自我修复,它能依靠过去智能体的漏洞来进阶,向更准确、自主和安全的方向进化。安全影响技术展望2024|AI拐点:重塑人类潜力智能体43结论:智能体智能体生态系统
102、有望将企业工作效率和创新力提升到前所未有的新高度。但它们的价值实现能力取决于指导它们的人类;人类的知识和推理逻辑能力决定了智能体网络的优势所在。现在,人工智能是一种工具。未来,智能体将会帮助运营我们的企业。确保它们不会运行失控,是人类责无旁贷的工作。人工智能正在飞速进化,启用智能体正当其时。技术展望2024|AI拐点:重塑人类潜力44空间计算发掘虚拟实感的价值技术展望2024|AI拐点:重塑人类潜力空间计算451957莫顿海利希(Morton Heilig)发明了Sensorama,一种具有多感官体验的立体电影系统。119731975199220062011200320081999第一个触觉电
103、话获得专利。2Xerox PARC发布图形用户界面(GUI)。3路易斯罗森博格(Louis Rosenberg)开发了第一款交互式AR系统。4Roblox 游戏正式推出。7 微软Kinect(用于Xbox手势和语音控制)成为最热卖的消费设备。9西蒙格林沃尔德(Simon Greenwold)创造了“空间计算”的概念。6 宝马投放了首支AR广告。8第一款拍照手机发布。52012201320162017202020192018Oculus VR设备品牌创立。10谷歌眼镜开始发售。11宝可梦GO 第一季度下载量达2.28亿次。12苹果公司宣布推出用于开发AR应用程序的ARKit。13Nvidia发布
104、Omniverse平台。16Snapchat推出Landmarkers-AR叠加技术。15Not Impossible Labs打造了一款触觉套装,让人们通过皮肤感受音乐。14 202320262027202820312030苹果公司发布Apple Vision Pro空间计算机。18某职业体育联盟推出沉浸式3D重播和精彩片段平台。大城市为公共空间增添空间娱乐、导航和信息。某公立学校系统宣布提供全沉浸式空间环境教学的物理课程。某个专门提供空间沉浸式内容的新闻网站一跃成为增长最快的新媒体公司。游戏市场大多被VR和空间沉浸式游戏所占据。2021沉浸式协作平台Microsoft Mesh发布。17
105、技术展望2024|AI拐点:重塑人类潜力空间计算46第一代Macintosh于1984年推出时备受质疑。鼠标被贴上“无用”和“笨拙”的标签。19 2001年,当苹果公司推出iPod时,也受到了诸多批评,有人认为它在竞争激烈的市场中定价过高。同样,iPad首次面世时也被嘲讽为放大版的iPod touch,有人认为它是一种荒谬的设计。一时间“没有鼠标,谁还能认真工作呢?”的评论引发热议。20,21概览技术展望2024|AI拐点:重塑人类潜力空间计算47然而,苹果公司笑到了最后。如今,Macintosh被视为革命性产品,其影响力可比肩iPod、iPhone 和iPad。它们以独特而极具变革性的方式塑
106、造了计算世界。尽管如此,当苹果公司在2023年推出混合现实眼镜Vision Pro时,似乎评论家们并未从历史中吸取教训,再次对这款新产品持怀疑态度。Apple Vision Pro标志着苹果公司进入空间计算这一已在不断壮大的市场领域,这一举动也向众企业领导者发出了明确信号:新技术媒介时代已然到来。然而当时,鲜少有人认识到这个时刻的革命性意义。空间计算将改变技术创新的轨迹以及人类的工作和生活方式。台式机和移动设备通过屏幕作为通向数字世界的入口,而空间计算将结合生动鲜活的现实,实现数实融合。为这种媒介开发的应用程序可以让人们在数字世界体验到真实的物理空间感,或者在现实环境之上叠加数字化内容。这是一
107、个重大时刻。我们所使用的计算媒介塑造和定义了不同的技术时代。台式机将消费者带入信息世界。随后,移动设备摆脱了数字世界的束空间计算 将改变技术创新的轨迹 以及人类的工作和 生活方式。缚,让人们可以随身携带电脑。在过去几十年的爆炸性技术创新中,台式机和移动设备是这一切的基础。事实上,计算媒介不会频繁改变,可一旦改变则意义非凡。尽管空间计算技术正引领我们进入一个全新的技术时代,但为何我们感受不到呢?为何我们的周围充斥着“元宇宙泡沫”的言论?元宇宙是空间计算最为人熟知的应用之一。但看看数字房地产的价格,它在2021年和2022年蓬勃发展后,在2023年却下跌80至90%。22 虽然早期有些努力收获了成
108、功果实,但为何还有那么多的努力付诸东流了呢?这就是我们要记住Macintosh的缘由所在。新媒介并不经常出现,即使出现,人们接受起来也有一个缓慢适应的过程,但早期参与新媒介的回报几乎是无法估量的。有些企业选择观望,认为技术还不够成熟,但其他企业正快马加鞭地建立相关技术能力。Meta公司一直在快速开发Reality Labs的VR和AR产品,并推出了Codex Avatars,后者运用人工智能和智能手机摄像头来创建逼真的虚拟化身。23,24 Epic公司的RealityScan移动应用让人们只需用手机拍摄现实世界中的3D物体即可化为虚拟资产。25 由此可见,生成式AI等先进技术的发展继续发力打造
109、空间环境和体验,进一步凸显其快速、高效和经济性。这些技术已在工业应用中悄然得到验证。例如制造业中的数字孪生、VR/AR在培训和远程操作中的应用,以及协同设计环境的建立均已对行业产生深刻且有价值的影响。总的来说,有前瞻眼光的先锋企业都认识到一个硬核事实:期望立即大规模采用新媒介是不切实际的,但如若错失良机,将需要未来五年或十年的时间努力追赶。虽然支持元宇宙等新兴概念的技术正在迅速改进和提升,但这只是面临的第一道难关。技术展望2024|AI拐点:重塑人类潜力空间计算48企业如若认识不到新计算媒介的重要性,将很难打造出适宜的应用程序。回想一下从台式机到移动设备的转变。谷歌地图于2005年作为电脑桌面
110、应用程序首次亮相,它改变了人们导航世界的方式。26 但人们仍然将路线图打印出来以便随身携带。之后,智能手机出现了。谷歌抓住这一重要时机,推出了移动版谷歌地图,并利用实时用户数据迅速提高其准确性。现在,只要您随身携带一部手机,无论身在何处,皆可顺利抵达目的地。如今,超过十亿人使用移动版谷歌地图。之所以取得如此大的成功,是因为谷歌不单将谷歌地图投放到手机上,更适机改变了产品的性质,充分体现新媒介的优势。这正是企业需要利用空间计算的方式。现有的应用程序概念不再适用。如果企业希望构建能够真正超越过去、丰富用户体验的产品,那么其设计必须与新媒介相匹配。技术展望2024|AI拐点:重塑人类潜力空间计算49
111、这听起来很简单,其实不然。空间计算虽说有数实融合的潜力,但在很大程度上仍属于未知领域。想想您的第一个网站或移动应用程序。当时,您的企业是否立即完成了开发?是否还需要时间试错?和过去一样,企业需要时间来构建必备的技能、基础设施和经验,以更好地为客户提供新体验。等待观望的空间计算技术应用者可能会落后于那些敢于先行尝试、不断探索和适应新领域的企业,从而在市场竞争中失去优势地位。空间计算正迅速发展成为企业组织结构的一大关键构成。早期采用者已想方设法解锁它的独特优势,而那些追随者则迅速汲取经验,从中受益。工业环境中成功的空间计算部署表明,它能够并行利用多重感官和通信途径,更好地传达海量复杂信息。其他实验
112、发现,当我们将应用程序视为“空间”时,可依据个体的环境和手势塑造体验,或给予它们自我指导的自由。相较之下,移动设备和台式机用户只能在既定设计的位置点击或滑动。空间计算能够增强物理环境,减少我们对笨重办公设备的依赖或频繁更新实体空间的需求。新型计算媒介的出现屈指可数,预示着时代转折点的到来。空间计算或将如同台式机和移动设备般颠覆传统,开创技术创新的新纪元。然而,企业要想把握这一机遇并从中脱颖而出,必须从现在起转变观念,积极面对现实,摆脱因循守旧的心态,充分认识到当前这一历史时刻的意义。如今,相关工具和技术日益成熟完善,如何有效运用这些利器,已成为当务之急。92%的高管认同其所在企业应规划如何利用
113、空间计算打造竞争优势。技术展望2024|AI拐点:重塑人类潜力空间计算50技术:当今的空间技术发展趋势毫无疑问,深入研究空间计算领域对于企业来说是一项艰巨的任务。众所周知,开发3D资产难度很高。有关互操作性和设计最佳实践的问题仍然悬而未决。即使企业投资构建打造一款空间应用程序,该应用最重要的特性之一是要营造出生动、共享的感觉。正如走进一间空荡荡的办公室有些怪异一样,荒无人烟的元宇宙会令人感到空虚,很少有用户愿意流连其中。尽管面临这些困难和外界认为时机尚早的批评声,但空间计算仍在继续增长。现在就是开始行动的正确时机。过去的市场,身处其中的企业感觉即使落后也不影响生存,如今形势发生了激变,企业亟需
114、迅速迎头赶上,否则命运堪忧。我们正处于时代的转折点,创建和采用成本有所降低,构建空间应用程序、打造逼真体验以及最终发挥潜能等重要领域都迎来了跨越式突破。兑现这些技术的价值亟需必备的新技能、投资和制度性知识,它们都是成功的关键。技术展望2024|AI拐点:重塑人类潜力空间计算51首先,新的标准、工具和技术使打造空间应用程序和体验变得更加简捷、经济。这一点的重要性必须充分认识。想想您访问过的网站或最喜欢的手机应用程序。即使它们的用途各异,体验也迥然不同,但都有某种不可否认的熟悉感。原因何在?因为他们都使用相同的构建基础。这种一致性正是透过HTML和TCP/IP协议等语言实现的。这些语言为网站赋予了
115、通用的外观和风格,以及访问网站的统一方式。对于移动应用程序,应用程序商店提供了设计指南,确保应用程序在设计上遵循统一的原则。这种部署增加了用户体验的一致性,也让企业设计应用时有了一套通用的设计参考框架,从而简化了设计过程。它同时也优化了生态系统,让参与者知晓应支持哪些类型的应用程序或网站,以及如何与之协同工作。长久以来,空间计算从未有过这样的构建基础。尝试构建生动逼真的世界的主要障碍就是缺乏一致性。相比网页设计师,数字空间的建造者需要考虑的因素还要多达数十个,例如纹理、造型、照明和物理特性等,都是决定一个空间外观与风格的关键要素。而由于进入空间计算的3D建模来自不同领域(从游戏设计到电影动画,
116、再到建筑绘图或CAD建模等工业应用),这就导致了各式各样的语言、文件类型、供应商和设计方法。生态系统呈现出碎片化特征。USD(Enter Universal Scene Description,输入通用场景描述)也许是最能描述3D空间的一种文件格式。皮克斯开发出的USD框架可以支持创作者规划场景的各个方面,包括特定的3D资产(如道具和背景)、灯光、角色等。USD的设计初衷是将这些资产整合到同一场景中,每项资产可使用不同的软件,由此实现协同式内容构建和非破坏性编辑。27 虽然USD听起来好像主要用于娱乐,但它正迅速上升成为最具影响力的空间应用核心,在工业数字孪生中尤为如此。英伟达目前在其Omni
117、verse平台中使用USD来设计数字孪生,并将USD应用到Isaac Sim中,一款在物理精确的数字环境中开发和测试机器人技术。28 重要的是,推动空间革命的企业也正在采用它。苹果公司将其纳入VisionOS SDK。2023年皮克斯、英伟达、苹果公司、Autodesk和Adobe联合创立了OpenUSD联盟,旨在打造标准化3D生态系统,助力空间计算领域蓬勃发展。29,30 一些企业致力于统一空间世界的观感,而另一些企业则专注于实现体验方式的标准化。OpenXR作为一种开放式API标准,现已被众多主流设备制造商采用。31 通过推行该标准,各种应用程序现可使用单一API(而不必为不同设备分别测试
118、和设计API),确保大多数设备在头手位置、控制、视觉显示等方面的一致性。首先,新的标准、工具和技术 使打造空间应用程序和体验变得更加简捷、经济。理解这一点的重要性至关重要。构建空间应用程序技术展望2024|AI拐点:重塑人类潜力空间计算52最为重要的是,企业需要认识到,他们不是各自孤立地在运行空间。正如互联网上没有单独存在的网页或应用程序一样,新一代网络必定增强这些平行体验之间的紧密联系。为了支持这类空间,数字身份和Web3对这些空间非常重要,无论是将一条数字裤子或支付信息从一个空间迁移到另一个空间,还是识别这些空间内运作的实体。目前,这些技术似乎与开发成功空间并无必然联系,但它们很快即能彰显
119、空间之于消费者的长期可行性及实用价值。部分企业已提前开始布局。Web3开放元宇宙联盟(OMA3)正在制定跨界迁移数据的统一标准。现在,要想在不同元宇宙之中游走变换,需退出一个应用程序,再转至下一个应用程序,这就如同每次访问新网站时都要退出并重启浏览器那般繁琐。2023年,OMA3启动了“互联元宇宙门户系统”(Inter-World Portaling System)计划,旨在构建一种协议,允许开发者让用户在不打破沉浸感的情况下从一个空间无缝切换到另一个空间,好比无论你访问什么网站,地址栏始终保持在页面顶端一样。32 互操作性固然十分重要,但若是开发3D资产的成本异常高昂(长期以来一直如此),即
120、使实现了互操作性也无济于事。据2020年的一项估算,每种资产的3D模型平均成本为40美元到数千美元不等。而构建3D场景需投入大量资产。33 然而,这方面的成本压力已初现下滑势头。生成式AI大大加快了3D数字内容的创作速度。以英伟达的生成式神经网络Neuralangelo为例,它将2D视频片段快速转化为3D数字对象或结构。34 这些资产可导入VR或AR空间、数字孪生或视频游戏。无独有偶,英特尔的LDM3D人工智能模型可基于简单文字提示生成360度3D图像。35 此外,还有一些企业正在设法免除创建3D模型的初始需要。高通的Snapdragon Spaces着重呈现逼真视效,主打数字内容与物理环境的
121、无缝融合。AR SDK采用语义场景理解、手部跟踪、物体检测等技术,赋能开发者快速构建融合数字与物理世界的新应用程序。36 谷歌的TryOnDiffusion则采用生成式AI,让网购者真切见识到衣物上身后的悬垂或褶皱效果。37 自此,经济成本开始缩减,时间投入亦是如此。如今借助市场上的一些工具,人人皆可轻松构建空间环境。由谷歌地图平台和ARCore(谷歌AR软件开发工具包)赋能的谷歌Geospatial Creator,支持用户在数分钟内创建沉浸式体验。您可以创建3D数字内容,将其分层放置于现实世界中的不同点位上,让它与Unity和Adobe Aero等设计引擎自由集成。38 最令人惊喜的是,使
122、用这款工具进行创作几乎无需任何编程技能。然而创建空间并不是唯一的难点,还需要让这个世界饱满且生动。技术展望2024|AI拐点:重塑人类潜力空间计算53填充空间 物理学家恩里科费米(Enrico Fermi)在思考宇宙中的生命时曾说过一句名言:“人都在哪儿啊?”数学研究证明,我们的宇宙应该充盈着生命力。然而,仰望星空,宇宙显得如此荒芜寂静。现如今,人们在访问元宇宙空间时也常有同感。精心打造但空空如也的空间只会让人无心流连。要创建成功的空间,企业要让空间看起来生动逼真,更要赋予它真切鲜活的内容。填充空间的一种直接做法是引入其他用户。人们对元宇宙的共同愿景是,实现人与人之间的无间协作或沟通。但是,鉴
123、于参与元宇宙体验的人数估企业不仅仅要让空间 看起来生动逼真,更要赋予 它真实鲜活的内容。计将高达4亿,这类空间很快将拥挤不堪。在真实世界中,大家即使是去逛同一个品牌,但进的可能是它的不同门店;但全球所有人一时间访问同一家虚拟商店则是另一种完全不同的情况了。这就是Meta开发者构建3D空间的培训和指南中包括空间关系学主题的原因所在。39 空间关系学,一门研究人类如何使用空间的学科,论及人口密度或物理距离对人类行为、交流和人际关系的影响。Meta认识到,对空间感知的理解是实现这些体验的关键。用户在拥挤空间中的体验,很可能是企业判断何时需要开设一家新的数字商店或空间来缓解拥挤情况的重要因素。创造AI
124、角色是又一计良策。AI角色可以填充空间应用程序,成就量身定制的互动体验。其实,这并非一个新概念,视频游戏中的非玩家角色(NPC)几乎与游戏问世的时间一样长。但从历史上看,它们也存在一系列以往所没有的问题,比如那种空洞、单调的画风。软件公司Inworld AI发现,52%的玩家不喜欢重复性的NPC对话。40 但是,打造高质量的NPC通常需要投入更多时间和资金,且回报不高。Inworld AI提出了一个新的方向。该公司创造了充满灵性的AI角色。它们可以进行口头和非言语方式交流,41 且具有情境感知能力,不会制造与设定世界不符的幻觉,也不会提及超出其环境范围之外的内容,从而有效降低了传播不实信息的风
125、险。42 此外,这些角色富有人际真实感,为未来空间应用程序的建设打好了前站。技术展望2024|AI拐点:重塑人类潜力空间计算54最后,使空间计算有别于数字计算的一项新兴能力是调动人类感官。在最新技术的加持下,工程师设计出触觉、嗅觉和听觉等丰富多元的感官体验。在以往的VR尝试中,添加触觉或触摸功能后或显现迟钝笨拙感,或效果不佳。但在不久前,芝加哥大学的研究人员提出,可选用电极优化触觉模拟。43 他们设计了一套电极系统,在人的手指上设置11个可控触觉区,能够“感触”到数字内容。设想一下,未来的冥想空间应用程序将您带到一片虚拟海滩,切实“感受”到从指尖流走的沙粒感。气味也能够唤起记忆或触发至关重要的
126、“战斗或逃跑”反应,让数字空间的观感贴近真实世界。Scentient正在尝试将嗅觉引入元宇宙。该公司认为,气味会成为力克“恐怖谷”效应的关键。“恐怖谷”是指当某个场景看起来几乎真实可信但又不够完美导,从而致用户反感。Scentient的领导者认为,气味可令数字空间显得更加真实立体。他们一直在尝试将这项技术用于培训消防员和急救人员,因为气味(如天然气的存在)对于评估紧急情况至关重要。44 乍听之下,气味的想法仿佛只是个噱头,但它其实意义重大,且是成功构建空间的一大关键。当然,声音或空间音频对于构建逼真的数字场景也不可或缺。纽约时报最近运用了网络空间音频,让众读者醉心于巴黎圣母院大教堂的声效氛围中
127、。在移动端或台式机上,用户“漫步”于大教堂,基于自己在空间中“站立”的位置聆听唱诗班的美妙合声。45,46 最后,沉浸式空间应用程序需要灵活响应我们的自然移动。苹果的Vision Pro会追踪眼球运动,优化呈现低延迟内容。47 Meta的Direct Touch功能探索了如何在VR中跟踪手部动作,取代手持式控制器,实现更流畅自然的运动体验。48 当今,空间计算技术格局飞速发展,潜力巨大。设计基础和标准正在缜密规划和部署之中,新式工具层出不穷。企业要将这些技术混搭应用,找到适合自己的王道,紧随空间应用程序的发展趋势。具备构建空间应用程序的能力后,下一个挑战就是构建的内容。地点感技术展望2024|
128、AI拐点:重塑人类潜力空间计算55启示:空间计算的王牌应用空间计算并不会取代台式机或移动端计算,但会成为企业IT战略计算架构的一大重要构成。正如人们不再使用移动设备写文章、平板电脑将零售员工从固定式POS系统中解放出来一样,空间技术也会有自己的王牌用例,并让我们惊叹:在它没有出现时,我们是怎么过的。实际上,这类应用的实力已初见端倪。回顾一下数字孪生的发展历程,这一点就更不言而喻了。较之走马观花地观看视频,亲身体验式培训更具成效。虽然此类培训大多仍处于独立试点阶段,但深入思考空间计算的独特优势有助于塑造和指导企业战略方向。空间应用市场仍在发展之中,但越来越明显的是,空间应用程序将在三大领域蓬勃发
129、展:传递大量复杂信息;让用户自主体验;增强物理空间(听上去也许有悖常理)。在传递复杂信息方面,空间媒介相对于其他媒介的优势或许最为明显。用户在空间内可以自然穿行,因此能够以更加灵活的沉浸方式传递信息。目前,市面上已出现相关的实际应用。早期出现的空间应用程序包括工业数字孪生、虚拟培训场景或实时远程协助。这些都是需要分享大量信息的应用场景,在这些情况下,传统的信息传递方式往往会导致信息过载,进而造成员工困惑或训练不足等问题。技术展望2024|AI拐点:重塑人类潜力空间计算56例如,外科培训就是一项高信息量的任务。加州大学洛杉矶分校的研究发现,与按照标准指南学习新手术流程相比,医科学生在虚拟现实中学
130、习时,其手术技能考核成绩要高出两倍半。49 而重点是,提供更多空间信息,培训效果更佳。触觉反馈(触摸的感觉)帮助外科学员掌皮质骨钻孔操作时,相较于没有触觉反馈的对照组,他们达到熟练程度的可能性大约高出七倍。50 展望未来,这种在逼真环境中通过不同感官传递信息的能力会重塑诸多任务。和虚拟培训一样,远程手术的外科医生需要一边处理大量信息,一边操作高精密手术。但是,通过空间环境进行远程手术能够更清晰地呈现信息,必要时可在逼真环境中传达手术部位的实况细节,以保障手术成功。这类手术如今已有先例,据报道,中国外科医生通过在远程手术室操作手术机器人,成功为远在4600公里之外的患者“隔空”切除了胆囊。51
131、机场也是一个错综复杂、信息密集的运作环境。温哥华机场正在采用一款空间应用程序,旨在优化运行效率。该互动式应用程序融合了实时和历史航班数据、乘客人数以及安检等待时间等信息,52 同时提供多层实时视频监看,支持以2D、3D或鸟瞰方式掌控全局动态。员工可协同模拟客流,测试新的设施布局,进行虚拟培训,有效减少代价高昂的错误,优化资源分配。与旧媒介相比,空间技术的第二个优势是让用户自主塑造应用内体验。空间计算支持构建体现物理空间感的数字体验,让我们能够设计出自在体验,为用户赋予移动和探索的自由。对于某些应用程序而言,让用户自己做主会使体验更有个性、更自然,也更有实效。巴黎蓬皮杜中心充分兑现了这种能力。它
132、与Snapchat工作室及艺术家克里斯蒂安马克雷(Christian Marclay)联袂合作,打造出独具个性的博物馆体验。53 马克雷在蓬皮杜中心的外立面上搭建起彩色数字乐器,以供访客通过Snapchat AR以多元方式演奏。访客还能够记录并分享他们“演奏”博物馆的美妙过程。这种参观体验允许访客将个人的创造力和发现注入艺术空间,而不再是由策展人一人打造。再如菲亚特汽车,他们正在尝试让用户自主探索,以此促成销售转化。54 一般情况下,人们在购车时可以试驾一种车型,如果想了解其他车型或定制选项,则需要查看不同的宣传手册或资料,而无法直接体验到他们想要购买的特定车辆。但菲亚特开设的元宇宙展厅打破了
133、这种模式。在虚拟展厅中,用户可以定制车型,包括各款车身、颜色、内饰和信息娱乐选项。55 然后,用户可参与虚拟试驾,体验新车性能,近距离观察它的众多功能。在整个过程中,用户还会得到一位“产品专家”(Product Genius)的支持这是一位实时在线的专业人士,能够随时解答用户的任何疑问。技术展望2024|AI拐点:重塑人类潜力空间计算57除了上述几个案例,人们甚至可以恣意畅享自主打造体验的无拘自由。加州大学伯克利分校的研究人员发现,采用空间计算技术后,人们在尝试跨设备协作互动时会出现一系列异步情况。例如,教员使用的可能是笔记本电脑,而学员却是戴着VR头显设备。他们认识到,如果试图强制内容只适应
134、一种模式(2D或3D)会导致所有参与者的体验变差。为此,他们提出了“交互式混合维度媒介”模型,允许在2D和3D之间无缝转换信息流。这种模型允许用户在更自主地控制个人体验,决定空间和维度上的信息呈现方式。56 最后,空间应用程序为物理空间带来了更多的优势;它们可以在不实质性改变物理场所的情况下,增强、改进和扩展物理场所。设想一下,在未来的办公室里,实体显示器、投影仪和显示屏统统将被空间计算机和应用程序所取代。人们将能自由设计简洁空间,降低管理成本,轻轻松松即可让周围环境大变样。盖璞和美泰正是利用这一点推出了芭比娃娃系列服装。57 他们借助谷歌的Geospatial Creator,用栩栩如生的3
135、D芭比娃娃、巨型数字广告牌和悬浮的粉色霓虹灯牌,将纽约时代广场装扮一新。这次发布活动表明,与建造价值不菲的新基础设施相比,空间媒介是一种独具魅力、可推广的替代方案。空间应用程序为物理空间带来了更多的优势;它们可以在不实质性改变物理场所的情况下,增强、改进和扩展物理场所。技术展望2024|AI拐点:重塑人类潜力空间计算58随着工作环境向空间化转变,企业还需要考虑安全问题。当空间计算设备逐渐普及,员工将使用这些设备工作,客户也会通过它们访问各种体验和服务,这将导致设备数量空前增长。随着设备生态系统的不断扩大,黑客也将获得更多可乘之机。那么,如何让无界空间有规可依呢?企业的空间策略设计需要遵循零信任
136、原则。此外,企业应认识到空间世界是个新兴领域,供应商和用户都可能存在盲点。只设一道防线是不够的,企业应部署纵深防御策略,利用多层次安全(如管理、技术和物理)为这一新领域做好防御工事。更重要的是,采取这种多维度安全方案有助于增强人们的信心,促进空间得到广泛采用。安全影响埃森哲、谷歌以及澳大利亚电信合作开发了一款试点应用程序,成功运用了空间计算技术提升体育场的体验,而无需对实体设施进行重大改动。58 在这款应用程序中,粉丝们可以借助沉浸式导航功能找到自己的座位,尽享增强现实体验。这项技术还可实现多用户AR游戏,增强玩家分析和性能统计功能。凭借空间技术的赋能支持,未来的赛事空间设计会更加简捷,所需的
137、硬件和显示屏更少。空间技术的这种发展演变将促使企业重新思索整个运营和工作流程,从而在效率提升、安全保障乃至其他方面大有作为。在墨西哥康奇塔CHRISTUS MUGUERZA医院的一次跨界合作中,一位著名整形外科医生头戴微软的HoloLens眼镜成功完成了手术。59 这项技术改变了手术环境,使医生能够在手术过程中同步查看患者病历、X光片、扫描结果和3D模型。重要的是,在手术过程中以数字化方式获取这些信息,可帮助手术团队在患者手术部位隔绝出无菌作业面。当手术团队需要参考患者信息时,他们可以随时查看和叠加相关信息,而无需走出手术室、脱下手术服、查找相关记录、回忆需要了解的内容、重新穿上手术服,然后返
138、回并重新消毒,不耽误半点时间。企业在试水空间技术时,最重要的是要了解空间技术与台式机和移动设备的不同之处。要想设计好捕捉和发挥这种媒介潜能和价值的应用程序,了解这些差异是关键。技术展望2024|AI拐点:重塑人类潜力空间计算59空间计算即将迎来快速发展,对企业领导者而言,起跑发令枪已经打响。要想在下一个技术创新时代遥遥领先,企业领导者必须重新思索对空间的定位,充分认识到最新技术进步将会产生的影响。计算新媒介并不常见,它们可以对企业和人们产生长达数十年且不可估量的影响。您是否准备好“身临其境”了呢?结论:空间计算技术展望2024|AI拐点:重塑人类潜力60人机互通技术解码人类意图技术展望2024
139、|AI拐点:重塑人类潜力人机互通611924201220262009202319472013202719522015202919642016203219982021199420212007199020172035首次进行脑电图(EEG)记录。1三星发布配备语音和手势控制功能的电视。10 赛车模拟器采用由大脑活动和眼球运动控制的汽车。Fitbit发布Fitbit Tracker。9 研究人员利用人工智能和脑机接口技术,恢复了一名中风患者的部分语言能力。17监测飞行员的眼球运动,改进仪器设计。2白宫启动“脑计划”。11某大型零售机构启动脑机接口试点项目,用于员工培训和技能保留。贝尔实验室研制出首个
140、语音识别系统。3Oura推出首款智能戒指。12一些大国通过立法保护公民的神经权利。面部识别的早期研究开始起步。4Neuralink成立。13某大型保险公司提供上门步态分析服务,以探查帕金森病和渐冻症的早期症状。首次在人体中植入侵入式脑机接口。7智利通过世界上第一部保护神经权利的法案。16网景发明网络浏览器cookie。6一项研究发现,凯撒医疗集团的新冠肺炎家庭监测安全有效。15沃尔沃推出新型“驾驶员疲劳警示系统”。8fMRI技术问世。5苹果推出面容ID。14某消费级神经技术设备成功将梦境转录为可视化图像和文字。技术展望2024|AI拐点:重塑人类潜力人机互通62概览请智能家居“打开灯”(tur
141、n on the lights),它可能会播放Journey乐队在1978年发行的单曲Lights,也可能会开错房间的灯。毕竟,智能家居技术不会读心术,它依赖于我们清晰明确的语音指令来执行任务。我们发音清楚吗?我们指定哪几盏灯了吗?技术展望2024|AI拐点:重塑人类潜力人机互通63无法正确理解人类是当前许多技术的限制因素。以机器人和无人机为例,我们只有将要求转化为它们能识别的指令才能控制它们。换言之,如果我们不了解数字产品带给用户的感受,则可能导致产品的市场表现不尽如人意。即使是在VR中,当用户的视觉预期与设备呈现的画面出现脱节时,使用者也会感到头晕目眩。为了缩小这种“认知差距”,我们采取了
142、一系列措施:学习新的手势操作、进行焦点小组访谈和对比测试、服用抗晕药物以及对员工进行新技术培训等。2022年,大型企业在员工整体培训方面的人均支出约为1689美元。18 但事实是,科技之所以难以和人类建立联系,通常是因为人的需求、期望或意图对于技术而言就像是一个未知的黑箱。现在,人们正试图改变这种状况。纵观各行各业,创新先锋都在着手构建一种能够以全新视野和深层次方式解读人类意愿的“人机接口”。他们所着力构造的不仅仅是一个简单的技术或系统,而是意在搭建一个深度融合“人机互通”的桥梁,通过这一“人机接口”,实现的联动效应将远超过家居智能化的简单提升,它将切实推动人与机器之间更深层次的理解、协作与交
143、流,革新我们在各个领域中与技术互动的方式。我们来看一下神经技术是如何开始与人类思维建立联系的。最近,加州大学旧金山分校和斯坦福大学的研究人员分别进行的两项研究表明,使用神经假体(例如脑机接口)可以从神经数据中解码语音。19,20 这种方法将存在语言障碍的患者想说的话转化为文本或生成式语音,从而帮助他们“开口说话”。整个社会对神经技术的关注也延伸到了各大企业。2022年,Meta人工智能实验室的研究人员进行了从大脑活动解码语音的实验,使用非侵入式大脑记录和人工智能模型来解码患者听到的语句和故事。21 再来看看读取身体动作的技术,比如眼部和手部追踪技术。2023年,苹果的Vision Pro推出了
144、visionOS功能,用户只需凝视并做出简单的手势,即可导航和点击,无需使用手持控制器。22 高度精确的眼动追踪可作为目标定位系统;用户可将食指和拇指捏在一起,点击要查看的内容。更令人赞叹的眼动追踪技术也将问世。苹果申请了一项专利,描述了利用瞳孔扩张预测用户意图的技术,比如选择某个按钮。23 此类创新技术改变了人机互动数十年来所遵循的规则和限制。目前,我们经常需要使出浑身解数,调整和改变我们的举动,方能使技术发挥作用。但是,“人机接口”将颠覆这一切;当技术能够更好地理解人类的行为和意图时,就能高效适应人类。想想看,有多少业务挑战正是取决于此?首先是客户服务、产品和工作场所体验。在整个企业中,我
145、们采用各种技术来帮助我们了解和适应他人。我们早已习惯了今天的限制,习惯了这些技术永远无法完全“理解”我们,甚至可能都尚未意识到这种鸿沟对我们工作的制约有多大。现在,“人机接口”的发展从眼动追踪到姿态识别、从计算机视觉到机器学习、从大脑传感到读取肌肉信号正在打破这一限制。目前,我们经常需要 使出浑身解数,调整和改变我们的举动,才能使技术发挥作用,但人机接口将颠覆这一切。技术展望2024|AI拐点:重塑人类潜力人机互通64技术与人体之间的这种碰撞可能会让人联想到遥不可及的科幻画面。但是,经过对现已掌握的技术进行审慎评估,我们看到了企业创新的无限机遇。我们可以加强员工培训,提高工作场所的安全程度,减
146、少沟通错误和事故。我们可以打造数字产品,更好地了解和吸引人们,触达更广泛的客户群。设想一下,当我们不需要迁就技术,而是让技术适应我们,那工作效率会有多高。通过观察人类来提供流畅体验的头显设备,已经开始显露这一趋势。在不远的将来,我们就会看到机器人仔细聆听并根据场景理解我们的指令,或看到数字体验跟踪我们的互动情况,捕捉微妙的情绪反应。这些更好地“理解”我们的技术,将彻底改变我们未来的工作方式。“人机接口”将成为技术能力的重大飞跃,对企业产生深远影响。但要取得成功,企业还需要解决日益严重的信任和技术滥用问题。对于让技术以这种全新而亲密的方式读取和理解我们的想法,无论是企业还是个人,恐怕都有些难以接
147、受。生物识别隐私标准有待更新。此外,我们还需要制定新的神经伦理保障措施,包括如何妥善处理可推断人的意图和认知状态的大脑数据以及其他生物识别数据。在正式法规出台之前,赢得人们信任的重任只能由企业承担。“人机接口”是个棘手的研究领域。人们对这项技术还心存顾虑,其全部影响尚不清楚。尽管如此,这项技术的发展之快依然超过众多人的想象。毫无疑问,企业需要抓紧行动起来。当技术能够更好地理解人类时,商业中所有以人为本的领域,即人与技术互动之处以及依赖于理解和解读人的行为和意图的一切,都将发生翻天覆地的变化。无论是琐碎任务还是重大难题,“人机接口”都会提高行业标准。因此,任何企业都不希望在这个变革潮流中落后。技
148、术展望2024|AI拐点:重塑人类潜力人机互通65技术:坚持以人为本理解作为个体、目标群体或人群一员的人,是一个世纪以来的商业难题。近几十年来,数字技术的应用成为解决这一难题的最终分水岭。过去,借助数字平台和设备,企业得以跟踪和量化人们的行为,产生了巨大影响。现在,“人机接口”再次改变了游戏规则,使企业能够以更深入、更以人为本的方式理解用户。数字技术如何“理解”人类我们首先来看一下当今企业理解人类行为的主要策略。它们大致分为两类:网络数据收集和现实世界中的物理传感器。在网络上,企业理解用户行为的能力是影响数字体验的一个重要因素。各种平台都依靠用户数据来打造个性化体验和改进产品。根据Statis
149、ta的数据,到2026年,全球客户体验个性化和优化软件的收入预计将达到116亿美元。24 不仅如此,如今许多企业有超过半成的营销预算都用在个性化上。25 新闻推送排名、内容推荐、广告定向投放等各种功能都源于这种对用户行为数据的深度理解和利用。技术展望2024|AI拐点:重塑人类潜力人机互通66在现实世界中,最近的大量技术创新也都与理解人的行为息息相关。很久之前,就有设备收集人们的生理数据,供企业根据健康状况和位置开发产品和服务。无论是分析客流的店内传感器,抑或是可进行情感分析的面部识别装置,都是为了更好地了解人,引导他们实现各种目标结果。语音和手势识别则是更加自然的人与技术交互方式。这些技术都
150、非常重要,但它们是建立在跟踪和观察模式基础上的,往往缺乏对具体意图的精准把握。人们可能会阅读或观看熟悉的内容,但他们实际上可能更想体验一些新东西。他们可能会用模棱两可的手势或错误指令来指挥机器人或设备。我们擅长识别人的行为,却不一定理解他们的真正意图。这就造成了很多令人烦恼的情形:技术误解我们的指令,或者平台让我们陷入推荐的死循环。这一点不足为奇,因为在既有技术限制又有人类自身限制的世界里,人们本身就很难充分、准确地表达自己的需求和意愿。近三分之一的消费者表示,他们经常因技术无法准确理解他们及其意图而烦恼不已。改变这种情况正是“人机接口”的使命。随着算法越来越精确,传感器阵列越来越齐全,以及能
151、够深度理解人类意图的新技术不断涌现,我们开始用更以人为本的方式了解人类。技术展望2024|AI拐点:重塑人类潜力人机互通67“人机接口”并非单独一种技术。相反,它包含一系列技术,这些技术助力创新者加深对人的认识和理解。识别意图(人们的思想状态、行为或意思)是其中最重要的因素之一。各行各业的领先企业都在都在寻找预测或观察用户意图的方法。有些企业利用可穿戴设备跟踪人们的生物信号,有效预测他们的行为或了解他们的认知状态。例如,华盛顿大学西雅图分校的研究人员探索了多种方法,以期通过在VR中进行以凝视为主的眼动追踪,帮助用户更好地控制假肢。26 在这里,追踪一个人的眼动情况有助于预测他的意图,比如是否要
152、朝某个方向移动或拿起某个物品。另一个例子是,Immersion Neuroscience利用智能手表和健康传感器测量人们心率的微妙变化,进而预测他们的认知状态。27 还有一些企业正在研发更细化的方法,以了解人们相对于所在环境的意图。例如,同济大学汽车学院的研究人员希望找到减少人车碰撞的方法。28 大多数碰撞预防研究工作都只注重行人检测,而这些研究人员围绕这一课题展开了深入研究。他们捕捉很多细节,包括车辆与行人之间的距离、车辆的速度以及行人的体态,比如大腿与小腿或小腿与地面之间的角度。捕捉街上行人步态可以成为预测他们下一步动向的线索,从而帮助确保路上行人的安全。Alphabet旗下自动驾驶汽车子
153、公司Waymo也在进行类似的研究。除了观察汽车周围发生的一切,例如交通标志和信号灯、行人、建筑、骑行者和其他汽车,Waymo Driver自动驾驶系统还能预测其他道路使用者的意图。29 鉴于了解到行人、骑行者和其他人的运动方式各不相同,它能实时预测每个人可能采取的多种行驶路径。“人机接口”如何感测意图技术展望2024|AI拐点:重塑人类潜力人机互通68另一种理解人类意图的方式是利用人工智能。在人机协作中,人的精神状态,比如是神采飞扬还是疲惫不堪,会影响他们执行任务的方式。人类很容易理解这些精神状态,机器人却不然。因此,南加州大学的研究人员试图教会机器人识别这些状态,以帮助它们更好地协助人类。3
154、0 一般情况下,训练机器人适应一个人的工作方式需要很长时间。但研究人员提出了一种迁移学习机制,即让机器人观察某个人执行简单典型任务的过程,然后创建出偏好模型,并在人机互动过程中不断更新该模型。31 同样,埃森哲公司和康奈尔大学在2023年联合发表的一篇研究论文中描述了一种人机协作方式,即机器人可以根据与之互动的人类的隐性反应来识别自己何时犯了错,这与人们利用社交线索来认识自己的错误有异曲同工之妙。32 论文作者建立了一个旁观者对人类和机器人错误的反应数据集,并将其作为深度学习模型的输入来预测故障。他们通过创建这些敏感捕捉人类社交信号的系统,有效利用人类感知和行为的专业知识,降低了机器人的出错率
155、。最后,最振奋人心的“人机接口”技术或许是神经技术:神经传感和脑机接口。过去十年涌现了许多新创神经技术公司,该领域在读取和识别人类意图方面的前景广阔。通过使用神经假肢来强化人脑与机械肢体之间的联系,假肢的动作和感觉会变得更加自然。例如,Blackrock Neurotech和Phantom Neuro合作研制了先进的假肢和外骨骼。33 通过在截肢部位植入假肢,他们可以通过肌肉活动检测到神经信号,并以此控制机械臂。两家公司希望制造出能够像健全肢体那样跟随人的意图自如移动的设备。以上只是新兴“人机接口”技术的一小部分示例。未来几年,我们有望看到各种能够更好理解人类意图的设备和系统,从完全外置到皮肤
156、触控,再到侵入式人体植入设备,范围广泛。虽然这里关注的主要是外部和皮肤触控技术,但值得注意的是,侵入式设备也在不断进步。总体而言,毋庸置疑的是,我们已经开始以前所未有的程度理解和解读人类的意图,并且这一能力仍在持续提升中。技术展望2024|AI拐点:重塑人类潜力人机互通69“人机接口”技术和建立在人本技术基础上的新一代商业突飞猛进,神经技术就是一个很好的例子。许多人可能认为,神经传感和脑机接口技术要实现商业应用尚需时日,但最近的进步却说明事实并非如此。近年来,以消费者为导向的开发活动日益增多,这是“人机接口”逐渐迈向主流市场的强烈信号。最初,怀疑论者倾向于认为神经技术的发展将止步于医疗保健行业
157、。毕竟,许多备受瞩目的神经技术设备都是以高侵入式植入为核心的医疗手段。2022年,葛兰素史克联手谷歌旗下公司Verily组建的Galvani Bioelectronics公司,为一名类风湿性关节炎患者植入了首个神经刺激器。34 在早期试验中,Synchron希望通过其部分侵入式大脑植入设备恢复严重瘫痪者的交流和其他功能。35 这种侵入性因为医疗需要而具有合理性,也令人觉得似乎若非必要没有人会选择使用这种技术。但是,制造这些设备的方法有很多。它们可以是侵入式或部分侵入式的,也可以是完全外置的。它们可以是医疗机构内的大型系统,也可以是小型便携系统。由于可供选择的技术非常多,人们总能找到合适的解决方
158、案,满足目标用户的需求和舒适度要求。与此同时,商业计划和用例也与日俱增。推动这一过程的是两项重大进步。首先是解码大脑信号。早在几十年前,人们就已能够感知大脑信号,可要将这些技术转化为商业产品仍然要跨越巨大鸿沟。36 因为,不同个体大脑中的通用信号和模式仍难以识别。但是,人工智能模式检测技术的进步,以及大脑数据可得性的提高,情况已大有不同。举例来说:神经网络期刊2023年的一篇论文提到,研究人员采用了一种基于Transformer架构的深度学习模型,降低了识别多名受试者大脑信号的难度,无需对每个人的大脑进行重新校准。37 他们阐述了传统的SSVEP(稳态视觉诱发电位,一种大脑信号)分类系统如何需
159、要针对个体进行专门近年来,以消费者为导向的开发活动日益增多,这是“人机接口”逐渐迈向主流市场的强烈信号。训练。虽然先前的研究已运用深度学习来提高受试者间的SSVEP识别率,但此文证明,Transformer架构在分类准确性方面可获得更优结果,从而有可能减轻对个体脑机接口校准的需求。推动这项研究的是整个行业向开源数据的转变。Transformer模型(以及一般的机器学习模型)需要大量训练数据,而大脑信号数据集仍然相对稀少。而现在,越来越多的机构开始公布自有大脑数据,广大研究人员可以相互借鉴,开展更多研究。38 埃森哲技术研究院的研究人员试验了人工智能如何高效生成合成大脑信号来训练检测模型,而无需
160、依赖人的原始大脑信号。39 这种能力证明了开发新型人工智能健康解决方案的潜力,即利用合成替代物,而不是依赖敏感的患者生物信号。第二个需要关注的领域是神经硬件。具体而言,就是外部设备的质量。虽然侵入式脑机接口通常分辨率较高,但外部设备的市场吸引力更为广泛。“人机接口”如何感测意图技术展望2024|AI拐点:重塑人类潜力人机互通70EEG(脑电图)和fMRI(功能性磁振成像)是史上应用最广泛的两种脑外传感技术。40 EEG测量脑电活动,时间分辨率(即时捕捉神经活动)较高,而fMRI测量脑血流,空间分辨率(精确定位神经活动发生的部位)较高。41 但直到最近为止,无论是捕捉哪种大脑信号,都还只能在实验
161、室环境进行。而现在,这种情况已开始改观。以前的EEG设备对环境噪声和肌肉运动非常敏感,使用者必须保持静止不动。但是Wearable Sensing的DSI-24头显等新型设备采用干电极EEG系统,对动作和噪音的抗扰性更强。42 虽然fMRI或许仍只能用于医疗环境,但借助一种名为fNIRS(功能性近红外光谱)的新技术,人不用躺在磁共振舱内的情况下,也能测量脑血流。43 例如,Kernel的Flow2神经成像头显设备将fNIRS技术与EEG相结合,可在便携式头显设备中提供全面的大脑活动信息。44 技术展望2024|AI拐点:重塑人类潜力人机互通71便携性对于能否实现商业应用至关重要,一些企业已经开
162、始研制具备此特性的产品。生物信息学初创公司EMOTIV和无线可穿戴技术公司X-trodes,正在合作开发一种用于测量大脑和生理活动的家用可穿戴产品。45 他们致力于研制一种贴合人类皮肤的贴片电极,以备在使用大型EEG设备不理想的情况下(例如在睡眠研究中)使用。苹果公司提交了一项专利申请,即通过AirPods传感器系统测量用户大脑的生物信号和脑电活动。46 最后,快速将大脑信号转化为动作的能力(也与便携性有关)同样十分重要。在某些使用场景中,原始大脑数据发送到云端的速度慢如蜗牛,造成可用性问题,妨碍人们及时移动或交流。但这方面也在不断进步。2022年,风投融资推动了边缘人工智能芯片初创企业的蓬勃
163、发展。47 英伟达和高通等老牌芯片制造商继续领跑,全力打造更薄、更强大的边缘芯片。48 另一些企业则致力于提高处理大脑信号的计算效率。2022年发表的一篇论文中,来自加州大学默塞德分校和爱立信的研究人员提出了一种高效方法,用于对大脑对歌曲录音反应理解人类的方式正在发生深刻转变,对于企业而言,则意味着将迎来重大的战略转型和业务革新。的EEG进行分类,证明可通过标准计算机视觉方法有效处理EEG数据。49 事实上,他们的分类模型十分小巧,一个小小的软盘即可容下。但就在几年前,这种连接人类大脑的事情还依然是天方夜谭。这也是神经技术被视为“人机接口”技术有力标志的原因所在。为此,许多技术开始以更深入、更
164、注重人的方式观察和理解人类。神经技术就是其中之一,而其他技术则是观察和学习人类的长期情绪和习惯,或洞悉个人所处的环境,旨在更好地预测人的行为和意图。由此可见,理解人类的方式正在发生深刻转变,对于企业而言,则意味着将迎来重大的战略转型和业务革新。技术展望2024|AI拐点:重塑人类潜力人机互通72启示:以正确的方式出发企业是该问问“人机接口”对他们意味着什么了。但直到现在,这一问题仍没有标准答案。技术创新和进步拉近了人与技术之间的差距,让技术理解和适应人的能力上升到了新高度。这种进步将可能在任何涉及人机交互的商业领域引发巨大的变革。由此带来的大量机遇令人欢欣鼓舞。领先企业已以各自特有的方式投入其
165、中。部分企业正在探索如何利用此类技术来增强劳动力。例如,埃森哲与神经技术初创公司Mendi达成合作,研究如何应用神经反馈来改进学习和培训计划。50 还有一些企业则着眼于消费品市场。在视频游戏行业,领先企业就此展开了全方位探索,从眼动追踪如何控制或影响VR体验,到神经技术如何帮助他们更好地了解玩家对游戏的反应,几乎无所不及。51,52 但是,撒网式转型也可能让我们失去俯瞰全局的能力。随着越来越多的企业开始制定“人机接口”策略,他们应首先明确识别出哪些业务领域和挑战可以通过这项技术进行革新和转型。技术展望2024|AI拐点:重塑人类潜力人机互通7394%的高管认为,人机接口技术将有助于我们更好地理
166、解 人的行为和意图,进而改变人机交互方式。“人机接口”的应用范围首先,思考一下“人机接口”技术将如何提高人类行为预测标准。多年来,企业一直在尝试做到这一点。而“人机接口”技术赋能我们将一直在构建的复杂行为分析与研究人类复杂性的新能力结合起来。一些最有前景的用例出现在人机协同作业的空间中。例如,如果机器人能够预测人的下一步行动,企业就能创建更加安全高效的制造系统。或者,如果汽车不仅能监控行人还能监控司机,就能促使他们改善道路安全,进而有望影响整个汽车行业和供应链等。该技术在其他行业的应用前景同样一片大好。康奈尔大学的研究人员正在试验一种预测球员在比赛中动作的算法,准确率约为 80%。53 该算法
167、利用计算机视觉实时解读球员的视觉信息,例如他们在球场上的位置和身体姿势,然后将这些信息与球队战术或球员角色等背景数据相结合。康奈尔团队希望这些算法可以帮助团队达到最佳备战状态。对于企业而言,此类工具可以改变的远不止体育领域。我们的所作所为都会受到周围环境的影响,因此,能够捕捉周围环境变化及其对我们影响的技术,其前景必定一片光明。无论是优化员工培训,还是让消费者获得更个性化、更有吸引力的数字体验,这些示例都还只是冰山一角。技术展望2024|AI拐点:重塑人类潜力人机互通74另一个可以转型的领域是直接的人机协作,即我们如何使用和控制技术。举个例子,想一想神经技术是如何让我们了解自己的大脑,并以全新
168、且更自然的方式与技术相连接的。举例说明,悉尼科技大学的研究人员开发了一种脑机接口头显设备,利用生物传感器捕捉脑电波并将其转化为指令。54 在澳大利亚陆军的一项试验中,借助该设备,士兵仅凭意念就能控制一只四足机器狗,准确率高达94%。再比如,Snap收购了NextMind,该公司研制的意念控制头戴设备可让人们通过大脑信号与数字对象进行互动并向其发送指令。55 展望未来,该设备可能会超越免提控制,为某些技术带来新功能或提高其性能。提供计算机视觉全息云服务的微美全息正在打造一个混合脑机接口系统,该系统将能结合并分析多种互补大脑信号,用于控制人形机器人。56 该公司认为,使用人的神经信号发送指令有利于
169、提高我们控制人形机器人的精确度。技术展望2024|AI拐点:重塑人类潜力人机互通75而神经技术初创公司InnerEye则尝试以另一种方式展开人机协作。人脑可极为快速地处理视觉图像,但决定和执行响应所需的认知和运动过程会减慢处理速度。InnerEye公司证明,脑机接口头显设备可以利用人脑对图形的快速反应来提高工作效率。57 该公司让实验对象观看计算机上快速闪过的机场安检X光扫描图,速度约为每秒三张图。这种速度太快,普通人根本看不出其中隐藏的枪支等物品。但在扫描图显示完毕后,几乎所有被标记为含有枪支的图像都正确无误。最后,“人机接口”可推动新产品和新服务的发明创造。例如,大脑感应会帮助人们更好地“
170、了解”自己。欧莱雅目前与EMOTIV展开合作,致力于帮助人们更好地了解自己的香味偏好。58 他们使用EMOTIV基于脑电图的头显设备,测量顾客对欧莱雅各种香水系列产品的神经反应。然后,头显设备的机器学习算法会解读EEG数据,向顾客展示不同香味带给他们的感受。还有一些企业正在考虑将“人机接口”作为一项安全措施。Meili Technologies是一家以提高车辆安全性为使命的初创公司。该公司利用深度学习、视觉输入和车内传感器,检测驾驶员是否因心脏病、癫痫、中风或其他紧急情况而丧失工作能力。59,60 SmartCap是一款内置于安全帽的疲劳感测产品,61 可通过EEG脑信号分析测量人的警觉性和疲
171、劳度,提前发出警告提醒。SmartCap Technologies开发这款产品的初衷在于帮助澳大利亚采矿业杜绝安全隐患。该公司后来被日立建机旗下的Wenco国际矿山系统收购,后者目前正在将该产品推广至北美市场。以上所有商业领域和挑战展示了“人机接口”的广泛用途。但是,每一种用途背后都隐藏着一个由来已久的商业挑战:无论是要实现销售、建立客户忠诚度,还是要为员工创造最佳的工作空间和工具,其成功与否都始于我们对人的理解和洞察能力有多深。现在,“人机接口”将这一挑战放大到了前所未有的程度。技术展望2024|AI拐点:重塑人类潜力人机互通76除了积极推动正式法律出台,他们还深信企业、企业家、科学家等各方
172、应当通力协作,制定自治和问责标准,以“主动管理创新的社会影响”。65 无论您是否选择与此类基金会展开合作,都不能否认他们关于自治和问责制的观点正确性。今天,任何探索这一领域的企业都是先行者,皆有机会为未来图景定下基调。随着企业开始更广泛地应用“人机接口”技术,他们可参考现有的生物识别法律和医疗行业,从中获得经验指导。这一领域的许多风险都是趋同的。例如,收集生物识别数据会引发隐私问题,以及是否有权拒绝接受这种技术的问题。有关任何生物识别数据,员工和客户会希望了解收集的内容和用途是什么,以及是否可以保存在任何位置。从这些数据中得到的推论同样存在此类问题。在这方面做到谨慎尽责,或将决定企业能否成功顺
173、势发展。企业在探寻各种可能性并制定策略的同时,还需要应对一大日益严峻的挑战。“人机接口”若得不到人们的信任,无论是在产品中还是在企业中,它都无法发挥应有的潜力。企业亟需思索这类技术存在什么风险,需要制定什么新政策和保障措施。负责任的企业与其坐等法规加强,而应现在就开始行动。特别值得一提的是,神经伦理学领域已开始引发关注。人们对神经技术设备物理安全性的质疑声不绝于耳,此外还对人类自主性的心理风险,以及大脑数据隐私、知情同意和公平性等社会因素提出了诸多问题。62 2021年,智利成为第一个通过宪法修正案将人权扩展至神经权利的国家。63 神经权利基金会等组织也在积极推动世界各地出台神经伦理方面的准则
174、和法律。该基金会的使命目标是防止神经技术遭到滥用或误用,并将其定义为任何记录或干扰大脑活动的技术。64 商业竞争已然不同往日信任比以往任何时候都更加珍贵如果连锡纸帽都不能防止读心术,还有什么能呢?与今年的其他趋势相比,安全问题将决定企业和消费者是否会采用“人机接口”。能否接受更具感知力和连接性的工具,最起码要看人类能否成为信息共享的主要把关人。设计新一代人机接口工具时,需充分考量这方面的实践,让人们要么选择共享与当前任务相关的数据或遥测信息,要么选择不共享无关或敏感信息。这就像人类的移动设备管理:我们已经知道以怎样的方式控制留在本地或发送到云端的移动设备数据,但人类的生物、行为和感官数据共享则
175、隐藏着更为复杂的风险。基于规则的方法可为数据共享系统打好基础,而人类需要更灵活且易于解读的保障措施,以维稳对自身数据的控制。此外,人类还需要解读数据,以免在授予访问权限时产生歧义。安全影响技术展望2024|AI拐点:重塑人类潜力77结论:人机互通人机接口堪称应对商业顽疾的新药方,它让企业得以窥见人类的潜力。责任越大,机遇越大。人们对隐私问题的质疑和担忧将是企业面临的首个也是最重要的障碍。但是,能有机会以这种更深刻、更注重人的方式了解人类,无疑是值得的。从宏大目标到琐碎事务,从重新设计产品到预测何时穿过繁忙的街道,再到确定我们是否太累而无法安全完成工作任务,“人机接口”或将改变一切。人机互通技术
176、展望2024|AI拐点:重塑人类潜力技术展望提出的趋势代表了技术创新领域一些最有影响力、最引人注目的进展。然而,这些只是构成更广泛的技术革命的一部分。技术的发展正在深刻地影响着企业的各个方面。两年前,我们要求企业在“多元宇宙”中“融合共治”,去年我们通过“当原子遇见比特”集中展示了我们的数字生活和物理生活如何融合这些内容至今仍然具有话题性和影响力。尽管历年来,某些趋势相比其他趋势总会带来更多令人兴奋的消息或者进步(例如人工智能惊人的创新速度),但所有这些领域都有创新对于企业来说,在制定长期战略时,注意到变革的整个影响范围仍然至关重要。今年我们呈现的是一个正在发生并将持续发展的故事,即:历年技术
177、展望中提出的重要主题正在构成未来企业战略、市场和技术发展的基础。结语趋势演进技术展望2024|AI拐点:重塑人类潜力2024 技术趋势AI伙伴智能体空间计算人机互通通用智能数据透明数字身份未来网络编码世界虚实共生无限算力前沿探索未来架构镜像世界技术普众无界工作多方信任科学技术 科技领域的发展,特别是人工智能等技术的应用,加速了科学的进步,并且这些科学进步以前所未有的速度渗透到各个行业中。能源、材料、太空和生物等新领域将在世界上最具颠覆性的公司的创新战略中日益发挥重要作用。科学和技术之间的这种反馈循环正在扩大我们计算的范围,创造出使我们能够解决更大问题的工具,并从根本上改变行业和市场。数字所有权
178、 在区块链和、数字分类账等技术的驱动下,数字所有权的概念出现了,继而彻底颠覆了长久以来与数据、身份、客户关系和在线生态系统等相关的传统模式。分布式计算让我们能够为很多的人和事物创建独特的身份,让曾经不可能的跨越数字平台的所有权得以实现。然而所有权本身并不是重点,重点在于它所能支持的内容。数字所有权可以激发新形式的客户参与、资本筹集和数字环境之间的互操作性,为创造全新的商业模式和数字生态系统提供了可能性。可持续发展 从监管要求到客户压力,再到提高效率的愿望,可持续发展仍然是各行业高管的首要考虑因素。技术创新在创造真正的循环经济方面将继续发挥着至关重要的作用。企业的新兴技术可以建立更清洁的能源系统
179、,从而抵消或减少负面环境影响。虽然可持续发展工作的短期成本可能会让一些高管感到担忧,但企业绝不能忽视长期收益,以及技术所能提供的帮助。虚实共生 虽然生成式AI已经引起了全世界董事会的关注,但关于深度伪造、篡改图像和伪造视频的讨论不可避免地随之而来。企业在争论什么是真实的、什么是虚幻的、以及人们是否真正在意真实与否等等问题。然而,在适当的情况下,“虚实共生”可以为企业带来难以置信的优势。综合数据可以帮助我们识别边缘事件并做好准备。与“假”销售助理交谈可能是一种更好、更不带评判的客户互动。然而,为了引导良好的可能性,企业仍然需要监控这些“虚实共生”的解决方案对人们的影响,同时加强安全和风险管理的实
180、践。2023 技术趋势2022 技术趋势2021 技术趋势技术展望2024|AI拐点:重塑人类潜力迈克尔比尔茨(Michael Biltz)埃森哲全球副总裁、全球创新主管 LinkedIn迈克尔比尔茨(Michael Biltz)埃森哲董事总经理、技术展望报告主管 LinkedIn作者杜保洛(Paul Daugherty)埃森哲首席技术和创新官 LinkedIn技术展望2024|AI拐点:重塑人类潜力在初始阶段,我们邀请由20多位企业高管和企业家组成技术展望外部顾问委员会,他们来自公共和私营领域、学术界、风险投资机构及初创企业。此外,埃森哲技术展望报告团队还与技术先锋、行业专家和埃森哲各业务部
181、门的负责人进行了多轮深度访谈。随后,研究团队面向20,027名消费者进行全球调研,获得关于他们对技术使用和态度的深入洞察。此外,我们还对来自21个行业的3,450位业务和IT高管开展调查,旨在了解他们对新兴技术的洞察以及这些技术在其组织中的应用情况。调研于2023年10月至11月期间举行,覆盖了20个国家/地区,帮助我们进一步明确不同行业和地区的企业分别关注哪些技术战略和优先投资对象。本次调研还运用生成式人工智能技术对50名开发人员、产业工人和空间计算高级用户进行了访谈。通过严谨详实的数据分析和调研结果,研究团队梳理出技术发展和进阶方向。随着研究的深入,技术展望团队整理出本年度的趋势主题,评估
182、其与实际业务挑战的相关性,并进行验证和提炼。技术展望团队致力于提出新颖、前沿的想法,因此不仅仅关注已经被广泛认知的技术变革,而是寻找那些即将引起企业高层重视的新议题,以应对未来的技术挑战。埃森哲技术研究院与埃森哲商业研究院联合本开展了定性和定量研究,以确保研究结果更加客观和具备时效。具体工作如下:二十多年来,埃森哲技术展望报告对企业所处的商业环境和竞争格局进行系统性追踪,旨在识别未来几年对公司、政府机构和其他组织产生最大影响的新兴技术趋势,对企业当下发展具有实际应用价值和现实指导意义。关于 技术展望技术展望2024|AI拐点:重塑人类潜力500亿美元或以上300至499亿美元100至299亿美
183、元50至99亿美元10至49亿美元5亿至9.99亿美元1%1%23%31%43%1%首席分析官首席客户官首席数据官首席执行官首席体验官首席财务官首席人力资源官首席信息官首席创新官首席营销官首席运营官首席生产官首席销售官首席战略官首席供应链及运营官首席技术官研发主管2%2%2%32%2%11%9%5%5%6%4%2%1%8%3%7%1%航空航天与国防航空、旅行和运输汽车银行生物制药资本市场化工通信、媒体和娱乐消费品能源医疗保健高科技工程机械保险医疗科技自然资源私募股权公共服务零售软件与平台公用事业澳大利亚巴西加拿大中国法国德国印度爱尔兰意大利日本荷兰沙特阿拉伯新加坡南非西班牙瑞典瑞士阿联酋英国美
184、国5%5%5%5%5%5%5%5%5%5%5%5%5%5%5%5%5%5%5%5%4%3%4%8%4%4%5%3%3%4%3%2%3%3%3%3%3%1%4%32%3%5%5%7%3%3%4%8%5%5%6%4%8%8%3%4%1%3%5%5%5%消费者调研(N=20027)国家/地区高管调研覆盖行业高管调研覆盖职务高管调研受访企业收入(美元)高管调研(N=3450)调研样本分布技术展望2024|AI拐点:重塑人类潜力概要:AI拐点1.Choic,C.(2009年11月11日)。人类进化:工具使用的起源。生活科学:https:/ Photoshop的新“生成填充”AI 工具可让您用文本处理照片
185、。Ars Technica:https:/ 智能搜索功能。CNBC:https:/ Copilot对开发人员生产力和幸福感的影响。GitHub:https:/github.blog/2022-09-07-research-quantifying-github-copilots-impact-on-developer-productivity-and-happiness/6.芬尼根,M.(2023年5月24日)。微软通过Teams头像、Mesh更新推进 混合现实计划。计算机世界:https:/ 危险。纽约时报:https:/ 频谱:https:/spectrum.ieee.org/ai-paus
186、e-letter-stokes-fear11.Hanlon,A.(2022年6月1日)。元宇宙单独在一起?伦敦经济学院博客:https:/blogs.lse.ac.uk/businessreview/2022/06/01/metaverse-together-alone/12.艾尔哈特,M.(2023年5月1日)。大脑活动解码器可以揭示人们心中的故事。德克萨斯大学奥斯汀自然科学学院:https:/cns.utexas.edu/news/podcast/brain-activity-decoder-can-reveal-stories-peoples-minds参考资料技术展望2024|AI拐点
187、:重塑人类潜力1.J.斯沃格(J.Swoger)(2012年7月27日)。科学杂志的(真实)起源。科学美国人:https:/ Wise Kent)等人。(无日期)。不列颠百科全书。B:https:/www.britanni- 3.不列颠百科全书 的编辑。(无日期)。杜威十进分类法。B:https:/ 4.S.Xu(S.Xu)。(无日期)。向纽约市纽约公共图书馆的“Ask NYPL”图书管理员热线核实情况。Untapped New York:https:/untappedci- Jeeves惨败的真正原因。History-Computer:https:/history- Verge:https:
188、/ 10.不列颠百科全书 的编辑。(无日期)。维基百科。B:https:/ 11.J.汉伦(J.Hanlon)(2013年9月16日)。五年前,Stack Overflow推出。然后,奇迹发生了。Stack Overflow博客:https:/stackoverflow.blog/2013/09/16/five-years-ago-stack-overflow-launched-then-a-miracle-occurred 12.B.卢特科维奇(B.Lutkevich)、J.斯卡迪纳(J.Scardina)等人。(无日期)。Microsoft SharePoint。TechTarget:ht
189、tps:/ 13.知识图谱。(2022年12月2日)。学术界百科全书:https:/encyclope-dia.pub/entry/3771314.刘伟杰、周鹏等人。(2022年9月17日)。K-BERT:基于知识图谱的语言表示模型。arXiv:https:/arxiv.org/abs/1909.07606 15.A.施特林格(A.Stringers)和K.维格斯(K.Wiggers)(2023年9月28日)。ChatGPT:关于人工智能聊天机器人的一切。TechCrunch:https:/ Verge:https:/ Atlantic:https:/ Research:https:/vide
190、os.bright- 19.C.麦兹(C.Metz)和N.格兰特(N.Grant)(2022年12月21日)。新的聊天机器人是谷歌搜索业务的“红色代码”。纽约时报:https:/ 20.K.胡(K.Hu)(2023年2月2日)。ChatGPT创下用户群增长的最快记录-分析师报告。路透社:https:/ GPT。(2023年3月7日)。Salesforce News&Insights:https:/ Healthcare:https:/ 24.Gartner新闻稿。Gartner调查显示47%的数字工作者难以找到有效完成工作所需的信息。(2023年5月10日)。Gartner:https:/ G
191、ARTNER是Gartner,Inc.和/或其附属公司在美国及全球的注册商标和服务商标,经许可在此使用。保留所有权利。25.J.希尔格(J.Hilger)(2022年2月17日)。5 大知识管理技术。Enter-prise Knowledge:https:/enterprise- News Desk。(2022年8月29日)。文件实时图表分析为企业节省400多万个工时。CXO Today:https:/ 29.D.拉奥(D.Rao)(2023年4月15日)。如何使用大语言模型和知识图谱管理企业数据。VentureBeat:https:/ Wire:https:/ Turbo 应用于自定义调优。
192、The Verge:https:/ 33.S.西瓦苏布拉马尼亚(S.Sivasubramanian)(2023年4月13日)。宣布推出用于在AWS上使用生成式AI进行构建的新工具。AWS 博客首页:https:/ Azure上构建新一代人工智能应用程序。Azure博客:https:/ 36.Z.Wang(2023年5月17日)。弱者革命:小语言模型如何反超大语言模型?Deepgram:https:/ 37.E.伯杰(E.Berger)(2023年6月9日)。大语言模型落地实施。微软博客:https:/ 38.如何请求Einstein GPT产品的技术支持。(2023年7月19日)。Salesf
193、orce产品支持:https:/ 39.Mata v.Avianca,Inc.(2023年6月22日)。Casetext:https:/case- 40.T.克莱本(T.Claburn)(2023年6月22日)。引用ChatGPT判定的虚假案件的律师必须付出代价。The Register:https:/ Dive:https:/ 43.R.米勒(R.Miller)(2023年5月11日)。Writer推出有助于减少其大语言模型中幻觉内容的产品。TechCrunch:https:/ 45.R.惠勒(R.Wheeler)和J.斯通(J.Stone)(2023年5月)。使用大语言模型和生成式AI构建
194、数字化车主手册。Toyota Connected:https:/ 46.E.布莱恩约弗森(E.Brynjolfsson)、D.Li等人。(2023年4月)。工作中的生成式AI。美国国家经济研究局:https:/www.nber.org/system/files/working_papers/w31161/w31161.pdf 47.A.马利克(A.Malik)(2023年3月9日)。Discord在机器人中添加 ChatGPT类似功能,并推出人工智能生成的对话摘要等。TechCrunch:https:/ AI的早期洞察。(2023年6月11日)。Snapchat Newsroom:https:
195、/ 49.Bing Chat。(无日期)。Microsoft Edge:https:/ 50.Reid,E.(E.里德)(2023年5月10日)。利用生成式AI为搜索增效。关键字:https:/blog.google/products/search/generative-ai-search/51.M.Lee(2023年6月27)。购车需要帮助?问ChatGPT。新插件可帮您节省时间(和金钱)。今日美国:https:/ 和功能。Tech Craving:https:/ Turk。创造力的发动机:https:/engines.egr.uh.edu/episode/2765 2.阿尔蒙布朗史端乔(A
196、lmon Brown Strowger)。(无日期)。美国国家发明家名人堂:https:/www.invent.org/inductees/alm-on-brown-strowger3.A.马什(A.Marsh)(2022年8月30日)。1961年第一条机械臂问世。IEEE Spectrum:https:/spectrum.ieee.org/unimation-robot4.A.安克(A.Anker)(1995年10月1日)。BargainFinder。连线:https:/ 7.关于我们。(无日期)。eSnipe:https:/ 8.B.贝里(B.Berry)、L.基尔(L.Kiel)等人。(
197、2022年5月14日)。适应性 智能体、智能和新兴人类组织:通过基于智能体的建模捕捉复杂性。美国国家科学院院刊:https:/www.pnas.org/doi/epdf/10.1073/pnas.092078899 9.Siri。(无日期)。SRI 国际:https:/ Schwab推出Schwab智能投资组合。(2015年3月9日)。BusinessWire:https:/ 星际争霸II 大师级玩家水准。DeepMind Research:https:/ 推出首款AMR。The Robot Report:https:/ 和语音搜索的新支持功能。Axios:https:/ Company:ht
198、tps:/ 16.Adobe Firefly:释放你的想象力。(无日期)。Adobe。网站:https:/ 17.D.格林菲尔德(D.Greenfield)(2019年8月1日)。大众汽车应用生成式设计。Automation World:https:/ 18.N.德斯兰德斯(N.Deslandes)(2023年7月4日)。西门子携手Intrinsic 为中小企业提供基于人工智能的机器人技术。Tech Informed:https:/ Industries的人工智能软件MIRAI现可与FANUC机器人兼容。(2022年11月30日)。A:https:/www.automa- 智能体技术展望202
199、4|AI拐点:重塑人类潜力20.V.登切瓦(V.Dencheva)(2023年6月7日)。市场营销中的生成式AI统计与事实。Statista:https:/ 21.M.巴斯蒂安(M.Bastian)(2023年4月30日)。GPT-4 和AutoGPT如何为您省钱。The Decoder:https:/the- 23.ChatGPT插件。(2023年3月23日)。OpenAI:https:/ 24.J.彼得森(J.Peterson)(2023年7月31日)。ChatGPT插件新手使用指南。Lifehacker:https:/ 25.J.Wei和D.Zhou(2022年5月11日)。语言模型通过
200、思维链进行推理。谷歌研究:https:/ 26.J.Wei、X.Wang等人。(2022年1月28日)。思维链提示引发大语言模型中的推理能力。arXiv:https:/arxiv.org/abs/2201.11903 27.N.辛恩(N.Shinn)、F.卡萨诺(F.Cassano)等人(2023年3月20日)。Reflexion:带语音强化学习功能的语言智能体。ArXiv:https:/arxiv.org/abs/2303.1136628.CyberNews。(2023年6月)。AutoGPT是什么?2分钟简介。YouTube:https:/ 29.S.帕塔萨拉西(S.Parthasarat
201、hy)(2023年5月10日)。认识BabyAGI 可简化任务的自动智能体。TowardsAI:https:/ 30.苏姬。(2023年6月2日)。VOYAGER:使用大语言模型技术彻底改变 Minecraft中的终身学习。Medium:https:/ 31.G.Wang、Y.Xie等人。(2023年5月25日)。Voyager:一个具有大语言模型的开放式具象智能体。ArXiv:https:/arxiv.org/abs/2305.1629132.上工具!DeepMind、普林斯顿和斯坦福大学的LATM令大语言模型自行 生成工具。(2023年5月31日)。Synced:https:/ Journ
202、al:https:/ 反馈的上下文学习改进语言模型协商。ArXiv:https:/arxiv.org/abs/2305.1014235.D.博伊科(D.Boiko)、R.麦克奈特(R.MacKnight)等人。(2023年4月11日)。大语言模型的新兴自主科研能力。ArXiv:https:/arxiv.org/abs/2304.05332 36.D.德瑞斯(D.Driess)和P.弗洛伦斯(P.Florence)(2023年3月10日)。PaLM-E:具象多模态语言模型。谷歌研究:https:/ 37.P.Xing(2023年8月5日)。MetaGPT:帮助软件公司实现自动化的多智能体框架。D
203、ataDrivenInvestor:https:/ 38.机器在企业网络数字身份中占比43%。(无日期)。Security Magazine:https:/ 39.T.达文波特(T.Davenport)和M.阿拉维(M.Alavi)(2023年7月6日)。如何使用公司数据训练生成式AI。哈佛商业评论:https:/hbr.org/2023/07/how-to-train-generative-ai-using-your-companys-data40.T.达文波特(T.Davenport)(2023年6月26日)。快速、廉价、可控:Morningstar的Mo中的生成式AI。福布斯:https
204、:/ 41.T.达文波特(T.Davenport)。(2023年3月20日)。摩根士丹利如何训练 GPT以帮助财务顾问的工作。福布斯:https:/ 42.A.任(A.Ren)、A.迪克西特(A.Dixit)等人。(2023年9月4日)。会求助的机器人:大语言模型规划的不确定性对齐。ArXiv:https:/arxiv.org/pdf/2307.01928.pdf空间计算1.莫顿海利格(Morton Heilig):VR发明者。(无日期)。南加州大学电影艺术学院:https:/ Police:https:/ 年4月7日)。降落伞事故如何助推增强现实技术。IEEE Spectrum:https:
205、/spectrum.ieee.org/histo-ry-of-augmented-reality5.物理、电子、数字。(无日期)。纽约大学:https:/kimon.hosting.nyu.edu/physical-electrical-digital/items/show/1518 6.S.格林沃尔德(S.Greenwold)(1995年6月)。空间计算。麻省理工学院:https:/acg.media.mit.edu/people/simong/thesis/SpatialCom-puting.pdf 7.S.Dredge(S.德莱基)(2019年9月28日)。Roblox面面观。卫报:ht
206、tps:/ 简史。哈佛商业评论:https:/hbr.org/2016/10/the-mainstream-ing-of-augmented-reality-a-brief-history9.T.沃伦(T.Warren)(2017年10月25日)。微软停止生产Kinect。The Verge:https:/ 智能眼镜谷歌眼镜的企业销售。CNBC:https:/ 12.J.克莱门特(J.Clement)(2023年8月7日)。截至2023年第二季度 宝可梦GO 应用全球下载量。Statista:https:/ 面向增强现实应用的iOS ARKit。The Verge:https:/ Verge:
207、https:/www.thev- 打造充满个性和趣味的“元宇宙”协作。Microsoft:https:/ 18.Apple Vision Pro简介:苹果的第一台空间计算机。(2023年6月5日)。苹果:https:/ Week:https:/ iPad评测:批评者的声音。PC World:https:/ 21.D.伯格(D.Pogue)(2010年)。两个视角下的iPad。纽约时报:https:/ 22.M.Young(2023年5月26日)。2023年虚拟房产价格暴跌,元宇宙“虚拟地产大亨”恐将破产。Be(in)Crypto:https:/ Labs去年 在VR和AR领域亏损137亿美元。
208、TechCrunch:https:/ Avatar:使用智能手机创建栩栩如生的头像。The Tech Outlook:https:/ 的免费应用程序现已上架iOS。The Verge:https:/ 26.Reid,E.(E.里德)(2020年2月5日)。15年绘制世界地图的历程回顾。谷歌:https:/blog.google/products/maps/look-back-15-years-mapping-world/27.USD简介。(无日期)。OpenUSD:https:/openusd.org/release/intro.html 28.通用场景描述。(无日期)。英伟达:https:/
209、 30.C.罗德(C.Loder)(2023年6月22日)。Apple Vision Pro开发者 软件入门。Apple Insider:https:/ 31.OpenXR。(无日期)。科纳斯:https:/www.khronos.org/openxr/32.D.高桥(D.Takahashi)(2023年7月3日)。OMA3为用户提供了在元宇宙中区块链游戏世界之间穿行的方式。Venture-Beat:https:/ 是多少?Sketchfab:https:/ 34.I.撒利安(I.Salian)(2023年6月1日)。数字文艺复兴:英伟达Neuralangelo 研究重构3D场景。英伟达:ht
210、tps:/ Spaces里程碑加速构建开放的XR开发者生态系统。(2023年5月31日)。高通:https:/ 37.I.凯梅尔马赫-席里哲曼(I.Kemelmacher-Shlizerman)(2023年6月 14日)。人工智能让虚拟试穿更加逼真。谷歌:https:/blog.google/products/shopping/virtual-try-on-google-generative-ai/38.S.席尔瓦(S.Silva)(2023年5月10日)。使用Google的Geospatial Creator在数分钟内创建世界级增强现实体验。谷歌:https:/develop- 39.设计未
211、来:如何在AR和VR中制作原型。(2023年1月19日)。Meta:https:/ AI:99%的游戏玩家为见证先进人工智能驱动的智能NPC的巨大潜力欢欣雀跃。(2023年2月15日)。美通社:https:/www.prnews- 42.情境网格。(无日期)。Inworld:https:/www.inworld.ai/#contextu-al-mesh 43.E.阿克曼(E.Ackerman)(2023年4月22日)。触觉系统打造无硬件的手指触感。IEEE Spectrum:https:/spectrum.ieee.org/finger-hap-tics 44.A.克斯利(A.Kersley)
212、(2023年4月11日)。凭借嗅觉翻越“恐怖谷”。连线:https:/ 3月3日)。探索巴黎圣母院辉煌重生的乐声。纽约时报:https:/ 功能,允许用户触摸按钮并在虚拟键盘上打字。The Verge:https:/ 49.G.布鲁姆斯坦(G.Blumstein)、B.茹科廷斯基(B.Zukotynski)等人。(2020年2月5日)。采用虚拟现实工具传授胫骨骨折髓内钉手术技术的 随机试验。美国国家医学图书馆:https:/www.ncbi.nlm.nih.gov/pmc/articles/PMC7351249/50.验证研究:触觉反馈经证实可助力优化外科手术教育。(2022年10月)。Fun
213、damental Surgery:https:/ Daily:https:/ 52.Unity与温哥华机场管理局合作运用数字孪生。(2023年6月19日)。XR Today:https:/ Studio将蓬皮杜艺术 中心变身为一只可弹奏的乐器。(2022年11月16日)。Snap:https:/ 54.M.珀迪(M.Purdy)。(2023年4月3日)。在元宇宙中打造卓越客户体验。哈佛商业评论:https:/hbr.org/2023/04/building-a-great-cus-tomer-experience-in-the-metaverse 55.菲亚特开设全球首家元宇宙展厅,掀动客户体
214、验的新变革。(2022年12月 1日)。Stellantis:https:/ 56.B.T.库玛拉维尔(B.T.Kumaravel)和B.哈特曼(B.Hartmann)(2022年 5月12日)。混合现实环境中跨维度协作的交互式混合维度媒介。Frontiers:https:/www.frontiersin.org/articles/10.3389/frvir.2022.766336/full 57.Gap联手Mattel:借助谷歌Geospatial Creator将时代广场变幻成芭比世界。(无日期)。Unit9:https:/ 58.澳大利亚电信、谷歌和埃森哲为漫威体育场打造由5G支持的增强
215、现实寻路体验。(2022年5月11日)。埃森哲:https:/ 59.增强现实技术助力手术成功已成为现实。(无日期)。埃森哲:https:/ 1.A.卡瓦拉-斯特纽克(A.Kawala-Sterniuk)、N.布罗瓦斯卡(N.Browarska)等人。(2021年1月3日)。脑机接口五十年历程回顾。美国国家医学图书馆:https:/www.ncbi.nlm.nih.gov/pmc/articles/PMC7824107/2.L.迪斯塔西(L.Di Stasi)和C.迪亚兹皮德拉(C.Diaz-Piedra)(2021年 1月14日)。重新审视航空领域的开创性眼动研究:连接过去与现在 Resea
216、rchGate:https:/ 3.D.斯派塞(D.Spicer)。(2021年6月9日)。从Audrey到Alexa再到Hal等。计算机历史博物馆:https:/computerhistory.org/blog/audrey-al-exa-hal-and-more/4.面部识别简史。(2022年5月12日)。NEC:https:/www.nec.co.nz/market-leadership/publications-media/a-brief-history-of-fa-cial-recognition/5.G.格洛弗(G.Glover)(2011年4月)。功能性磁共振成像概述。美国国家医
217、学图书馆:https:/www.ncbi.nlm.nih.gov/pmc/articles/PMC3073717/6.S.辛格尔顿(S.Singleton)(2000年7月11日)。“Cookie门”是如何瓦解的。卡托研究所:https:/www.cato.org/commentary/how-cook-ie-gate-crumbles7.A.卡瓦拉-斯特纽克(A.Kawala-Sterniuk)、N.布罗瓦斯卡(N.Browarska)等人。脑机接口五十年历程回顾。8.沃尔沃汽车推出新型“驾驶员疲劳警示系统”。(2007年8月31日)。沃尔沃汽车:https:/ 10.D.卡兹迈尔(D.Ka
218、tzmaier)(2012年4月9日)。三星智能互动:手把手 教你语音和手势控制。CNET:https:/ Research:https:/ X将启用面部识别技术替代Home键解锁屏幕。The Verge:https:/ 医疗集团新冠肺炎家庭监控计划的说明和早期结果。美国国家医学图书馆:https:/www.ncbi.nlm.nih.gov/pmc/articles/PMC8784054/16.智利的神经权利。(无日期)。智利神经权利基金会:https:/neuror-ightsfoundation.org/chile17.P.贝卢克(P.Belluck)(2023年8月23日)。30岁因中风
219、失语后,人工 智能帮她恢复说话能力。纽约时报:https:/ 8月23日)。应用于语音解码和虚拟形象控制的高性能神经假体。自然:https:/ Vision Pro的方法。UploadVR:https:/ 体验个性化与优化软件和服务收入。Statista:https:/ 26.M.卡伦巴赫(M.Karrenbach)、D.波(D.Boe)等人。(2022年1月)。利用 基于凝视的眼动追踪和深度学习改进假肢腕部的自动控制。ResearchGate:https:/ Driver自动驾驶系统。(无日期):https:/ 数字博物馆:https:/dl.acm.org/doi/10.1145/3568
220、162.357696532.A.Bremers(A.Bremers)、A.帕布斯特(A.Pabst)等人。(2023年1月 27日)。利用社交线索识别人机交互任务失败:当前研究综述与未来方向。ArXiv.org:https:/arxiv.org/abs/2301.1197233.Blackrock Neurotech与Phantom Neuro联手研发可实时模拟人类动作的假肢和外骨骼。(2022年4月26日)。美通社:https:/ Bioelectronics为类风湿 性关节炎患者植入首个用于刺激脾脏神经的神经刺激器。MedCity News:https:/ 植入初创公司正在人类身上试验意念
221、控制计算。CNBC:https:/ 36.S.斯特莱普(S.Stripe)(2021年8月14日)。脑机接口今年取得重大进展。VentureBeat:https:/ 的深度神经网络模型。Science-Direct:https:/ 神经网络入门指南。Towards Data Science:https:/towardsdata- 学到了什么,未来会怎样?美国国家医学图书馆:https:/www.ncbi.nlm.nih.gov/pmc/articles/PMC8952790/42.穿戴式感测DSI-24。(无日期):https:/ 22日)。Med-Tech News:https:/www.m
222、ed- 传感器系统,可测量用户大脑的生物信号和电波活动。Patently Apple:https:/ 智能芯片潜力股。这一次并非关于云。巴伦周刊:https:/www.bar- 反应的EEG分类。arXiv.org:https:/arxiv.org/pdf/2202.03265.pdf50.埃森哲。(2023年)。内部访谈。51.S.奈特(S.Knight)(2023年2月20日)。Switchback VR采用眼动追踪 技术,每次眨眼都会让游戏画面恐怖升级。TechSpot:https:/ Newell)针对 游戏中的脑机接口制定了雄心计划。The Verge:https:/www.thev
223、- 率高达80%。Cornell Chronicle:https:/news.cornell.edu/sto-ries/2022/10/algorithms-predict-sports-teams-moves-80-ac-curacy54.P.麦克卢尔(P.McClure)(2023年3月21日)。新型石墨烯传感器让脑机 接口更趋于完美。New Atlas:https:/ 制造商NextMind。TechCrunch:https:/ 年11月19日)。您准备好在工作场所接受大脑 扫描了吗?IEEE Spectrum:https:/spectrum.ieee.org/neuro-tech-wo
224、rkplace-innereye-emotiv58.欧莱雅与全球神经技术领导者EMOTIV合作推出新设备,帮助消费者个性 化选择香水。(2022年3月21日)。Emotiv:https:/ Technologies(无日期)。LinkedIn:https:/ Technologies(无日期)。AutoSens:https:/auto- 帮助工人保持清醒?Equipment World:https:/www.equipment- 62.M.希普曼(M.Shipman)(2023年4月28日)。未来已来:与伦理、政策 和脑机接口的角力。美国北卡州立大学新闻:https:/news.ncsu.ed
225、u/2023/04/ethics-brain-computer-interfaces/63.E.斯特里克兰(E.Strickland)(2021年12月18日)。全球神经权利运动 首次获胜。IEEE Spectrum:https:/spectrum.ieee.org/neuro-tech-neurorights64.智利神经权利基金会。(无日期):https:/neurorightsfoundation.org/65.政策。(无日期)。智利神经权利基金会:https:/neurorightsfounda-tion.org/policypage关于埃森哲埃森哲注册于爱尔兰,是一家全球领先的专业服
226、务公司,致力于帮助全球领先企业、政府和各界组织构建数字核心、优化运营成本、加速营收增长并提升社会服务水平,实现快速且规模化的价值创造。埃森哲是财富世界500强企业之一,目前拥有74.2万 名员工,服务于120多个国家的客户。我们以卓越人才和创新引领为核心,引领全球技术变革。凭借在云、数据和人工智能方面深厚的行业经验、独特的专业技能、强大的生态协作网络以及翘楚全球的一体化交付中心,我们为客户提供战略&咨询、技术服务、智能运营、工业X和Accenture Song等全方位服务。基于卓越的服务能力、共享成功的企业文化,以及创造360价值的承诺,我们帮助客户实现企业全面重塑,并建立长久互信的合作关系。
227、同时,埃森哲以360价值衡量自身,为客户、员工、股东、合作伙伴和整个社会创造美好未来。埃森哲在中国市场开展业务37年,拥有一支约1.6万 人的员工队伍,分布于北京、上海、大连、成都、广州、深圳、杭州、香港和台北等多个城市。作为可信赖的数字化转型卓越伙伴,我们不断创新、积极参与商业和技术生态建设,致力于帮助中国的企业和组织把握数字化机遇,通过战略制定、流程优化、技术赋能,实现高质量发展。详细信息,敬请访问埃森哲公司主页 关于埃森哲技术研究院埃森哲技术研究院通过先进技术研发和商业应用,将趋势预判、创新孵化和概念验证等成果带给客户,助其驾驭技术、商业和社会的重大变革。我们由技术和研究人员组成的专门团队与企业领导者精诚合作,投资、孵化并交付突破性的创意及解决方案,激发企业发展新动能。埃森哲技术研究院全球共有6所,分别设在:美国加利福尼亚州旧金山、华盛顿、爱尔兰都柏林、法国索菲亚-安提波利斯、以色列特拉维夫和及印度班加罗尔、同时在全球还设有多个创新点。技术研究院同埃森哲位于全球35个国家、92座城市的近400座创新中心、工作室和卓越中心所组成的庞大网络展开广泛合作,为各地客户输送尖端研究成果、行业洞察和解决方案。欲了解更多信息,请访问