《商汤:2023大模型伦理原则与实践白皮书-日日新思无邪(33页).pdf》由会员分享,可在线阅读,更多相关《商汤:2023大模型伦理原则与实践白皮书-日日新思无邪(33页).pdf(33页珍藏版)》请在三个皮匠报告上搜索。
1、1 日日新日日新,思无邪,思无邪 商汤大模型伦理商汤大模型伦理原则与原则与实践实践白皮书白皮书 商汤人工智能伦理与治理委员会 人工智能伦理治理年度报告(2023)商汤智能产业研究院、上海交通大学计算法学与 AI 伦理研究中心联合出品 2 目录 致大模型从业者的一封信:人类普适价值观,驱动 AI 伦理“三维对齐”.3【关于商汤】.6【关于本报告】.8 一、生成式人工智能浪潮下的范式变革.9 二、生成式人工智能风险管理一项紧迫的议程.11 三、生成式人工智能治理原则基于现实的考量.13 四、生成式人工智能治理实践“商汤日日新 SenseNova”治理案例.18 五、生成式人工智能治理基础设施商汤“
2、SenseTrust”工具体系.24 六、生成式人工智能治理的发展避免陷入“失控的竞赛”28 3 致大模型从业者的一封信致大模型从业者的一封信:人类普适价值观,驱动 AI 伦理“三维对齐”图 1:“三维对齐”科技伦理模式 人类经济文明之树上“低垂的果实”已被采摘一空,新一代创新人类经济文明之树上“低垂的果实”已被采摘一空,新一代创新科技犹如“新的进化梯子”,帮助人类采摘到“更高的果实”科技犹如“新的进化梯子”,帮助人类采摘到“更高的果实”。联合国常务副秘书长阿明娜穆罕默德女士在 2022 年联合国可持续发展高级别政治论坛上说:“新冠疫情、冲突以及环境危机造成的挑战已经影响到教育、医疗保健、性别
3、平等以及经济发展。她指出,2030 年议程的时间表已经过半,但“我们还没有完成一半的任务”。为此,全球需要在可再生能源、粮食体系和数字连接领域进行转型,加快“人力资本投资,为机遇融资”的步伐,进而化危为机。”而以人工智能为代表的新一代科技,即能为人类持续提升环境治理能力,带来新能源、新农业、新制造与新商业,又能通过科技伦理在一定程度上弥补“数字鸿沟”,创造新兴就业市场,实现各国经济结构的转型升级,4 正如丘吉尔的名言:“决不要浪费一场好的危机(Never waste a good crisis)”。人机对齐,人机对齐,以保障以保障 AIAI 任务目标任务目标与人类用户意图与人类用户意图对齐对齐
4、、AIAI 伦理与伦理与人类价值观人类价值观、社会风序良俗、社会风序良俗、法律政策法律政策对齐对齐。麦肯锡全球研究院(McKinsey Global Institute)说,人工智能正在促进社会发生转变,这种转变比工业革命“发生的速度快 10 倍,规模大 300 倍,影响几乎大 3000 倍。”为了保证 AI 大模型产品全生命周期的人机对齐,应持续识别发现训练数据集、应用场景的偏差风险,并设计风险内控检查表与管理流程,并在 RLHF(基于人类反馈的增强学习)的测试、使用过程中,形成反馈闭环,修正问题、增补风险项、完善高阶伦理原则。正如人类的价值观是经过历史、文化、社会活动、产业革命逐步变化形成
5、,从 AIGC 到 AGI 的伦理秩序同样需要持续改进与发展。人人对齐,是充分考虑世界不同种族文化差异、区域经济差异、人人对齐,是充分考虑世界不同种族文化差异、区域经济差异、国家社会发展阶段的不同,跨越文明形态、地缘分歧,形成普惠全人国家社会发展阶段的不同,跨越文明形态、地缘分歧,形成普惠全人类的互相尊重、包容、理解的统一价值观体系类的互相尊重、包容、理解的统一价值观体系。哈佛大学教授塞缪尔亨廷顿在文明的冲突一书中,根据历史发展将世界分为八大文明板块,分别拥有不同的文化价值观。农业时代、工业时代、信息时代,人类价值观的分歧长期存在、并变化演进,伴随人工智能技术进入千行百业、拥有了数亿用户群体,
6、跨洲际 AI2.0 服务、跨国科研合作形成了很好的生态产业链、开放开源社群,急需一种普适全人类的价值观指引。联合国秘书长古特雷斯于 2021 年 9 月发布了我们的5 共同议程报告,面向政府、联合国系统、私营部门(含科技公司)、民间社会、基层组织、学术界和个人,提出全球数字契约,该契约将成为“所有人共享开放、自由和安全的数字未来的共同原则”,涵盖的领域包括:数字连接、避免互联网碎片化、为人们提供将如何使用其数据的选择、网络人权,以及通过引入对歧视和误导信息问责标准促进可靠的互联网内容。该契约有望在 2024 年形成全球初步共识,并为人人对齐形成统一框架。人类、人类、科技与环境对齐,科技与环境对