当前位置:首页 > 报告详情

对大模型训练数据安全治理的思考-王峥.pdf

上传人: 哆哆 编号:630988 2025-04-19 11页 1.46MB

目 录CONTENTS训练语料的安全机制对数据安全治理新模式的思考02.03.大模型训练需要哪些数据?必须澄清的误解:模型训练并不依赖个人信息训练语料的安全机制各时代人工智能风险的演进和迭代:AI时代的风险识别安全是大模型的核心竞争力,阿里巴巴治理的思路与核心技术对数据安全治理新模式的思考从模型视角看训练数据的安全治理训练阶段对数据的使用特点:个人信息:模型训练阶段不依赖个信,对公开个信属于合理使用 版权数据:对版权类语料属于转换性使用,是为了掌握客观规律,构建模型的基础能力,并不是复制式拷贝,属于合理使用治理思路的变迁:重视数据的可及性:输入端的前置使用限制 输出端的管控和事后救济 提升数据的供给:鼓励安全类数据集的开放共享 新技术的应用提升安全性:如合成数据对个信的保护

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
客服
商务合作
小程序
服务号
折叠