1、应用与安全并重用数据要素+人工智能推动产业高质量发展范渊单位职务:浙江数字经济百人会执委、安恒信息董事长2024年5月18日数据要素X行动背景在实践中提炼出的成功经验形势预判或对策建议“数据二十条”发布2022.12.19中共中央、国务院发布“数据二十条”初步形成我国数据基础制度的“四梁八柱”“数据要素X”三年行动计划发布国家数据局发布数据要素 X“三 年 行 动 计 划(2024-2026),就”数据要素X“的12个领域做出原则性部署,推动数据要素与其他要素相结合,催生新产业、新业态、新模式、新应用、新治理2023.12.15发展新质生产力推动高质量发展中共中央政治局就扎实推进高质量发展进行
2、第十一次集体学习,习近平总书记在主持学习时强调发展新质生产力推动高质量发展2024.2.01数据资产不清数据合规问题分类分级不当数据要素X专门机构资产入表战略跨域流通受限主体互不信任隐私信息泄露企业惧用数据市场难寻数据政府难管数据*数据来源于IBM Cost of a Data Breach Report 2022医疗行业平均每次数据泄露事件损失$1010万美元全球平均每次数据泄露事件损失$435万美元金融行业平均每次数据泄露事件损失$597万美元全球平均每次数据泄露事件泄露数据量25,575条记录,超过一个7B模型盘点数据资源界定数据权属确定流通范围评估资产价值0102数据资产化数据分类分级
3、三大困境静态结果难以应用于动态场景人工复核门槛高、难度大工具识别受制于数据质量和规则库百亿级参数和海量行业知识实现业务语义识别和关联推理业务视角的表和字段注释方便人工复核时的理解研判交付速度和交互方式跨越式提升推动“一场景一标签”的实现同等数据规模600人天20人天效率提升倍+30AI数据分类分级成都大运会2023.72023.8.282023.9恒脑能力提升200%效率提升230%发现疑似APT组织行为的高级威胁29个降低了ITCC 57%的人力资源投入日均处理告警数人工120万个500个AI市人社局单击输入标题内容区税务局区统计局交通银行招商证券企业参保数据个人参保数据企业税务数据企业登记
4、数据前置机本地加密数据授权用户清单前置机本地加密数据授权用户清单前置机本地加密数据企业用水用电数据前置机本地加密数据网格数据E慧民普惠金融线上产品线上产品企业信用预防选址服务数据参与方区政数局数据参与方安恒信息隐私计算本地加密SDK本地加密SDK企业真实性核实清单企业经济普查、准四上企业清单识别洗钱风险客户企业信用风险值、选址位置点信用枚举值对内供数对内供数业务栈账户管理数据管理任务管理安全审计模型管理硬件栈软件栈模型开发方计算集群服务器大模型开发环境TensorFlow、PyTorch、PaddlePaddleGPU-TEE 可信执行环境5.数据导入模型应用加密通道传输异构加速模型算法原始数
5、据CPUGPU模型算法原始数据CPU-TEE 可信执行环境数据加解密计算摘要存证算力存储2.合约申请3.合约审批4.模型开发6、模型计算结构化感知网络安全智能风控医疗咨询辅助诊断大数据分析智能问答量化交易运营商金融医疗生物教育城市大脑智能客服新闻采编内容剪辑传媒分子生成智能教学城市商业文案代码开发办公平面广告内容推荐网站制作内容搜索文档写作编程设计搜索文档摘要营销精准获客调研报告通用2B应用行业通用场景数据场景化2B应用行业生产场景核心数据7、结果生成结构化数据非结构化数据模型数据加密数据标注数据1.数据本地加密上传加密数据标注数据加密数据原始数据加密数据标注数据加密数据原始数据自2023年8
6、月23日“中国数谷”夏季峰会上“数据合规流通数字证书”首次发布,至2024年3月,已开出273张“数据发票”供得出用的好流得动AI数据分类分级全流程数据安全管控隐私计算数据治理区块链 政府加大投入和扶持,鼓励以行业龙头或者具备产业链链主功能的企业参与“行业大模型与数据协同创新中心”,在确保安全和可控的情况下让数据供得出、流得动,聚集行业专家专门研究让数据“用的好”进而推动产业高质量发展 对于应用成效已明显呈现的数据应用和行业大模型,政府可组织考察、验收、体验,并以多种形式进行