中国信通院:2025高质量数据集建设指引(53页).pdf

当前位置:首页 > 报告详情
中国信通院:2025高质量数据集建设指引(53页).pdf

上传人: 山海 编号:890701 2025-09-02 53页 1.04MB

下载:
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据《高质量数据集建设指引》,全文主要内容概括如下: 1. **人工智能发展背景**:人工智能作为引领新一轮科技革命的战略性技术,数据作为核心要素,其重要性日益凸显。 2. **高质量数据集定义**:指经过处理可直接用于人工智能模型开发的数据集合,包括特征、标签、元数据和样本。 3. **数据集分类**:按数据模态、模型阶段和行业应用分为单/多模态、预训练/微调/评估、通识/行业通识/行业专识。 4. **应用需求**:分为基础认知层、场景理解层、行动规划层,对应建立认知、解析场景、规划行动。 5. **建设现状**:全球和我国均呈现加速发展态势,欧美在开放共享、标准体系、平台化建设方面领先,我国在区域和行业层面并进发展。 6. **建设方法**:场景驱动和数据驱动两种模式,核心环节包括数据需求、规划、采集、预处理、标注、模型验证。 7. **核心技术**:数据采集、转换、清洗、特征选择、标注等。 8. **质量评价**:构建涵盖说明文档、数据质量、模型应用三个维度的评价指标体系。 9. **运营体系**:体系规划、工程建设、运营管理,包括用户需求响应、成本管理、质量与安全维护、生态协同发展。
揭秘高质量数据集" 如何打造高质量数据集?" 高质量数据集建设指南"
客服
商务合作
小程序
服务号
折叠