《小规模高质量的推理数据解码下一代AI训练的黄金法则.pdf》由会员分享,可在线阅读,更多相关《小规模高质量的推理数据解码下一代AI训练的黄金法则.pdf(22页珍藏版)》请在三个皮匠报告上搜索。
1、 小规模高质量的推理数据,解码下一代AI训练的黄金法则演讲人:蚂蚁数科-蔡健生高质量推理数据成为行业新范式高质量推理数据成为行业新范式推理数据在金融场景的探索推理数据在金融场景的探索生产车间生产车间-智能标注智能标注效果保障效果保障-智能质检智能质检AIGDAIGD:AIAI数据合成与生产技术平台数据合成与生产技术平台01高质量推理数据成为行业新范式高质量推理数据成为行业新范式第一章节 高质量数据是发挥AI倍增效应的基础推理模型已经占据半壁江山Open AIDeepSeekGoogle推理模推理模型型高质量推理数据(CoT数据)或将成为行业新范式大规模语料大规模语料 +高质量标注数据集高质量标
2、注数据集强化学习合成强化学习合成CoTCoT数据数据小规模、超高质量小规模、超高质量长长CoTCoT数据集数据集01推理数据在金融场景的探索推理数据在金融场景的探索第二章节 金融推理数据是关键因素高质量金融长高质量金融长CoTCoT数据集,数据集,决定金融决定金融R1R1时刻到来的关时刻到来的关键因素键因素“”基于因果推断技术的金融长CoT数据实践金融金融CotCot数据训练的金融推理模型,较非推理模型在同一个金融测试集预计提升数据训练的金融推理模型,较非推理模型在同一个金融测试集预计提升8%10%8%10%关键技术:反事实金融CoT合成扩充预计扩充有效长预计扩充有效长CoTCoT数据数据75
3、%75%更好的引导模型更好的引导模型学习因果关系学习因果关系01生产车间生产车间-智能标注合成智能标注合成第三章节 人机智能协同的标注模块预标预标AgentAgent预计预计降低降低60%60%人工标注人工标注陪练陪练AgentAgent预计预计缩短缩短70%70%培训周期培训周期针对长CoT的智能标注平台人机协同的人机协同的长思维链标注能力长思维链标注能力01效果保障效果保障-智能质检评估智能质检评估第四章节 全模态全流程的数据质检和评估百多个质检算子,百多个质检算子,十多种垂类数据集十多种垂类数据集的质检套件的质检套件面向主流Benchmark的效果评估大规模训练数据通大规模训练数据通过下
4、游任务实验确过下游任务实验确保数据集有效性保数据集有效性01AIGDAIGD:AIAI数据合成与生产技术平台数据合成与生产技术平台第五章节 AIGD:AI数据合成与生产技术平台大规模大规模PB级数据级生产高效率高效率全流程自动化率80%+全模态全模态音、视、图、文、序列、表格行业长思维链数据行业长思维链数据提升智能体应用上提升智能体应用上限限高质量垂类数据集高质量垂类数据集支撑智能体应用下支撑智能体应用下限限长思维链技术驱动金融智能体决策革命思维链将催生金融智能体从思维链将催生金融智能体从“自动化工具自动化工具”进化为进化为“智能决策伙伴智能决策伙伴”嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻嘻演讲人:蔡健生