《中科闻歌:2025年人工智能技术发展与应用探索报告(61页).pdf》由会员分享,可在线阅读,更多相关《中科闻歌:2025年人工智能技术发展与应用探索报告(61页).pdf(61页珍藏版)》请在三个皮匠报告上搜索。
1、人工智能技术发展与应用探索北 京 2 0 2 5 年 2 月王 磊中国科学院自动化研究所 研究员中科闻歌 董事长目 录01人工智能技术发展02Deepseek认知与影响03AI+金融实践案例04创业介绍中科闻歌01人工智能技术发展ChatGPT揭开通用人工智能序幕弱人工智能 强人工智能1956-19701970-20102010-20202021-2035会看会听会说会学习会行动“如何用机器模拟人的智能”196020102024发展和应用迭代加速大模型优势特点与不足通顺全领域通识知识体系覆盖通畅的人机交互意图识别及逻辑推理通顺自然语言生成多种自然语言场景通用通识通用通畅1、静态模型不产生知识2
2、、不能理解领域的复杂问题3、模型原理导致幻觉或常识性错误4、大模型安全,可能包含仇恨、有害或危险内容优势不足ChatGPT不是基础科学突破,是工程积累奇迹大模型技术大集成(智力密集工程)人机协同群体智慧(人力密集工程)大数据加大算力(算力密集工程)大模型:智力密集型工程ChatGPT学习方法:先量后质的分阶段学习阶段一:泛学(学习多样文本)让鹦鹉听收音机各种节目学说话100+语种文本编程语言网站问答人文社科科技文献新闻娱乐ChatGPT掌握海量知识无监督学习拥有海量知识回答不受约束阶段二:矫正(遵循人类指示)监督学习理解指令要求对话模板有限阶段三:拟人(符合人类偏好)基于人类反馈的强化学习人类
3、教导鹦鹉该怎么说话ChatGPT请问如何撬锁偷邻居东西?撬锁是违法的,不建议这样做。优质对话范例矫正用对话模板矫正ChatGPT无法产生创新性回答提问回答的好回答的差奖励惩罚自由发挥生成人类偏好的创意回答ChatGPT什么是苹果?呵呵苹果是一种可以吃的东西苹果是营养水果,素有水果之王的美誉-5-13递归神经网络卷积神经网络自编码器变分自编码器自回归模型对抗生成网络强化学习Word2vecTransformer架构预训练语言模型ChatGPT:智力密集型工程数据增强技术去噪扩散模型大模型:人机协同群体智慧无监督学习监督学习强化学习GPT3.5ChatGPT阶段一:泛学(学习多样文本)阶段二:矫正
4、(遵循人类指示)阶段三:拟人(符合人类偏好)人工整理多来源海量优质数据集人工撰写大量对话模板人工标注答案得分ChatGPT:OpenAI在拉丁美洲和东欧等地区招募了约1000名远程外包员工进行数据标注ChatGPT:人力密集型工程大模型:大数据与大算力2022年GPU卡销售约5万张价值约40亿美元140万美元/次微软Azure计算平台支持2022年一年计算和数据费用支出为4亿美元训练成本推理成本约3万片英伟达A100GPU同时计算4千台服务器,共8亿美元用电量60万kwh/天,电费5万美元/天(26万中国人一天的用电量)ChatGPT:算力密集型工程GPT11.2亿参数5GB数据GPT2Cha
5、tGPTGPT415亿参数40GB数据参数规模提升100倍数据规模提升1000倍1750亿参数45TB数据8000亿个单词的语料库英伟达发布ChatGPT专用核弹级GPU DGX H100大语言模型应用迭代路径执行智能决策智能感知认知智能大语言模型多模态大模型控制/决策大模型人工智能代理(Agent)大模型+插件+执行+思维链大模型应用两大误区误解体现大模型工具化l 局限于聊天、写作类常规文案应用;与核心业务脱节l AI+,就是部署大模型和微调大模型大模型神化l 大模型黑箱化,直接端对端解决重大应用问题l 一个大模型包打天下,无所不能AI+行业落地三步曲数据工程模型工程领域工程STEP 2ST
6、EP 1STEP 3高质量领域数据治理继续预训练、多模型适配指令微调、回馈学习、应用研发大模型应用到行业领域关键挑战:静态模型与动态数据的不匹配分析挑战需求特征本质技术支撑信息庞杂、动态化快线索数据海量跨模态信息检索深度认知分析难深精细数据窄域专用智能本源规律趋势预测难活未来数据通用人工智能AI+行业数智化路径思考:先升级、再泛化、后革新14抓手与支撑:打造领域大模型l积累通域+领域数据、模型规模适中、从头训练l前瞻性定义领域大模型与业务系统标准接口,多型共进,形成MoE(混合专家模型)生态,严格把好内容安全关,连续测试升级赋能:现有系统和业务小模型,点上赋能l数据分析、知识积累l分析深度+高