1、人工智能新进展与金融应用实践白 硕|恒生电子白 硕恒生电子副总裁、首席科学家恒生电子副总裁、首席科学家。本科就读于清华大学计算机系,硕士、博士研究生就读于北京大学计算机系。曾任中科院计算所研究员、博士生导师、软件室主任、软件方向首席科学家。在任上海证券交易所总工程师十余年,主导了上交所新一代交易系统的上线。目 录CONTENTSI.AI及大模型原理II.近期态势与思考III.金融场景分析IV.未来展望AI及大模型原理PART 01AI基本流派沿革符号路线统计路线神经路线1950s1990s2010s无法定义的,靠示例无法示例的,靠“读书”靠定义大模型发展路线从左到右,对话/写作文/阅读理解Tr
2、ansformerGPTGPT2GPT3InstructGPTGPT3.5BertRoBERTa20172018.062019.112020.052022.012022.11.3020182019attention is all you needChatGPT上下文双向,完形填空语言模型是什么-文字接龙Eg.如何开通00.020.040.060.080.10.120.140.16帐户股票概率语言模型不完整的句子输入对话搜索合同处理研报处理NL2SQL用户预期可用对话搜索合同处理研报处理NL2SQL识别更准,效果更好,成本更低从烟囱到平台G P T生成式预训练AI右勾拳易定义难定义易计算难计算玩
3、具系统专家系统语音识别图像识别围棋自然语言chat编程深推理智能体为什么是大“语言”模型?我的语言的边界就是我的世界的边界。你能理解多复杂的语言,就能运行多复杂的程序。如果通过语言对话无法判断对方是人还是机器,那么它就被认为有智能。维特根斯坦图灵乔姆斯基语言-知识-逻辑语言 数据密度很高 较容易“大力出奇迹”知识 数据密度一般 需要大算力 投入回报逻辑 数据密度很低 需要另辟蹊径 强化学习恒生如何拥抱AI基础设施算力采购数据准备前期积累:OCR、智能客服、产业链/权益链知识图谱场景打造全员发动(各业务域)专业深耕(恒生研究院)与标杆客户共创组织体系公司级战略投入(三大战役)内(研发提效、客服提
4、效)外(场景落地)兼修纵向(金融垂域)横向(AI共性技术)深度洞察恒生AI落地十字方法论长在业务系统和业务数据上接受来自业务的闭环检验实时、精准、可溯源业务描述文档要清晰、规范、大模型可读桩闭环活数据双向奔赴Gartner 技术趋势-chatAPI恒生观点:活数据-通过fuctioncall连接API更靠谱近期态势与思考PART 02123美国总体上领先于中国但中国的差距越来越小(头部)闭源领先于开源但开源也显现“后发、众智”优势通用领域先于垂域但垂域私部署仍有存在意义三个基本判断注:1)左上图来源于Harm de Vries.In the long(context)run.16 Sep.20
5、23;2)左中图来源于Zhang D,et al.Mm-llms:Recent advances in multimodal large language models.2024;3)左下图来源于OpenAI.Reasoning models.OpenAI Platform。O3又有大幅提升13更长上下文在整体算力成本不变的情况下,很多模型所支持上下文长度已超过128k更多模态输入/输出不限于文本、图像、语音、点云等多种模态,且已达到较高准确率更深思考OpenAI o1模型和DeepSeek r1模型,在预训练得到的快推理能力基础之上,增加了通过整合强化学习得到的慢推理能力2基础模型:技术持续
6、进步,能力不断向纵深发展“裸模”无法支撑真实的金融业务把业务数据和系统接上去才是正解训进去知识就陈旧了训进去就有了幻觉改错需要重新训练需要庞大的训练算力有可能破坏原有的模型只跟大模型打交道永远可以接最新的知识永远可以是确定性的改错只需定点修复只需合理的推理算力保持原有模型能力稳定需要大模型与活数据交互vs.不要对“裸模”期望过高应用价值提升效率流程自动化价值创造推动用户/收入增长深度决策提升投资收益、降低风险概 述通过机器学习和深度学习,进行代码生成与优化、代码分析与调试AI能够自动化后台任务,包括数据管理、对账和报告生成,同时确保合规性AI解决方案显著减少手动和重复性任务AI具备强大的数据分