1、ML-SummitML-Summitwww.cpp-www.ml-summit.orgwww.gosim.orgwww.pm-summit.orgML-SummitML-SummitML-SummitML-SummitML-SummitML-Summit陈陈奕奕名名 恒恒生生电电子子研研究究院院算算法法团团队队负负责责人人北京中科院自动化所博士后&加拿大McGill大学访问学者,主要研究方向为NLP、计算机视觉、边缘计算等。获得2022年CCF(中国计算机学会)动作识别类算法比赛冠军,Kaggle国际算法image caption matching比赛冠军,并受邀于人工智能A类顶会ICLR20
2、22做专项分享。参与并完成国家级海洋项目1个。发表国际顶尖学术论文10余篇,授权专利20余篇。曾担任清华大学专项项目导师;东北大学、新东方、泰策科技等多家高校(企业)等课外导师。演演讲讲主主题题:金金融融领领域域大大模模型型应应用用技技术术瓶瓶颈颈与与突突破破ML-SummitML-Summit2025 全球机器学习技术大会金融领域大模型应用技术瓶颈与突破恒生研究院-陈奕名ML-SummitML-Summit目录CONTENTS大模型近期发展金融超长表格问答大模型能力提升其他场景的突破与研究ML-SummitML-Summit大模型近期发展01ML-SummitML-Summit随着人工智能技
3、术的发展,大型语言模型在2025年迎来了新一轮的技术革新与应用扩展。从增强的推理能力到多模态功能的突破,再到效率与成本的优化,LLMs正以前所未有的速度重塑自然语言处理、代码生成以及跨领域智能交互的格局。在这一背景下,DeepSeek R1等新兴开源模型的崛起,不仅挑战了传统商业巨头的支配地位(如OpenAI的o1系列),还通过低成本和高性能推动了AI技术的民主化趋势。与此同时,Google 和 OpenAI 等公司也在多模态与推理能力上持续发力,预示着LLM技术生态的多元化发展。发展时间线ML-SummitML-Summit在推理能力方面,OpenAI的o1模型引入了“长思考”(long t
4、hinking)机制,使模型在生成回答之前进行更深入的推理,从而提高回答的准确性和深度。这种方法使模型能够提前规划推理任务,执行一系列中间推理步骤来协助解决问题,但代价是需要额外的计算资源和更长的响应时间推理能力的提升ML-SummitML-Summit2024年12月,DeepSeek发布了DeepSeek-V3模型,该模型采用混合专家(MoE)架构,实现了高性能与高效率的结合。相较于前代产品,DeepSeek-V3的生成速度提升了3倍,每秒可处理60个token,显著提高了实际应用中的效率。此外,该模型在数学能力测试中超越了当时所有的开源和闭源模型,展现了出色的推理能力。模型架构的创新ML
5、-SummitML-Summit2025年1月,DeepSeek进一步推出了DeepSeek-R1模型,专注于数学、编码和逻辑等复杂任务的推理能力。该模型在后训练阶段大规模使用了GRPO强化学习技术,在仅有少量标注数据的情况下,极大提升了模型的推理能力。在数学、代码和自然语言推理等任务上,DeepSeek-R1的性能与OpenAI的o1模型相当。训练方法的改进ML-SummitML-Summit2025年3月,谷歌推出了其最新的大型语言模型Gemini 2.5 Pro。该模型在多个基准测试中表现出色,超越了包括Grok-3和GPT-4.5在内的其他模型。最新SOTA模型ML-SummitML-
6、SummitLLM综述ML-SummitML-SummitLLM带来的技术变革ML-SummitML-SummitLLM演变ML-SummitML-Summit金融大模型应用中,哪些技术测的痛点呢?ML-SummitML-Summit金融超长表格问答02ML-SummitML-Summit投研、投顾、承销保荐、监管审核等业务中的招股说明书关键要素招股说明书借表格规范披露信息,利于审核。问答多聚焦表格,故超强表格处理能力对投研、投顾招股说明书借表格规范披露信息,利于审核。问答多聚焦表格,故超强表格处理能力对投研、投顾业务举足轻重。业务举足轻重。表格类型表格类型说明说明资产负债表呈现企业财务状况,