1、长文本大模型推理实践长文本大模型推理实践以以 KVCache 为中心的分离为中心的分离式推理架构式推理架构演讲人:唐飞虎月之暗面 研发工程师 开发者关系负责人目录01长文本推理的瓶颈02长文本推理的优化0304上下文缓存的应用Mooncake 的实践长文本推理的瓶颈RAGPros.无需额外训练速度快成本低工程方案成熟可设计多级检索方案Cros.Embedding 召回效果直接影响模型回答效果无法。
2、面向面向AI研发语言模型训练的可解释性分析与验证研发语言模型训练的可解释性分析与验证林云上海交大计算机系副教授lin_Lin Yun|SJTU 2设计编程测试调试Lin Yun|SJTU 3EMNLP23,ISSTA24基于语言模型的代码编辑基于语言模型的代码编辑Lin Yun|SJTU 4FSE23,FSE21,ISSTA20基于语言模型的测试生成基于语言模型的测试生成LLMOptimized。
3、提升模型知识密度 做效的终端智能演讲:李海壁智能CEO&联合创始效模型 就是壁智能更快速度,更低成本 提供最优智能实现案效是种惯性,壁是模型前沿持续引领者发布 CPM-Bee 多语百亿模型,登顶ZeroCLUE发布智能体通平台 AgentVerse 发布多智能体协作开发框架 ChatDev,屡次登顶 GitHub Trending 发布超强 AI 智能体应框架 XAgent,全超越海外最。
4、书生书生 万象多模态大模型的万象多模态大模型的技术演进与应用探索技术演进与应用探索演讲人:王文海https:/ 4:1 李世乭德州扑克首次在多人复杂对局中超越人类2021人脸识别LFW识别率99%,超过人类20161000类,100万数据历史:“特定任务+大数据”取得巨大成功一个模型解决一个问题AlphaFold未来:“通用性”一个模型多种任务多种模态蛋白质结构预测准确率新高以视觉为核心的多模态。
5、硅基流动硅基流动高性能高性能大模型推理云实践大模型推理云实践陈凯陈凯2024-082024-08内容内容提纲提纲 大模型推理云背景大模型推理云背景 供给侧加速进化的大模型 需求测多样化的大模型需求 大模型推理云挑战大模型推理云挑战 大模型推理挑战 推理上云的挑战 大模型推理云实践大模型推理云实践 核心引擎建设 推理云平台建设 总结与回顾总结与回顾大模型推理云背景:加速进化的大模型能力大模型推理云。
6、娄一翎计算机科学技术学院复旦大学基于大模型的缺陷静态检测基于大模型的缺陷静态检测LLM-based StaticLLM-based Static BugBug Detection Detection StaticStatic BugBug DetectionDetectionSoftwareStatically analyzing the codeIdentifying bugs/vulnera。
7、大语言模型在大语言模型在法律领域的法律领域的应用探索应用探索演讲人:蔡华华院计算/大模型算法负责人CONTENTS目 录01技术背景02训练和评估03应用框架04应用案例法律大语言模型的相关背景1.1.法律大模型法律大模型|语言模型发展阶段语言模型发展阶段FOUR统计语言模型统计语言模型大规模语言模型大规模语言模型神经语言模型神经语言模型20世纪中叶开始发展,在七八十年代达到鼎盛2020年前后,。
8、大语言模型在计算机视觉领大语言模型在计算机视觉领域的应用域的应用演讲人:冯佳时目 录01背景介绍02基于LLM的图像理解03基于LLM的视频生成04总结展望背景介绍01计算机视觉的基本问题物体识别物体检测物体分割猫草地草地,猫猫,树,天空天空计算机视觉的基本问题图像生成视频生成3D生成大脑乘着火箭飞向月球大象戴着生日帽海底漫步图像和视频来自 Google Imagen黏土做的火车引擎LLM统一模。
9、1大语言模型的异构计算和加速戴金权(Jason Dai)英特尔院士23自回归大语言模型(基于Transformer解码器架构)Transformer解码器架构自回归大语言模型:预测下一个token4Transformer解码器架构训练;推理(第一个token/Prefill)5Transformer解码器架构推理(下一个token/Decode)6大语言模型推理和训练瓶颈内存带宽计算显存大小分布。
10、模型辅助需求代码开发 演讲:路宁 探索提升核编码任务成效果的法 录模型辅助开发态开发真实需求的挑战切换到知识产和消费的思维框架依赖经验知识的编码任务实验 知识分类及提词框架 模型辅助开发的实形态 模型辅助开发态-任务全貌 利模型的模式:模型辅助开发态-主任务相关应现状 搓模型 模型辅助开发态-了解测评背后的任务 任务是JS开发个Web Server 得出结论-效率提升55%较为独的函数级任务 G。
11、Advanced RAG Techniques with LlamaIndex演讲人:Pierre-Loic Doulcet-pierrerunllama.aiFunding AI Engineer LlamaIndex.aiCONTENTS目录01LlamaIndex?02Naive RAG03Advancing RAG04Agentic RAGLlamaIndex:Context Augme。
12、Smart EV Smart EV 和和 AIAI蔚来的思考与实践蔚来的思考与实践演讲人:李斌截至2024年7月底,蔚来在售车型累计交付557,518台2024年1至7月,蔚来在30万以上高端纯电市场占有率超过69%南京 Nanjing 2016.4Hefei 合肥2016.7深圳 Shenzhen 2021.11北京 Beijing 2016.12上海 Shanghai 2015.3Singa。
13、大模型在推荐系统中的大模型在推荐系统中的落地实践落地实践演讲人:王皓中国科学技术大学 特任副研究员CONTENTS目 录01推荐大模型背景02研究现状03生成式推荐大模型04总结与展望大模型推荐背景推荐系统推荐系统 推荐系统:推荐系统:从用户历史历史行为数据中学习用户行为模式,预测未来未来用户行为 亟待解决的问题亟待解决的问题:推荐数据稀疏数据稀疏,存在大量冷启动冷启动用户与物品,模型难以挖掘用。
14、快手可图大模型技术揭秘与应用探索专题:多模态大语言模型的前沿应用与创新2024.08.18 中国 上海主讲人:快手可图大模型负责人 李岩12 可图大模型介绍 可图大模型技术讨论一:怎样选择合适的文本表征 可图大模型技术讨论二:什么是RLHF的关键因素 可图大模型技术讨论三:怎样让大模型写好中国字 可图大模型技术讨论四:怎样做好虚拟试穿 视觉生成方向的未来展望主要内容3 可图大模型介绍 可图大模型。
15、电商大模型及搜索应用实践电商大模型及搜索应用实践演讲人:翟周伟京东/技术总监CONTENTS目 录01电商行业的发展和技术演进02大模型在电商场景下的问题03电商大模型关键技术04电商搜索大模型应用实践05下一代AI电商搜索电商行业的发展和技术演进电商行业发展电商场景问题分析关键问题和技术挑战技术演进洞察电商行业电商行业发展发展过去10年实物商品网上零售额高速增长,电商模式也从货架电商为主发展为。
16、TextIn文档解析与向量化技术加速大模型RAG应用落地演讲人:常扬目 录01RAG背景与问题02文档解析技术方案03向量化技术方案04实际场景产品实践RAG背景与问题01大模型应用的四大问题RAG技术定位领域知识缺乏信息过时幻觉安全RAG(Retrieval Augmented Generation)检索增强生成技术,利用检索外部文档提升生成结果质量领域知识和私有数据实时数据减少生成不确定性增。
17、全方位评测神经网络全方位评测神经网络模型的基础能力模型的基础能力演讲人:张铭 二级教授北京大学计算机学院 博士生导师mzhang_mzhang_张铭简介张铭简介研究方向为机器学习、图神经网络、知识图谱、推荐系统、AI for Science等发表论文300多篇,Google学术上的论文被引19200余次,H 因子 48LINE模型WWW2015 被引6300余次,图表征学习基准模型获ICML20。
18、人工智能行业数据集构建及模型训练方法实践1周 华北京智源人工智能研究院 大模型行业应用总监行业大模型落地难,难在哪里?行业大模型落地难,难在哪里?数据构建数据构建行业大模型专业数据集构建难集成演进集成演进现有IT系统的大模型集成和演进难专业需求专业需求大模型能力与专业业务需求对齐难训练技术训练技术人员算力成本高,技术能力建设难2目录目录一行业数据集的制作技术分享二行业模型训练新范式的实践三NL2。
19、The Future is Here,The Future is Here,A Deep Dive into Autonomous AgentA Deep Dive into Autonomous Agent演讲人:宋恺涛微软亚洲研究院 高级研究员CONTENTS目 录01AI智能体的崛起02如何构建智能体03如何评估智能体04总结AI智能体的崛起The Rise of Autonomous A。
20、非非TransformerTransformer架构的端侧架构的端侧大模型创新研究与应用大模型创新研究与应用演讲人:刘凡平ROCK AI,CEOCONTENTS目 录01端侧大模型的现状与挑战02ROCK AI的端侧大模型的实践03未来趋势端侧大模型的现状与挑战1.11.1 大模型时代的端侧需求大模型时代的端侧需求以全行业视角工信部赛迪研究院数据显示,预计2035年生成式人工智能有望为全球贡献近。
21、大模型在华为推荐场景中的大模型在华为推荐场景中的探索和应用探索和应用演讲人:陈渤华为诺亚方舟实验室 高级算法工程师CONTENTS目 录01背景02LLM for Feature03LLM for Ranking04总结与展望背景推荐系统背景推荐系统背景信息过载时代下的推荐系统为用户推荐感兴趣的资讯,提升用户体验广告主精准投放,挖掘潜在客户提供更好的服务,建设平台生态,提升平台收益Histori。
22、百度大模型原生安全百度大模型原生安全构建之路构建之路演讲人:冯景辉百度/安全平台副总经理 安全风控负责人你是否也遇到过这样的困扰?你是否也遇到过这样的困扰?CONTENTS目 录01大模型安全的挑战02大模型安全的演进03开始原生安全之路04关注智能体安全大模型安全挑战大模型全生命周期中遇到的不同挑战大模型安全面临的全生命周期挑战大模型安全面临的全生命周期挑战010102020303在构建大模型。
23、AI 辅助编程真实测评与企业落地实践作者:蒋志伟个人简要蒋志伟爱好技术的架构师参与 OpenTelemetry 开源社区曾 0-1 搭建美团 APP 的推荐、搜索服务曾负责 Q 上亿用户机票搜索、低价推荐系统有旅游GDS(全球分销系统)的技术专利开源项目基于场景的AI编程测评集https:/ Bengio 团队嵌入技术,将高维稀疏的数据通过神经网络或其他算法映射到低维稠密的 向量 空间,尤其Wo。
24、下一代下一代RAGRAG引擎引擎 技术挑战与实现技术挑战与实现演讲人:张颖峰目 录01下一代RAG引擎02数据抽取模型03混合搜索04高级RAG下一代RAG引擎01RAG 架构模式ExtractionIndexingRetrievalGenerationChunksEmbeddingsVectorDBEmbeddingsQuestionAnswerChunkingRelevant chunksE。
25、千亿参数千亿参数 LLM LLM 的训练效率优化的训练效率优化演讲人:张力寰零一万物/AI Infra分布式训练优化架构师CONTENTS目 录01模型训练硬件利用率影响因素02分布式训练效率提升03FP8 训练经验分享04MoE 训练经验分享05Goodput提升06总结与展望模型训练硬件利用率影响因素Llama 3.1Llama 3.192页的技术报告最大 405B 的模型16K H100 。
26、多环境下的LLM Agents 应与增强演讲:刘邦蒙特利尔学&Mila研究所 助理教授 Canada CIFAR AI Chair1CONTENTS录01模型与智能体02多模具身智能体03推理密集智能体04科学领域智能体2LLM and Agents01它的定义,框架,与挑战3什么是Agent?Give me the definition of Agent.4Agent的定义Give m。
27、大语言模型的幻觉检测大语言模型的幻觉检测演讲人:杨熙北京智源人工智能研究院智能评测负责人CONTENTS目 录01背景与动机02幻觉定义及检测方法0304总结与展望幻觉检测工具构建背景与动机大模型创新技术发展的同时,我们还必须不断探索大模型评测技术大模型能力评估:打造丈量大模型能力评估:打造丈量“高山高山”的尺子的尺子我们所希望的我们所希望的实际可能的实际可能的评测范围被评测模型能力范围被评测模。
28、阿云AI搜索RAG模型优化实践欧明栋阿云AI搜索RAG模型算法负责RAG背景01模型知识问答模型直答模型微调RAG(检索增强成)问题LLM外在幻觉多中少领域知识有有实时信息有可溯源有成本低低回答问题LLM+领域知识回答问题LLM回答+检索知识RAG架构档语义切混合索引向量+本问题档解析query改写扩展检索服务混合索引+重排LLM服务回答RAG的效果问题及归因档解析及切Query理解&检。
29、小米大模型端侧部署落地探索小米大模型端侧部署落地探索演讲人:黄武伟小米/大模型算法工程师CONTENTS目 录01端侧AI的重要性02LLM端侧部署的挑战03相关技术探索04总结与展望端侧AI的重要性端侧端侧AIAI在终端设备上直接运行和处理人工智能算法端侧端侧AIAI优势优势隐私和安全:隐私和安全:所有数据的存储和计算都在本地完成,避免了数据传输到云端可能带来的安全风险。可靠性:可靠性:端侧A。