1、明略科技-多模态数据驱动的 RAG 增强实践董振兴0102030405目录智能时代对多模态搜索的需求多模态数据的解析与向量化多模态信息的检索增强多模态场景下的Agentic RAG总结和展望01背景介绍RAG技术演进02明略多模态解析实践企业多模态数据面临的挑战Pipeline文件解析Pipeline文件解析问题Pipeline文件表格解析问题端到端模型文件解析明略科技多模态解析混合架构03明略。
2、菜低代码创新实践:全栈转型与技术效能突破唐爽菜体验平台中负责原 阿巴巴前端委员会联席主席0102030405录背景以及临的挑战实现案和技术架构实施效果和痛点权衡案例:新的职责所带来的突破展望:AI时代前端能为企业带来的价值01为什么菜业务常适合全栈化开发菜全栈化背景变前的研发模式BDPD 上线 测试 后端开发 前端开发 设计 产品项UEDFERDQCMRDPRD设计稿界接BugList业务菜业务。
3、1 1端智能在即时物流场景的落地王云生(追诗)饿了么-物流技术-终端负责人020401即时物流行业介绍骑手运动状态推断及应用端智能在骑手履约场景的未来了解骑手作业流程通过运动状态刻画骑手真实的作业情景未来不远03图像识别在即时物流场景的应用通过图像识别提升商户门头照质量什么是即时物流顾客选餐下单等待配送商家接单制作出餐骑手接单到店送达取餐即时物流对比即时物流传统物流配送时间较短,分钟或小时级别较。
4、作业帮检索系统重构:程童Havenask实践案例分享Havenask(HA3)0102030405目录结果很重要业务场景及核心问题思路和决策实践过程总结01结果很重要成本问题20212022202320242025成本/万qps单位成本注:统计时间节点为每年年末高峰,年取元旦后数值索引容量瓶颈业务需求问题结果很重要强化向量检索,快速支持基于RAG及多模态大模型的AI业务落地大规模复杂算法系统年省。
5、梁加易目录主仓主仓业务组件业务组件业务组件业务组件主仓主仓业务组件业务组件业务组件业务组件业务组件业务组件业务基础组件业务组件业务组件新问题&老问题基于 Bazel 的适配和改造低成本&低风险&高效率分布式能力-依赖解析优化正确性&稳定性分布式能力-缓存优化构建效率标准协议维护模块&组件管理合入管控旧流程就存在,在 Monorepo 下会劣化的问题time。
6、性能全闪件系统的设计与实践张涛焱融科技CTO0102030405录模型时代的存储挑战YRCloudFile的设计案级运维特性AI训练推理解决案总结和未来规划01模型时代的存储挑战AI数据增的挑战AI 数据处理的挑战数据采集数据预处理数据训练推理数据归档 多协议访问 容量 并发 宽带 多协议访问 数据检索 IO 混合 IO 读写混合 量读请求 宽带 海量件 模型部署 宽带 KV Cache 卸载 。
7、家故障应急保障体系实战 稳中求胜的构建之道 付冰尧机IoT SRE负责0102030405录IoT技术架构全景IoT质量保障的问题和挑战应急体系的科学构建亿级设备故障处置案例复盘互动研讨01IoT技术架构全景亿级设备连接的核架构解析全球领先的消费级 AIoT 平台全球领先的消费级 AIoT 平台8.61亿设备接户活1亿开发者1.3万本地化演进,打造快速、稳定、合规的全球性 IoT 平台 全球 6。
8、超越工具:超越工具:AIAI驱动内生型技术管理新范式驱动内生型技术管理新范式混沌创新领教腾讯云最具价值专家阿里云最具价值专家TGO鲲鹏会杭州分会荣誉会长腾讯云架构师技术同盟主席团成员前有赞技术副总裁、大搜车高级副总裁、车易拍 CTO资深互联网专家,拥有20多年的互联网产品研发经验。深度参与互联网金融、电商、零售、SaaS等多个领域。亲历主导了余额宝、弹个车、有赞云等多个有影响力的互联网产品从0到。
9、王云霏目录WHY LAKEHOUSE?1.数据类型多样化2.成本与扩展性3.高级数据分析(AI)问题与挑战核心优势1.数据质量2.查询性能3.事务支持1.复杂的ETL链路,2.降低时效性3.数据一致性,冗余存储问题与挑战核心优势1.统一入湖2.开放访问BI、ReportsAI、MLLakehouse的业务价值One data,all analytics1.开放统一的数据存储,Single sou。
10、闵文俊目录不同的存储引擎之间的数据孤岛,数据的价值无法被充分挖掘流批统一近实时化开放格式,打破数据孤岛降本增效2022.01以 Flink 子项目 FlinkTable Store的形式孵化2023.03捐赠给 Apache 基金会,成为 Apache 的孵化项目,面向更开放的开源社区2024.030.4 0.7 版本发布,毕业成为 Apache 顶级项目2024.12发布具有里程碑意义的1.0。
11、石雪峰目录规模化组织中构建平台工程“无休止”的功能累加导致产品变成大杂烩降低用户”认知负荷”与产品复杂度的冲突标准姿势带来的约束与用户自由度的冲突管理诉求层层加码与一线开发者体验的冲突标准研发模式背后的思考和方法论1元数据加工流以及标准加工动作从IDEA到可运行的程序信息如何加工?2从IDEA到可运行的程序创造用户价值的链路是起止点?3创造用户价值软件交付的目标是什么?4高质高效的软件交付标准研。
12、杨晨目录大模型API价格以逐年1/10的趋势下降开源与闭源模型的能力差距在逐步缩小越来越多能处理复杂任务的Agent出现由容器、微服务及声明式API所构建的微服务应用架构由模型、AI Agent及Tool共同构筑的AI Native应用架构解决系统复杂性问题解决智能决策问题LLM 嵌入预定义代码路径LLM 主导控制流 基于大模型的应用开发迭代方式有何不同?如何高效开发?如何进行模型选型?怎样写出。
13、演讲人 李洋 by 小米目录资源浪费导致集群容量不足,发布“pending”,间接导致无法容纳更多的业务,导致集群资源利用率低分配率在很高的情况下,利用率却不足分配率的50%,说明有大量的资源分配出去却没有得到充分的使用近7天的集群cpu均值利用率峰值(usage/capacity):39%近7天的集群cpu申请率均值(cpu-request/allocatabel):91%于此同时 cpu的使。
14、姓名目录流动不足,工具孤岛与业务协同困难DEV、QA、OPS 不同团队瀑布式研发开发者认知负荷:低开发周期:数月或数年2000 年前 传统研发2000 年代 敏捷开发2020 年代 云原生2010 年代 DevOps 运动DEV 与 QA 混合,但 OPS 依然分离,迭代式研发开发者认知负荷:中开发周期:几周或几个月OPS 加入,持续集成与发布You build it,You run it开发者。
15、快有状态服务规模上云实践姓名 刘裕惺Title Senior Software Engineer 0102030405录快有状态服务上云演进有状态服务是否应该上云?有状态服务上云案-开箱即有状态服务上云案-规模化产落地有状态服务上云-未来探讨01快有状态服务上云演进快有状态服务云原化演进02有状态服务是否要上云有状态服务是否要上云?在汽时代坚持骑你可以做到,但注定法享受公路络的全新可能性。成本收。
16、张建飞目录丝绸公司的设计难题两个控制点的贝塞尔曲线AI对于软件研发,什么变了?局部效率提升基础编码能力的知识平权AI对于软件研发,什么没变?复杂柔性不可见难度量软件内在特性流程长+非标无完美设计,只有权衡需求难以描述,评估困难软件工程系统规模团队规模软件规模软件是手艺活,软件工程本质上是“手工作坊”,是知识手工业者的大规模协作。工程师要如何和AI共生抽象思维能力:发现共性,映射到LLM的知识结构。
17、清华大学 郑纬民报告内容AIAI基础大模型基础大模型输入小标题输入小标题人工智能进入大模型时代人工智能进入大模型时代从单模态向多模态发展从单模态向多模态发展ChatGPT实现真正像人类一样来聊天交流文本交互Midjourney AIGC 画作太空歌剧院获得人类艺术比赛冠军图像创作阿里云视频生成大模型 I2VGen-XL,上传1张图后2分钟生成高清视频视频生成行业行业+AI+AI加速行业智能化升级。
18、郑予彬开发者是核心生产力优化开发工具链提升生产力改善可维护性持续改进和创新优化开发体验,提高开发效率简化工作流程提升开发者满意度和幸福感开发速度:实现的自动化和辅助功能,有助于更快地完成编码、调试和重构等任务,从而提高整体开发速度和效率。满意度:提供智能代码建议、自动补全和代码生成等功能,减轻开发人员的工作负担,降低认知负荷,从而提高开发人员的满意度和幸福感代码质量:自动检测并发现代码中的错误和。
19、存量互联时代的 前端存之道周全快 基础架构中负责00开头聊点话过去辉煌的移动前端互联突然就越挫越勇?接棒Web2.0,空前热DAU亿以下的21个独产品中近半户数量下滑来源:晚点 https:/ 基础架构中心负责人架构师 AI初学者架构师,越挫越勇落地了KMP跨端技术45%鸿蒙代码由Android复来 1000+天收益领域化架构演进 启动+次留显著上涨AI DevOpsAI续写覆盖80%AI On。
20、杨少华目录需求侧优化供给侧优化商务手段:折扣技术手段:弹性资源池 存算分离 多类型实例综合使用 包年/包月实例 按量/Spot实例 多云实例运营手段 梳理下线无效、低效任务技术手段 业务逻辑优化 资源优化:RightSizing&HBO实施成本稳定性优化效果大数据任务异常大数据服务或主机异常 低侵入性,业务无感 全自动优化 实施周期短 降低任务总时长、基线完成时间 降低资源使用量(内存/。
21、贾玮贾玮蚂蚁集团 NoSQL数据库 和 向量数据库 技术负责人2016年加入蚂蚁集团,专注于存储基础设施对计算存储基础设施、中间件、向量检索有一定实践经验目录vs 增长趋势数仓数据数仓数据 vsvs 多媒体数据增速多媒体数据增速蚂蚁集团数据+10%+10%+143%+143%向量化表示向量化表示语义表达能力语义表达能力图图/倒排倒排大量浮点(距离)大量浮点(距离)Vector Search向量检。
22、吕帆哔哩哔哩目录传统架构的局限性分析 新一代客服系统的转型方向系统稳定性差扩展能力受限通信不即时丢消息原系统来自外部采购,外部代码,部署物理机,单体架构智能化水平低1分布式部署,弹性扩展,高可用性和多活的容灾能力全云化架构2智能问答,智能检索,智能坐席调度智能化3弹性智能资源调度,数据驱动的智能决策云化与智能化的结合云客服整体架构资源部署和微服务服务拆分多活接入层网关层应用层支撑层权限校验参数校。
23、李志伟目录VS模型训练方式:数据中心或云端模型推理方式:服务器或云端参数量:多为百亿/千级别模型训练方式:云端模型推理方式:端侧参数量:多为十亿级别端侧大模型AI大模型82131476179030609020232024E2025E2026E2027E2028E市场规模单位:亿数据来源:【头豹研究院】2024年中国端侧大模型行业研究预估未来4年,端侧大模型市场每年会以4050%的增长率保持快速增。
24、AI Demo:AI Prompt:material/webHome,Sensors,SettingsPUAVibe Coding530Yes Browser Server SQL DevOpsCDK Infra As Code GenAI AI:1 https:/it20.info/2024/5/a-framework-to-adopt-generative-ai-assistants-for。
25、uni-app双引擎助开发者效构建鸿蒙应崔红保DCloud CTO个介绍崔红保 DCloud CTO uni-app 跨端框架负责 跨平台开发兵 深耕开发者服务领域,在跨平台、前端 UI、程序性能优化等经验较多。01020304录鸿蒙应开发的核挑战uni-app:更简单、更快捷的鸿蒙化案 uni-app x:更性能、更好体验的鸿蒙化案总结与展望01开发效率与运性能如何兼得?鸿蒙应开发的核挑战开发。
26、李虎目录xAI-10万卡 2024.7 META-2.4万卡*2 2024.4 2025-2026 国内十万卡2023.3.16文心一言发布,万卡-ROCE集群2024交付10万卡+单集群最大3.2万2021年底交付 万卡-IB集群演进方向超大规模超大算力超大带宽ChatGpt-1万卡 2022.11 集群规模 3.2T超高带宽接入(8*400G)单集群支持10万卡+支持跨AZ RDMA训练性能。
27、曾国洋面壁智能:端侧大模型主要内容大模型技术发展历史趋势大模型前沿技术与实践大模型未来发展格局的预测:了解大模型技术趋势,提前布局应用:掌握行业应用发展规律,辅助长期研判:交换认知收获灵感,推动 AGI 早日到来开源大模型利好大模型应用落地没有智能的产品会落后于时代,跟不上趋势将会被洗牌。DS 出圈将智能的需求植入到广大消费者的心中,大模型正在改变工作模式+LLM+LLM+LLM大模型技术发展历。
28、赵嘉铎目录典型的复杂B端集成式集成式业务平台,业务上呈现出鲜明的和特征:客观原因:标准化逻辑拆解与封装机制缺失不同场景业务逻辑互相交织,系统拓展性差,导致开发者对变更的接受度低,甚至不得不让业务方做出妥协业务逻辑缺少边界约束,逻辑四处逃逸,业务梳理、问题定位与需求影响范围评估效率低下,缺陷扩散及变更影响范围大复杂业务流程代码实现冗长晦涩,迭代过程中只会进行局部修改,造成数据重复及碎片化读写,系统。
29、快时应可观测挑战 及应对实践演讲:王辉快/移动端数据架构负责个介绍王辉 快/移动端数据架构负责 团队主要负责快的埋点体系、研发数仓等可观测基础设施 在互联业从事开发作多年,开发过前端、后端、客户端、数据,也带过业务、架构等不同类型的团队01020304录超路径带来的挑战可观测体系构建路径归因实践总结与展望01时 短内容=超路径超路径带来的挑战背景:链路数据基建,严重影响了决策效率、实验效率、排障。
30、毕鸣一深耕大前端性能优化多年,先后负责过多个大型项目的性能稳定性测试及测试工具平台的研发工作,当前负责终端、前端和跨端可观测产品的技术研发和平台建设先后对接了多个ToC、ToB和ToG的项目支持;进行了多次公有云、私有云、混合云的项目部署;落地了国内、亚太、中东、北美、欧盟等多种客户的交付实施行业分享及知识社区QConQConHarmonyOSHarmonyOS开发者论坛开发者论坛 广州广州等行。
31、Vickie ZengAgenda1 12 23 34 45 5Scaling laws continueReasoning,Planning&MemoryEvery Developer(Employee)is an AI DeveloperMultimodal and Multi-model including cost/performanceFrom“use-case”to resh。
32、王涛产品研发和工程架构-App Health 监控产品构建:Slardar、APMPlus业务性能优化:通用优化能力、业务指标优化插件热修:插件框架、热修框架编译构建:打包发布、编译优化王涛 2019 年至今,任职于字节跳动,负责Android APM 性能监控产品的构建,帮助头条等业务方优化内存等性能指标。目前担任火山引擎 APMPlus 平台Android/鸿蒙监控产品客户端技术负责人。拥有。
33、罗宇侠目录结构化数据文本图像多模态数据Unify CatalogOpen Datalake format多模态数据统一存储,满足 AI模型训练对多模态数据的要求统一元数据实现数据血缘追踪,权限管理,确保 AI 模型调用的数据质量和可追溯数据湖廉价存储特性允许企业积累海量数据,为 AI 提供海量训练语料1234实时更新大语言模型的知识库实时感知用户的上下文实时数据支持模型的在线学习模型根据用户实时。
34、梁啟成目录7+供应商200+云产品6+地域千万核级CPU算力万卡级GPU算力成本洞察云资源成本多少,业务知不知道自己花了多少钱?资源用量归属是否准确,成本分摊规则是否合理?业务目标和资源动因是什么,单位资源成本是多少?成本优化云产品折扣是否有下降空间,是否存在供应商独家“垄断”?是否存在闲置资源,是否正确配置数据存储周期以及介质?有没有办法提升有效工作负载占比,充分发挥昂贵资源的超强算力?成本运。
35、AI 驱动的大数据自治:智能应对复杂运维挑战熊训德目录大数据系统自治背景与挑战大数据智能管家技术框架及关键实现路径实践效果与案例分享探讨智能管家未来发展方向与潜在影响算法决策离线服务主机参数调优预测分析自助转冷知识/评测库模型/算法库异常收敛HDFSSPARKYARN巡检报表成本分析元启根因分析APISDK权限管控消息管道网络HIVE规则引擎告警收敛预处理定时巡检评估推荐模型训练资源调度Sql熔。
36、王璟尧阿里云智能集团瓴羊 高级技术专家大语言模型企业私域数据BI工具高性能分析引擎可视化技术安全、协同开放集成基础大模型专业领域大模型Agent能力进阶企业私域数据行业知识企业内部知识02PART通用大模型通用大模型03PART多端透出多端透出核心能力核心能力能力能力工具链工具链分析引擎分析引擎渲染引擎渲染引擎DSL灵活性较弱查询能力受限于BI引擎的能力边界业务场景明确、分析要求复杂大型团队和企。
37、戚仕鹏吕松霖GraphRAGAIGraphRAGGraphRAGAB12CXDFE项目员工公司员工关系参项关系好友关系亲属关系通讯关系公司信息表雇佣关系表项目信息表员工信息表好友关系表参项关系表图(Graph):图谱的图由顶点和它们之间的边构成的数据结构表示实体或概念顶点边表示实体和概念之间的关系安全风控全图风控、安全风控、会员关系蚂蚁森林、新春红包、关系网络、营销推荐、数据血缘、异常检测、基础。
38、蚂蚁 mPaaS 为鸿蒙应用高效开发注入创新动力娄星骋嘉宾介绍娄星骋蚂蚁数科端智能平台 mPaaS 产品的核心成员拥有 10 年移动互联网研发经验,专注于移动应用的基础架构、性能监控优化、隐私合规及移动安全等领域。作为 mPaaS 产品建设与演进的推动者,他参与解决了 mPaaSmPaaS 鸿蒙鸿蒙版本,版本,从研发、构建、测试、发布到运维的全链路问题,为企业提供从研发、构建、测试、发布到运维的。
39、李飞公司概况部分代表客户投资机构数势科技为企业提供基于大模型增强的数据分析 AI Agent,提升企业的数字化决策能力,推动企业数字化升级。2020年,由原京东技术副总裁黎科峰博士创立 行业首个商业化落地的数据分析智能体SwiftAgent 在金融、零售、先进制造领域有深度技术和业务know-how目录企业数字化建设进度不一,大致分为以下三类数据仓库BI系统指标平台现状:1.少部分企业仍处在数仓。
40、演讲人:牛俊龙目录AI在研发领域带来的变化AI大模型井喷期AI大模型加速商用期20232024互联网21%金融 16%医疗 12%教育 12%政务 11%工业 10%其他 18%行业结构信息来源:Dora Research:2024系统分析研发编码测试验证提交部署CodeFuse插件技术架构模型能力本地核心服务模块详解数量编码单轮多轮SearchThink Model+Search单维度多维度经。
41、张栋目录效率 VS 成本安全左移大模型赋能传统静态工具传统规则添加方式Source/Sink提取流程开源框架提取新框架提取账密:点逻辑场景SQL 注入:链逻辑场景以上代码段是以直接拼接 SQL 查询语句的方式进行查询。然而,这种方式存在SQL 注入的风险。当 param 参数的值直接拼接到 SQL 查询语句中时,如果param 的内容被恶意构造为一个合法的 SQL 语句片段,攻击者可以修改原始的。
42、AI应用落地进行时司巧蕾Selina从技术爆发到产业渗透AI应用落地进行时极客邦科技年度主题:AI应用落地 训练成本 推理成本 适配成本 隐性成本成本!成本!成本!从模型开发到部署运维,工程化流程复杂。企业AI项目落地周期长,成功率低,技术与业务融合困难。工程化能力场景碎片化领域知识壁垒动态适应能力场景化能力AI人才缺口显著系统化/点对点提升技能提升技术侧:成本!成本!成本!成本=训练成本+推理。
43、杨克特目录实时读写应用应用服务实时读写搜索服务快照CDC快照CDC全量处理增量处理离线分析实时分析ProsConsooooooooRDS实时读写应用应用服务实时读写快照CDC快照CDCS3RedshiftCloudSearch全量处理增量处理搜索服务离线分析实时分析RDS应用应用服务S3事务和分析混合负载事务和分析混合负载?RedshiftCloudSearch实时离线处理一体化实时离线处理一体。
44、李培殿1.小米数据湖架构及上云实践2.从离线湖仓到实时湖仓3.数据湖在AI场景实践4.未来规划目录 手机研产供 新零售 IOT设备信息化 互联网广告 互联网应用 信息流推荐互联网 基座大模型 小爱同学AI 智能座舱 自动驾驶汽车FlinkSparkTrinoDorisRayGravitinoHiveIcebergPaimonFilesetJuiceFSHDFS计算引擎元数据数据湖存储层数据工场平。
45、孙伟祥目录背景说明业务视角的混合云架构 多云提供商:多云提供商:阿里云、腾讯云、AWS、华为、火山、自建云 多区域部署:多区域部署:上海、南京、杭州、芜湖、乌兰、海外 多形式部署:多形式部署:在线核心链路异地多活;离线链路、LLM推理全域部署理想中资源视角的混合云架构现实中资源视角的混合云架构核心解决思路向上对业务屏蔽集群概念向上对业务屏蔽集群概念向下对资源调度合池统一向下对资源调度合池统一解决。
46、章毅俞舟AI Agents Labs-WorldZhou(Jo)YuColumbia University&Arklex AILLMLLMLLM 2025 Arklex.AI-All rights reservedArklex.AIFounder,CEODr.Zhou(Jo)YuColumbia University CS Professor(CMU PhD)Open-source AI。
47、从分钟到秒:抖如何通过动态库优化实现效构建演讲:张星宇字节跳动/软件程师01020304录背景动态库的优势与挑战核作流程与原理收益与规划01构建耗时的瓶颈与思考背景抖线下开发成本每天构建次数约 4000 次改代码到跑起来时(优化前)平均每次超过 3 分钟均构建成本(优化前)超过 200 时90%的构建属于增量构建,其耗时直接决定研发效率增量构建代码改动量极,缓存命中率,付出的等待时间是否合理增量。
48、李宇明传统数字人技术介绍生成式数字人技术介绍技术细节与亮点实验结果分析生成式数字人结合大语言模型的实时交互生成式数字人结合音乐生成模型的AI创作生成式数字人结合商品的视频广告生成式数字人存在的问题和挑战生成式数字人开发新范式方法基于GAN的算法。通过对抗训练学习,对人物图像的嘴部进行精准编辑,确保嘴型与输入的语音同步,实现数字人语音播报。基于NeRF的算法。通过构建神经辐射场对数字人进行个性化建。