程童-作业帮检索系统重构:Havenask 实践案例分享.pdf

编号:627174 PDF 34页 6.48MB 下载积分:VIP专享
下载报告请您先登录!

程童-作业帮检索系统重构:Havenask 实践案例分享.pdf

1、作业帮检索系统重构:程童Havenask实践案例分享Havenask(HA3)0102030405目录结果很重要业务场景及核心问题思路和决策实践过程总结01结果很重要成本问题20212022202320242025成本/万qps单位成本注:统计时间节点为每年年末高峰,年取元旦后数值索引容量瓶颈业务需求问题结果很重要强化向量检索,快速支持基于RAG及多模态大模型的AI业务落地大规模复杂算法系统年省成本40%+23年全年有效索引数据增加超过100%,索引成本增长10%结果很重要十年系统能力重塑,拥抱AI时代02业务场景及核心问题一次典型的题目检索过程拍照上传图像图像预处理检测&识别一次典型的题目检

2、索过程检索query生成召回&排序返回top结果真实业务场景的复杂性智能批改检索增强及多模态LLM能力技术能力拆解题目检索OCR全学科知识点检索图形题检索多分类批改检索增强&多模态LLM AI/系统架构检索系统的挑战1.压力主要集中在索引引擎上2.其次是排序层的问题3.根因还是流量&数据量持续增长,考验系统性能03思路和决策思路与决策约束1.2.3.现有基础迭代自研替换开源替换优势%风险用户视角的HA3开源历程首次接触停滞期再次接触转折正式开源落地准备落地路线图23年3月底23年4月底23年6月底23年8月底23年12月底04实践过程遇到的问题 打平效果需要反复AB实验分析case,耗时较多,

3、过程可控QA&排序QRSSearcher原有召回服务遇到的问题 误判的影响对性能指标的误判让上半年收益近乎归零遇到的问题 性能优化短周期/快速生效缓解压力遇到的问题 性能优化中等周期/相对透明QRSSearcherQRSSearcherSearcherQRSQRSQRSGroup1Group2Core1Core2Core3Core4MemoryNuma Node1Core5Core6Core7Core8Numa Node2Memory部分测试数据17.3%22.6%13%8.8%Avg:7%Tail:22%Cpu:39%Avg:44%遇到的问题 性能优化长周期/需要策略适配/收益最大(AB)(

4、CD)(EF)(GH)L1 end部分性能对比数据32.86.365.314.31.618.6CPU使用率(%)subquery请求量(kqps)单条subquery耗时(ms)优化前-HA3优化后-HA320.94343.4532.36241.58单实例容量(qps)平均耗时(ms)优化前-接入优化后-接入CPU UtilCPU Util减少减少56.4%56.4%SQSQ减少减少74.69%74.69%代价代价:单条耗时单条耗时+62.26%+62.26%吞吐提升吞吐提升54.54%54.54%时延减少时延减少29.66%29.66%注:优化后检索系统全局资源用量减少,如上是其中一个子系统数据05总结回顾降本增效:40%+场景:复杂大规模算法系统结合约束条件选择方案落地实践,解决问题总结HA3AITHANKS大模型正在重新定义软件

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(程童-作业帮检索系统重构:Havenask 实践案例分享.pdf)为本站 (山海) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠