当前位置:首页 > 报告详情

2019年超万亿规模的大数据搜索与统计-浅谈对lucene源码的改造.pdf

上传人: 云闲 编号:97338 2021-01-01 36页 6.99MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了作者母延年,一位有着十年互联网、大数据行业经验的CTO,在南京录信软件技术有限公司的工作成果。母延年先生是lucene的粉丝,有着丰富的万亿级、千亿级别的项目设计与实施经验。他针对lucene进行了多项改进,包括万亿秒查、多列联合索引、地理位置检索、HDFS上的索引、系统稳定性和索引的分分合合等技术。这些改进使得lucene能够更好地应对大数据搜索与统计的需求,如网络综合搜索、综合查询、云搜索和快速检索等。此外,他还提出了SNGram切词算法,用以解决Ngram算法膨胀率过高的问题。这些技术和方法已经在公安、军队、交管安防和汽车等行业得到了应用。
"万亿级搜索如何实现秒级响应?" "Lucene源码改造背后的技术创新是什么?" "大数据时代,如何优化Lucene的索引与存储?"
客服
商务合作
小程序
服务号
折叠