当前位置:首页 > 报告详情

使用 LLMs 和 Databricks 释放非结构化数据的潜力.pdf

上传人: 张** 编号:167691 2024-06-15 27页 2MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了北达科他大学系统(NDUS)如何利用大型语言模型(LLM)和Databricks平台来提升对无结构数据的处理能力。面临的问题包括难以获取和管理的州级政策和法律文档。核心数据包括:拥有两所研究型大学、四所区域大学和五所社区学院,组织于1990年。2023年6月,LLM功能在数据与人工智能峰会上发布;10月,在Databricks平台上测试不同的OSS LLM;12月,成功测试了首个GPU端点与LLM政策应用;2024年1月,发布了使用Foundation API和向量搜索的LLM政策应用。 关键点如下: 1. NDUS利用LLM和Databricks平台来释放无结构数据的潜力。 2. 通过Retrieval-Augmented Generation (RAG)技术,减少了LLM的事实错误或相关性差的回应,并扩展了其知识范围。 3. 政策文档每日更新,通过Power Automate捕获更改,并将所有数据存储在ADLS Gen 2存储账户中。 4. 使用HNSW方法进行相似性搜索,在大型数据集中找到相似的向量。 5. 构建包含相似性搜索信息的提示,发送给LLM以生成回应,并通过Databricks模型端点提供用户交互。 6. 面临挑战包括小的人工智能团队、有限的财务资源和计算资源,但通过全面的LLM实现了政策搜索和响应的10-20倍速度提升,并将市场时间缩短至6个月,同时通过利用Databricks on Azure将采购时间和成本降低100%。 7. 未来的开发包括改进内部审计和政策助手,自动化NDUS新闻管道,以及为学生、财务和人力资源数据请求的助手。
"NDUS如何利用LLMs和Databricks提升数据潜力?" "一个小型的AI团队如何实现了10-20倍的搜索响应速度提升?" "NDUS在AI道路上有哪些未来发展规划?"
客服
商务合作
小程序
服务号
折叠