当前位置:首页 > 报告详情

Datafun3.23 智慧芽 王为磊.pdf

上传人: 张** 编号:158425 2024-03-31 20页 5.01MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了智慧芽在2024年举办的DataFunSummit会议中,关于专利大模型实践与问答探索的内容。王为磊博士作为搜索与算法总监兼首席科学家,分享了专利大模型的训练过程、挑战和展望。 关键点如下: 1. 专利大模型训练:采用差异化数据集,结合智慧芽沉淀的几十种小模型算法能力,通过监督精调、RAG检索增强生成等技术,实现对垂直行业的大模型训练。 2. 模型应用:专利大模型在专利撰写、专利对比、专利搜索等方面表现出色,部分能力已超越ChatGPT-3.5,甚至达到ChatGPT-4的水平。 3. 模型评估:MMLU和C-EVAL数据显示,专利大模型在垂直行业能力上表现良好。同时,自建测试集也显示其在专利撰写、总结、问答等方面具有较高的准确性和效率。 4. 未来方向:文章提到了稀疏化、自我迭代、长文本处理、多模态以及Agent等未来研究方向。 综上,智慧芽通过举办DataFunSummit会议,分享了其在专利大模型领域的最新研究成果和实践经验,展示了大模型在专利搜索和问答等场景的应用价值,并为未来的研究方向提供了启示。
"智慧芽如何应用大模型提升专利搜索效率?" "大模型在专利领域的应用有哪些挑战和解决方案?" "如何利用RAG技术加强专利大模型的理解和搜索能力?"
客服
商务合作
小程序
服务号
折叠