当前位置:首页 > 报告详情

014-王得科.pdf

上传人: 山哈 编号:725315 2025-07-04 18页 5.17MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了广州希姆半导体科技有限公司基于RISC-V云端推理NPU STCP920的大模型应用实践。关键点如下: 1. **技术架构**:STCP920具有高算力(INT8: 256 TOPS,FP16: 128 TFLOPS),16GB LPDDR4X内存,支持被动散热和虚拟化,适用于云端推理。 2. **软件栈**:开发了针对大模型的推理框架STC-LLM,算子库DNN,深度学习编译器MLTC,高性能通信库STCCL,以及异构编程环境HPE。 3. **性能优化**:通过深度学习编译器MLTC优化整图调度、算子融合等,适配多种AI框架和主流开源LLM模型。 4. **政务应用**:基于STCP920构建了政务智能问答系统,处理广州市多个部门的600余项政务服务,提升了问答效率和知识管理。 5. **核心数据**:用户第一轮提问解答率80%,追问后整体提问解答率达到95%;政务知识管理效率比传统提升2倍。 6. **挑战与优势**:面临高精度、灵活性、通用性、吞吐量和成本挑战,STCP920展现了高精度、高推理性能、兼容性和高并发处理能力。 文章展示了在政务领域的实际应用效果,标志着算力新纪元的开启。
"STCP920如何提升政务效率?" "大模型在政务问答中有何优势?" "STCP920怎样赋能行业知识图谱?"
客服
商务合作
小程序
服务号
折叠