当前位置:首页 > 报告详情

6-5 文档智能技术应用与研究.pdf

上传人: 云闲 编号:102277 2021-01-01 17页 4.43MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了阿里巴巴达摩院在文档智能技术领域的研究与应用。达摩院研发了基于视觉-语言联合预训练的文档智能技术平台,该平台具备统一解析和表示多种文件格式的能力,如图片、PDF、HTML等,并可处理多模态元素,如文字、表格、图形等。该技术在层次化版面分析、OCR文字检测与识别、多语言识别、国际化卡证等多个方面达到业界领先水平。此外,技术已应用于智能报关,显著提升了报关效率和准确率,将人工流程减少了80%,报关效率提升了3.5倍,出错率下降了95%。未来,达摩院计划进一步发展版式语篇预训练、多格式文档预训练、长文档预训练等前沿技术,并探索更多格式文档转换、目录摘要生成等应用。
"文档智能技术如何提升海关报关效率?" "如何利用预训练技术突破文档智能识别难题?" "智能报关方案如何实现高准确率识别多种单据?"
客服
商务合作
小程序
服务号
折叠