1、DataFunCon#2024档智能在融领域的应演讲:侯启予吾道科技(iWudao Tech)技术预研负责Contents目录档智能的技术范畴档分析与识别融领域的档智能档理解档智能的未来展望档智能的技术范畴档智能的技术范畴 档智能(Document AI/Document Intelligence)档分析与识别(Document Analysis and Recognition)图像处理 版分析(Layout Analysis)内容识别 光学字符识别(Optical Character Recognition,OCR)字检测(Text Detection)本识别(Text Recognitio
2、n)端到端本检测与识别(Text Spotting)表格识别(Table Recognition/Table Structure Recognition)图形识别(Diagram Recognition)档理解(Document Understanding)刘成林,连,翔,李晓辉,殷.2023.档智能分析与识别前沿:回顾与展望.中国图象图形学报,28(8):2223-2252.融领域的档智能 常的融档 审计报告 年报/半年报 募集说明书、招股说明书 计划说明书 发说明书 评级报告、资产评估报告 受托机构报告、受托事物报告、受托管理协议 承诺书、意书 公司章程、会议规则 注册申请报告 票利率公告
3、 融领域档智能 研究意义 研究现状融领域的档智能融档的特点:数多,版复杂,样式丰富皓元医药次公开发股票并在科创板上市招股说明书华中数控2019年审计报告建鑫2020年第七期不良资产持证券信评级报告融领域的档智能 融档的特点:歪曲,清晰度低,尺本数量多且密集,关键信息被覆盖苏州资管2022年审计报告东汇通融租赁有限公司2017年审计报告上海地产(集团)有限公司2018年审计报告融领域的档智能档分析与识别档检测:档/档分类、档类型分类图像矫正:向矫正、倾斜矫正、变形矫正图像增强:对度增强、去噪、去印章、去印DewarpNet:Single-Image Document Unwarping With
4、 Stacked 3D and 2D Regression Networks,https:/ieeexplore.ieee.org/document/9010747档分析与识别 图像处理版分析的的是将档图像分割成不同类型内容的区域并分析区域之间的关系,是内容识别的前续步骤标检测或实例分割的路线,采 YOLO、Faster R-CNN、Mask R-CNN 等框架近年来随着基于 Vision Transformer 和多模态技术的提出,版分析技术得到进步发展DiT,ACM-MM-2022 DiT:Self-supervised Pre-training for Document Image Tr
5、ansformerVSR,ICDAR-2021 VSR:A Unified Framework for Document Layout Analysis combining Vision,Semantics and RelationsVGT,ICCV-2023 Vision Grid Transformer for Document Layout AnalysisLayoutLMv3,ACM-MM-2022 LayoutLMv3:Pre-training for Document AI with Unified Text and Image MaskingVision Grid Transfo
6、rmer for Document Layout Analysis,https:/arxiv.org/abs/2308.14978VSR:A Unified Framework for Document Layout Analysis combining Vision,Semantics and Relations,https:/arxiv.org/abs/2105.06220档分析与识别 版分析 基于 Mask R-CNN 的法,使 Swin-Transformer(Swin-T)替换 ResNet-50,检测区域遗漏或不完整的问题提升明显档分析与识别 版分析 使 VSR 等基于多模态技术的