| 基于混合视觉策略的异构表格抽取研究 | |
| 所属分类:技术论文 | |
| 上传者:wwei | |
| 文档大小:1671 K | |
| 标签: 表格检测 表格文本识别 PP-OCRv4 | |
| 所需积分:0分积分不够怎么办? | |
| 文档介绍:本研究旨在解决军事领域中异构表格数据的识别与抽取问题,提出了一种基于混合视觉策略的表格抽取与体系化存储框架。首先采用融合Mask R-CNN和Unet的表格检测算法与基于PP-OCRv4表格文本识别方法,实现了对于原始数据的检测及电子化,并引入IoT指标解决现实表格数据的文本换行、溢出等问题;然后,提出了一种自适应的表格标准化重构方法,使得多来源的异构表格数据可实现结构化、体系化的统一存储;最后探讨了如何将提取的结构化数据应用于军事知识库构建,为海量知识数据的自动化提取与标准化存储提供了数据支撑。 | |
| 现在下载 | |
| VIP会员,AET专家下载不扣分;重复下载不扣分,本人上传资源不扣分。 | |
Copyright © 2005-2024 华北计算机系统工程研究所版权所有