表格是人们在填写报名表、财务报表、票据等日常生活、工作中经常用到的,高精确度的表格识别技术能够大幅节省文件处理时间,静安区科技企业合合信息公司(简称“合合信息”)研发的图像处理和复杂场景文字识别技术,起到了这样的功效。
【资料图】
据了解,表格识别主要包括表格检测识别和表格结构识别两大任务。表格检测主要检测表格主体,即从图片中确认表格区域;表格结构识别是对表格区域进行分析,提取表格中的数据与结构信息,得到表格的行列逻辑结构。
两大任务均具有相当的复杂性。
首先,表格类别多样,根据有无边框可以分为有线表、少线表、无线表等。从有线表、少线表到无线表,表格识别难度逐渐增加。同时,表格文件中常见的背景填充、单元格行列合并等情况,会进一步增加表格识别难度。其他外部因素,如图片倾斜褶皱、背景干扰等问题,都会对表格识别带来挑战。
对此,
合合信息利用先进的
人工智能技术和深度学习技术,
将表格识别分为有线表识别
和无线表识别两种方案。
有线表识别中,合合信息利用语义分割、角点回归等技术方案还原有线表,在财报相关表格识别测试中,有线表识别单元格结构准确率高于98%。
而对于无线表识别这一表格识别中的难点,合合信息无线表识别技术采用序列模型、规则匹配等方案,通过自研模型直接预测表格的逻辑结构,再得到表格的物理结构,在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。
目前,合合信息智能文字识别技术中的表格识别技术,已在其旗下扫描全能王平台C端APP中广泛应用,通过“文件转换excel”功能服务于大众生活和办公需求。
生活中,用户可以使用扫描全能王随手拍下手边的清单、个人合同、说明书等,APP将提炼其中的表格内容,起到备忘作用;办公场景下,使用者可扫描、拍摄工作文件,提取图片、PDF中的文字内容,并将其转化为可编辑文档,便于二次编辑和分享。近半年来,“文件转换excel”相关功能累计被调用百万次。
作为合合信息智能文字识别引擎中的重要模块,表格识别技术现已落地在保险、银行、证券等行业中,应用于合同、银行流水、物流单据识别等多个场景。
以财务场景为例,合合信息表格识别技术被应用于企业发票与订单的数字全流程管理中,曾助力全球知名汽车零配件供应商伟巴斯特实现票据智能扫描、识别、验真、合规自动检查、发票与订单数据匹配、数字化数据、影像留存等全流程财税管理,作业效率提升500%至1000%。