首页 > 其他分享 >TableStructureRec: 表格结构识别推理库来了

TableStructureRec: 表格结构识别推理库来了

时间:2023-11-23 22:44:50浏览次数:38  
标签:表格 lineless wired TableStructureRec rec table 识别 库来

引言

TableStructureRec 仓库是用来对文档中表格做结构化识别的推理库,包括来自 PaddleOCR 的表格结构识别算法模型、来自阿里读光有线和无线表格识别算法模型等。

该仓库将表格识别前后处理做了完善,并结合 OCR,保证表格识别部分可直接使用。

该仓库会持续关注表格识别这一领域,集成最新最好用的表格识别算法,争取打造最具有落地价值的表格识别工具库。

欢迎大家持续关注。

在这里,我们做的工作主要包括以下两点:

  1. 将模型转换为 ONNX 格式,便于部署
  2. 完善后处理代码,与 OCR 识别模型整合,可以保证输出结果为完整的表格和对应的内容

lineless_table_rec: 无线表格识别库

lineless_table_rec库源于阿里读光-LORE 无线表格结构识别模型

该模型主要解决无线表格结构识别问题,具体包括文档中涉及到一些三线表之类表格结构识别。对于有线的表格支持较差。

安装

pip install lineless_table_rec

使用

from lineless_table_rec import LinelessTableRecognition

engine = LinelessTableRecognition()

img_path = "tests/test_files/lineless_table_recognition.jpg"
table_str, elapse = engine(img_path)

print(table_str)
print(elapse)

结果

在这里插入图片描述

wired_table_rec:有线表格识别库

wired_table_rec库源于阿里读光-表格结构识别-有线表格

该模型主要解决拍照和截屏场景下有线结构识别问题。

安装

pip install wired_table_rec

使用

from wired_table_rec import WiredTableRecognition

table_rec = WiredTableRecognition()

img_path = "tests/test_files/wired/table_recognition.jpg"
table_str, elapse = table_rec(img_path)
print(table_str)
print(elapse)

结果

在这里插入图片描述

写在最后

目前 PaddleOCR 中表格识别暂未整理到这个仓库中,后续会整理进来。

欢迎持续关注。

仓库地址:TableStructureRec

标签:表格,lineless,wired,TableStructureRec,rec,table,识别,库来
From: https://www.cnblogs.com/shiwanghualuo/p/17852694.html

相关文章

  • 简单的用Python采集股票数据,保存表格后分析历史数据
    前言字节跳动如果上市,那么钟老板将成为我国第一个世界首富趁着现在还没上市,咱们提前学习一下用Python分析股票历史数据,抱住粗大腿坐等起飞~好了话不多说,我们直接开始正文准备工作环境使用Python3.10解释器Pycharm编辑器模块使用requests—>数据......
  • 前端vue使用表单form或表格table时的注意事项
     如图,该table表格的data名字为:MyData因此在后面需要在表格里展示数据的时候需要给MyData赋值如下图  注意必须为 1result.data.data 不能是result.data......
  • react antd 表格固定高度
    <divclassName="ad-body"><TableclassName="area-drawing-table"rowClassName={(record,index)=>index===selectIndex?'ant-table-row-selected':''}rowKey={record=>recor......
  • vue element 表格定位到某行
    /***@description:通过表格索引定位表格的位置*@param{refName}table的ref值*@param{index}table的索引值*@return:*@author:hch*/$tableScrollMove(refName,index=0){if(!refName||!this.$refs[refName])r......
  • 表格制作软件排行榜,热门做表格的软件推荐
    在数字化时代,表格不仅仅是企业管理和数据整理的重要工具,更是学术研究、项目规划以及日常生活中必不可少的一部分。为了更高效地进行表格制作,选择一款优秀的表格制作软件是至关重要的。在众多的软件中,我们特别推荐一款备受好评的表格制作软件——VeryReport。编辑搜图请点击输入图片......
  • 一个.Net开源的协作办公套件,包括文档、表格、演示文稿和表单
    推荐一个开源的文档协作办公套件,可以很好的满足团队对方便、高效、安全的方式来处理文档工作,促进团队协作和信息共享。项目简介ONLYOFFICE是一个开源的办公套件,包括文档、表格、演示文稿和表单等应用程序。可以很好低与微软Office兼容,允许多人实时在线对同一个文档进行协作编......
  • wps表格怎么打印选中区域的内容?
    打印选中区域的内容,您可以按照以下步骤进行操作:选择要打印的区域打开WPS表格,在工作表中选择您希望打印的区域。您可以拖动鼠标或使用键盘中的方向键来选择单元格。设置打印区域一旦您选中了需要打印的区域,点击顶部菜单栏中的"文件"选项。在弹出菜单中,选择"打印"选项。......
  • Element UI树形表格刷新保留之前展开的列
     完整链接: ElementUI树形表格刷新自动展开_element表格刷新之后仍然是展开状态_HyunDerek的博客-CSDN博客......
  • 在EXCEL表格中快速自动求和
    在MicrosoftExcel中,可以通过多种方式快速自动求和。以下是一种简单但常用的方法:使用SUM函数选定求和区域:在Excel表格中,首先需要选定要进行求和的区域。这可以是一个列、行或者是一个矩形区域。键入SUM函数:在想要显示总和的单元格中,输入"=SUM("。选择求和区域:然后,用鼠标或......
  • 如何在 Dash 中使表格的单元格值超链接? (使用 Plotly、Dash、Pandas 等)
    要在Dash中使表格的单元格值超链接,您可以使用dash_table.DataTable组件和Pandas数据框。以下是一个基本示例代码,演示了如何将表格中的某些单元格值转换为超链接:首先,确保已完成以下安装:pipinstalldashpipinstallpandas然后,使用以下代码创建一个具有超链接单元格值的Dash......