首页 > 其他分享 >RapidTable release v1.0.3

RapidTable release v1.0.3

时间:2025-01-10 11:11:39浏览次数:1  
标签:None v1.0 模型 release str RapidTable table model

引言

经过几日来的不懈努力,RapidTable 库终于迎来了 1.0 系列。

RapidTable 库是专门用来文档类图像的表格结构还原,表格结构模型均属于序列预测方法,结合 RapidOCR,将给定图像中的表格转化对应的 HTML 格式。

效果展示

在这里插入图片描述

模型列表

model_type 模型名称 推理框架 模型大小 推理耗时(单图 60KB)
ppstructure_en en_ppstructure_mobile_v2_SLANet.onnx onnxruntime 7.3M 0.15s
ppstructure_zh ch_ppstructure_mobile_v2_SLANet.onnx onnxruntime 7.4M 0.15s
slanet_plus slanet-plus.onnx onnxruntime 6.8M 0.15s
unitable unitable(encoder.pth,decoder.pth) pytorch 500M cpu(6s) gpu-4090(1.5s)

模型来源
PaddleOCR 表格识别
PaddleX-SlaNetPlus 表格识别
Unitable

模型下载地址:link

主要更新

⚠️ 注意:本次更新版本为v1.x,不兼容v0.x版本,请谨慎更新,避免导致接口调用有误。

  1. RapidTable 的输入输出做了更新,采用dataclasses来封装,简化参数传递,便于后续使用,更新和维护。示例如下:

    # 输入
    @dataclass
    class RapidTableInput:
       model_type: Optional[str] = ModelType.SLANETPLUS.value
       model_path: Union[str, Path, None, Dict[str, str]] = None
       use_cuda: bool = False
       device: str = "cpu"
    
    # 输出
    @dataclass
    class RapidTableOutput:
       pred_html: Optional[str] = None
       cell_bboxes: Optional[np.ndarray] = None
       logic_points: Optional[np.ndarray] = None
       elapse: Optional[float] = None
    
    # 使用示例
    input_args = RapidTableInput(model_type="unitable")
    table_engine = RapidTable(input_args)
    
    img_path = 'test_images/table.jpg'
    table_results = table_engine(img_path)
    
    print(table_results.pred_html)
    
  2. 集成了 Unitable 项目最新表格识别算法,推理引擎为 torch,提升了 RapidTable 的上限。

  3. 优化了模型下载和托管问题,模型托管在 modelscope 上。在使用时,只需要指定对应的model_type,即可自动下载对应模型。当然,也可以通过model_path来具体指定模型路径。

标签:None,v1.0,模型,release,str,RapidTable,table,model
From: https://www.cnblogs.com/shiwanghualuo/p/18663609

相关文章

  • 征程 6X release版本内核模块安全加载
    1.概述征程6X系统在release编译时支持内核模块签名验证,仅加载使用正确密钥进行数字签名的内核模块。禁止加载未签名的内核模块或使用错误密钥签名的内核模块,客户需要替换成自己的key进行签名。模块签名启用后,Linux内核将仅加载使用正确密钥进行数字签名的内核模块。禁止......
  • 《DNK210使用指南 -CanMV版 V1.0》第四十九章 综合例程
    第四十九章综合例程1)实验平台:正点原子DNK210开发板2)章节摘自【正点原子】DNK210使用指南-CanMV版V1.03)购买链接:https://detail.tmall.com/item.htm?&id=7828013987504)全套实验源码+手册+视频下载地址:http://www.openedv.com/docs/boards/k210/ATK-DNK210.html5)正点原子官......
  • lsb_release 命令参数和使用案例
    lsb_release命令参数和使用案例lsb_release命令介绍lsb_release命令用于显示Linux标准库(LSB)和特定Linux发行版的相关信息。它可以帮助用户快速了解当前系统的发行版、版本号和描述等信息。此命令在不同的Linux发行版中通常是预装的,但在某些情况下可能需要手动安装。主要功......
  • 开发规范.NET-v1.0.241127
    一、编程规范(一)命名风格命名要找更有表现力的词,更专业的词,比如获取数据不用get而使用fetch别害怕长名称,长而具有描述性的名称比短而令人费解的名称好为作用域大的名字采用更长的名字,作用域小的使用短名字给变量名带上重要的细节,比如加上单位ms等。【强制】严禁......
  • 开发规范JAVA-v1.0_.241127
    一、编程规约(一)命名风格【强制】代码中的命名均不能以下划线或美元符号开始,也不能以下划线或美元符号结束。反例:_name/_name/$Object/name/name$/Object$【强制】代码中的命名严禁使用拼音与英文混合的方式,更不允许直接使用中文的方式。说明:正确的英文拼写和......
  • API开发与管理规范v1.0_.20241127
    1.协议规范为了确保不同业务系统之间以及前后端的的数据交互的快捷性,通讯协议统一约定如下:对内调用的API接口统一使用HTTP协议对外互联网发布的API建议使用HTTPS协议也可以使用HTTP新的API接口必须使用标准的HTTP报文并使用JSON作为统一的数据传送标准如无特殊情况禁止在......
  • Node开发规范v1.0_.20241127
    一、空格与格式(一)缩进采用2个空格缩进,而不是tab缩进。空格在编辑器中与字符是等宽的,而tab可能因编辑器的设置不同。2个空格会让代码看起来更紧凑、明快。变量声明永远用var声明变量,不加var时会将其变成全局变量,这样可能会意外污染上下文,或是被意外污染。在ECMAScript5的s......
  • ABAP开发规范V1.0_.20241127
    1.概要1.1目的该文档定义了在开发与维护ABAP程序过程中必须遵守的规范与标准。该文档应当被视为一个动态的文档,该文档会根据需要进行增补和修订。开发规范的重要作用在于保持整个开发团队的开发风格一致,提高程序质量,降低维护压力。1.2适用范围所有ABAP开发及系统配置人员。......
  • 数据库开发规范v1.0_.241127
    一、建表规约【强制】表达是与否概念的字段,必须使用is_xxx的方式命名,数据类型是unsignedtinyint(1表示是,0表示否)。说明:任何字段如果为非负数,必须是unsigned。正例:表达逻辑删除的字段名deleted_flag,0表示删除,1表示未删除。【强制】表名、字段名必须使用小写字母或......
  • 《DNK210使用指南 -CanMV版 V1.0》第四十八章 自学习分类实验
    第四十八章自学习分类实验1)实验平台:正点原子DNK210开发板2)章节摘自【正点原子】DNK210使用指南-CanMV版V1.03)购买链接:https://detail.tmall.com/item.htm?&id=7828013987504)全套实验源码+手册+视频下载地址:http://www.openedv.com/docs/boards/k210/ATK-DNK210.html5)正点......