首页 > 其他分享 >通用 PDF OCR 到 Word API 数据接口

通用 PDF OCR 到 Word API 数据接口

时间:2024-08-31 20:38:58浏览次数:13  
标签:Word pdf2word 接口 gugudata API PDF com

通用 PDF OCR 到 Word API 数据接口

文件处理,OCR,PDF 高可用图像识别引擎,基于机器学习,超精准识别率。

gugudata_api_cover

1. 产品功能

  • 通用识别接口;
  • 支持中英文等多语言字符混合识别;
  • formdata 格式 PDF 文件流传参;
  • 基于机器学习不断提高的识别率;
  • 输出 Word 文件永久 CDN 存储;
  • 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
  • 全面兼容 Apple ATS;
  • 全国多节点 CDN 部署;
  • 接口极速响应,多台服务器构建 API 接口负载均衡;
  • 接口调用状态与状态监控

2. API 文档

接口详情: https://www.gugudata.com/api/details/pdf2word

接口地址: https://api.gugudata.com/imagerecognition/pdf2word?appkey={{appkey}}

返回格式: application/json; charset=utf-8

请求方式: POST

请求协议: HTTPS

请求示例: https://api.gugudata.com/imagerecognition/pdf2word?appkey={{appkey}}

数据预览: https://www.gugudata.com/preview/pdf2word

接口测试: https://api.gugudata.com/imagerecognition/pdf2word/demo

3. 请求参数

参数名 参数类型 是否必须 默认值 备注
pdffile file YOUR_VALUE formdata 文件流

4. 返回参数

参数名 参数类型 备注
DataStatus.StatusCode int 接口返回状态码
DataStatus.StatusDescription string 接口返回状态说明
DataStatus.ResponseDateTime string 接口数据返回时间
DataStatus.DataTotalCount int 此条件下的总数据量,一般用于分页计算
Data string 转换后的 Word 文档地址,咕咕数据同时提供永久 CDN 存储

标签:Word,pdf2word,接口,gugudata,API,PDF,com
From: https://www.cnblogs.com/parry/p/18390728

相关文章

  • 全国大学高校专业数据 API 接口
    全国大学高校专业数据API接口提供大学专业基础数据,持续更新,各类专业属性。1.产品功能2023年数据已更新;提供最新的全国高校专业基本信息;总计近3000条专业精准基础数据;每月一次数据更新校正;同时包含了专业开设课程列表;全接口支持HTTPS(TLSv1.0/v1.1/v1.2/v1.......
  • 网页可读内容抽取 API 数据接口
    网页可读内容抽取API数据接口智能提取文章关键元素信息,智能抽取,多种元素信息。1.产品功能智能提取网页可阅读内容;提供网页可阅读内容的HTML代码;支持传递网页HTML或网页URL参数;支持多种元素信息抽取,包括文章标题、作者、文字方向、语言、内容、内容(不包含HTML标......
  • Java利用POI实现对Word的操作(包括有换行的文本和图片)
    目录一、实现效果二、实现部分1、导入依赖2、工具类3、实体类4、测试代码如果您也有类似的需求,可以参考这篇文章进行实现并扩展。一、实现效果1、重要说明:①普通文本使用${字段名}进行标注,有换行的文本使用$${字段名}进行标注。②图片使用#{字段名}进行标注......
  • 《真三国无双7帝国》启动故障排除手册:彻底解决steam_api.dll丢失及其他常见问题
    《真三国无双7帝国》是一款备受欢迎的动作游戏,但一些玩家在尝试启动游戏时可能会遇到“steam_api.dll丢失”的错误提示。这个问题往往让人感到困扰,因为缺少这个动态链接库(DLL)文件会导致游戏无法正常启动。本文将深入探讨这一问题的原因,并提供有效的解决方法。steam_api.dll丢......
  • 管易云API接口对接实例
    管易云(C-ERP)是一款面向电商企业的企业管理软件,它集成了订单管理、库存管理、财务管理等多种功能。为了更好地与其他系统集成,管易云提供了API接口,使得第三方应用可以通过调用这些接口来实现数据交互。管易云API接口对接实例假设我们有一个电商平台需要与管易云进行订单同步,以便及时......
  • 使用python基于fastapi发布接口(二)-连接mysql数据库查询数据
    上一章在这里操作MySQL数据库使用mysql-connector-python库安装mysql-connector-pythonpipinstallmysql-connector-python代码编写在原来代码基础上添加数据库连接配置fromtypingimportUnionfromfastapiimportFastAPIapp=FastAPI(......
  • TPS63030DSKR开关稳压器芯片中文资料PDF数据手册引脚图产品参数
    TPS63030的说明TPS6303x器件为由两节或三节碱性镍镉或镍氢电池,或单节锂离子或锂聚合物电池。使用单节锂离子或锂聚合物电池时,输出电流可高达600mA,并将其放电至2.5V或更低。降压-升压转换器基于固定频率使用同步整流的脉宽调制(PWM)控制器以获得最大值效率。在低负......
  • SimpleTranslationAIAgent借助SiliconCloud API 构建自己的专属翻译助手
    SimpleTranslationAIAgent介绍SimpleTranslationAIAgent是一款基于C#与LLM通过简单对话即可实现文件到文件的翻译任务的简单应用,基于WPF与SemanticKernel构建。该软件是MIT协议完全开源免费的,但是调用LLM的API可能需要费用,但是没关系,赛博菩萨硅基流动有免费的模型可调了。这个......
  • 豆包 API 调用示例代码详解-Python版
    文章目录豆包API调用示例代码详解-Python版一、事前准备二、所需Python包三、代码详解五、源码下载四、总结豆包官方API文档豆包API调用示例代码详解-Python版在本文中,我们将详细介绍如何使用Python调用豆包API,并提供相关的事前准备和代码执行步骤。一、......
  • 通过C# 读取PDF页面大小、方向、旋转角度
    在C#中读取PDF文件的页面大小、方向以及旋转角度,可以使用第三方库,因为.NET标准库本身并不直接支持处理PDF文件。最常用的库之一是iTextSharp,它是iText的.NET版本,一个开源的库,用于创建和操作PDF文件。以下是一个使用iTextSharp库来读取PDF页面大小、方向和旋转角度的基本示例:......