首页 > 编程语言 >ocr算法

ocr算法

时间:2024-10-12 15:00:57浏览次数:1  
标签:模态 抽取 模型 ocr 算法 文档 OCR

岗位描述:
1、文档结构化信息抽取、文档版面分析、文档表格识别、文档OCR等CV/多模态/模型算法工作方向;
2、负责优化和维护公司文档结构化和信息抽取相关模型算法、票据OCR模型算法、文档OCR模型算法。
岗位要求:
1、研究生及以上学历,计算机、数学或相关专业,有独立解决复杂问题的能力;
2、3年以上文档结构化信息抽取、表格多模态信息抽取或相似的模型优化工作经验;
3、熟练使用 Tensorflow、Pytorch 中至少一个网络推理框架,3年以上模型优化工作经验;
4、熟悉常用CV模型并有相关工作经验,包括不限于 DBNet、UNet、YOLO系列;
5、熟悉至少一个多模态/LLM模型并有相关工作经验,例如 LayoutLMV3、GeoLayoutLM、SLANet、SeqGPT、Qwen2 等。

标签:模态,抽取,模型,ocr,算法,文档,OCR
From: https://www.cnblogs.com/hshy/p/18460554

相关文章

  • lake3哈希算法的介绍、特点、原理与Blake3.Net的特点
    1.Blake3的介绍与特点哈希函数专为文件完整性验证等应用而设计,加密数字签名的消息认证和数据生成。Blake3不是为散列密码而设计的,因为它旨在尽可能快地计算散列(对于密码,建议使用慢散列和escrypt、bcrypt、scrypt或Argon2函数)。所讨论的散列函数对正在处理的数据大小不敏感,并......
  • 【机器学习】随机森林算法(看我以弱博强)
    目录算法引入:算法介绍:1.集成学习:2.训练过程:3.分类和回归:算法优点:算法缺点:算法实现:1.数据准备2.划分数据集3.创建随机森林模型4.训练模型5.预测6.评估模型完整代码示例人工智能领域在当今可谓炙手可热,在人工智能与机器学习领域,随机森林(RandomForest)......
  • C#二分查找算法
    前言二分查找算法是一种在有序数组中查找特定元素的搜索算法。实现原理二分查找的实现依赖于以下几个关键步骤:计算查找范围的中间索引。比较中间索引处的值与目标值。根据比较结果调整查找范围(左半部分或右半部分)。重复上述步骤直到找到目标值或查找范围为空。动图演示......
  • 地平线双目深度估计参考算法 StereoNetPlus优化 思路解读
    【参考算法】地平线双目深度估计参考算法StereoNetPlus-v1.2.11.引言本文将介绍地平线基于公版的双目深度估计算法StereoNet做的优化设计。首先介绍了双目深度估计的原理以及双目点云和Lidar点云的对比,然后由公版StereoNet的介绍切入到地平线参考算法的针对性优化,最后对......
  • 编程算法 --- Polybius 方阵密码解密
      这段代码的作用是通过Polybius方阵密码的方式来解密一段只包含元音字母的密文。具体来说,它通过元音字母的全排列来生成多个可能的映射方案,然后将密文中的元音字母转换成数字序列,并根据这些数字对查找字母棋盘中的字母,尝试还原出可能的明文。程序会输出所有可能的明文,供人工......
  • 多代理强化学习综述:原理、算法与挑战
    引言多代理强化学习(Multi-AgentReinforcementLearning,MARL)是强化学习的一个重要分支,它将传统的单代理强化学习概念扩展到多代理环境中。在MARL中,多个代理通过与环境和其他代理的交互来学习最优策略,以在协作或竞争场景中最大化累积奖励。MAgent中代理之间的对抗(混合MARL示例......
  • 数据结构与算法 - 单链表 & 双链表 -- 概念+实现
    文章目录前言一、顺序表的缺陷二、链表是如何设计的?三、链表的分类四、链表的概念及其结构1、链表的概念:2、链表的结构五、不带头单向不循环链表的实现(一)、SList.h的实现(二)、SList.c的实现1、初始化2、创建结点3、头插4、尾插4、头删5、尾删6、指定p......
  • 198号资源-源程序:(SCI论文+程序)未知时延下无线传感器网络时钟同步算法研究-----已提供下
    ......
  • 代码随想录算法训练营day12|144.二叉树的前序遍历 94.二叉树的中序遍历 145.二叉
    学习资料:https://programmercarl.com/二叉树理论基础.html二叉树:满二叉树、完全二叉树、二叉搜索数、平衡二叉搜索树;链式存储、顺序存储;前序/中序/后序遍历递归法、迭代法,层序深度优先搜索dfs,广度优先搜索学习记录:144.二叉树的前序遍历(也要注重二叉数的输入方式;递归法比迭......
  • 【动物识别系统】Python+卷积神经网络算法+人工智能项目+深度学习+计算机课设项目
    一、介绍动物识别系统。本项目以Python作为主要编程语言,并基于TensorFlow搭建ResNet50卷积神经网络算法模型,通过收集4种常见的动物图像数据集(猫、狗、鸡、马)然后进行模型训练,得到一个识别精度较高的模型文件,然后保存为本地格式的H5格式文件。再基于Django开发Web网页端操作......