首页 > 其他分享 >利用Swin-Unet(Swin Transformer Unet)实现对文档图片里表格结构的识别

利用Swin-Unet(Swin Transformer Unet)实现对文档图片里表格结构的识别

时间:2024-07-23 20:50:54浏览次数:8  
标签:Transformer Swin 表格 ## 检测 Unet ###

项目:https://github.com/jiangnanboy/table_structure_recognition

# 利用Swin-Unet(Swin Transformer Unet)实现对文档图片里表格结构的识别

## 实现功能

- [x] 识别表格中的线条

- [ ] 结果转为excel

## 下载weights模型文件

见github

将模型文件放到model目录下

## 训练(tensorflow2.5版本训练)

见本项目中的train.py

## 预测

见本项目中的table_line_infer.py

## 识别结果展示

### 表格线检测

### 表格线检测

### 表格线检测

### 表格线检测

### 表格线检测

### 表格线检测

 

标签:Transformer,Swin,表格,##,检测,Unet,###
From: https://www.cnblogs.com/little-horse/p/18319619

相关文章

  • Python贝叶斯、transformer自注意力机制self-attention个性化推荐模型预测课程平台学
    全文链接:https://tecdat.cn/?p=37090原文出处:拓端数据部落公众号 分析师:KungFu近年来,在线课程凭借便捷的网络变得越来越流行。为了有更好的用户体验,在线课程平台想要给用户推荐他们所感兴趣的课程,以便增大点击率和用户黏性。解决方案任务/目标根据学生所选的历史课程,预测出......
  • Transformer-Embedding
    导包#导入包importtorchfromtorchimportnnimporttorch.nn.functionalasfimportmathTokenEmbedding#首先定义tokenembaddingfromtorchimportTensor"""将输入词汇表的索引转换成指定维度的Embedding"""classTokenEmbedding(nn.Embedding......
  • 魔改Transformer!9种提速又提效的模型优化方案
    Transformer目前已经成为人工智能领域的主流模型,应用非常广泛。然而Transformer中注意力机制计算代价较高,随着序列长度的增加,这个计算量还会持续上升。为了解决这个问题,业内出现了许多Transformer的魔改工作,以优化Transformer的运行效率。我这次就给大家分享9篇对Transform......
  • 一文看懂AI的 Transformer 架构!
    1AI的转换器是啥?转换器,一种将输入序列转换或更改为输出序列的神经网络架构。它们通过学习上下文和跟踪序列组件之间的关系来做到这一点。例如,请考虑以下输入序列:“天空是什么颜色的?”转换器模型会使用内部数学表示法来识别颜色、天空和蓝色这三个词之间的相关性和关系。......
  • 快速学习一个算法,Transformer
    今天给大家介绍一个强大的算法模型,TransformerTransformer模型是由Vaswani等人在2017年提出的一种用于自然语言处理的深度学习模型,特别擅长于处理序列到序列的任务,如机器翻译、文本生成等。今天,我们主要从编码的角度来进行说明。Transformer模型架构Transformer......
  • 一文看懂AI的 Transformer 架构!
    1AI的转换器是啥?转换器,一种将输入序列转换或更改为输出序列的神经网络架构。它们通过学习上下文和跟踪序列组件之间的关系来做到这一点。例如,请考虑以下输入序列:“天空是什么颜色的?”转换器模型会使用内部数学表示法来识别颜色、天空和蓝色这三个词之间的相关性和关系。利用这......
  • Transformer 模型和Attention注意力机制学习笔记
    文章目录Transformer模型结构注意力机制ScaledDot-ProductAttention缩放点注意力机制工作流程并行机制Multi-HeadAttention多头注意力机制工作流程Embedding单词Embedding位置编码PositionalEncodingEncoderAdd&NormFeedForwardNetworkDecoderMaskedMul......
  • Hugging Face基础:简单讲解Transformer模型和结构,小白也能看懂,每个词都给你解释清楚了!
    1.Transformer是什么Transformer 是一个基于自注意力机制(Self-attentionmechanism)的神经网络架构,是由2017年的论文《AttentionisAllYouNeed》中提出的,为自然语言处理(NaturalLanguageProcessing)领域带来了新的模型架构。他是一种seq2seq模型(SequencetoSequenceMo......
  • 基于Vision Transformer的mini_ImageNet图片分类实战
    【图书推荐】《PyTorch深度学习与计算机视觉实践》-CSDN博客PyTorch计算机视觉之VisionTransformer整体结构-CSDN博客mini_ImageNet数据集简介与下载mini_ImageNet数据集节选自ImageNet数据集。ImageNet是一个非常有名的大型视觉数据集,它的建立旨在促进视觉识别研究。Imag......
  • Acunetix v24.7 (Linux, Windows) - Web 应用程序安全测试
    Acunetixv24.7(Linux,Windows)-Web应用程序安全测试Acunetix|WebApplicationSecurityScanner请访问原文链接:https://sysin.org/blog/acunetix/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.org重要提示AcunetixPremium现在使用日历化版本命名。请注意,从......