首页 > 其他分享 >基于Vision Transformers的文档理解简介

基于Vision Transformers的文档理解简介

时间:2022-12-14 10:11:36浏览次数:64  
标签:NLP transformer 嵌入 Transformers 文档 图像 CV Vision

文档理解是从pdf、图像和Word文档中提取关键信息的技术。这篇文章的目标是提供一个文档理解模型的概述。

文档理解算法使用编码器-解码器结构分析文档内容,该管道结合了计算机视觉(CV)和自然语言处理(NLP)方法。管道的CV部分将文档作为输入图像进行分析,生成transformer可以处理的表示形式。在下图中,CV模型生成图像嵌入,并将其馈送到多模态transformer中。

在以前,卷积神经网络(cnn)如ResNet已经主导了CV领域。最近,类似于NLP架构(如BERT)的VIT作为cnn的替代方法获得了更多的关注。ViTs首先将输入图像分割为若干块,将这些块转换为线性嵌入序列,然后将这些嵌入馈送到transformer 编码器中。这个过程如图2所示。线性嵌入的作用类似于NLP中的令牌。与NLP模型一样,transformer 的输出可用于图像分类等任务。

完整文章:

https://avoid.overfit.cn/post/6264490feb9d44eaad7a7d56e3987755

标签:NLP,transformer,嵌入,Transformers,文档,图像,CV,Vision
From: https://www.cnblogs.com/deephub/p/16981353.html

相关文章

  • HTML文档类型<!DOCTYPE>
    <!DOCTYPE>声明帮助浏览器正确地显示网页。<!DOCTYPE>声明Web世界中存在许多不同的文档。只有了解文档的类型,浏览器才能正确地显示文档。HTML也有多个不同的版本,只......
  • Vue3.0文档学习心得--依赖注入
    1.provide():在祖先组件或整个应用(通过 app.provide()) 提供一个值,可以被后代组件注入。(1)第一个参数是要注入的key,可以是一个字符串或者一个symbol,第二个参数是要......
  • 如何通过Java应用程序压缩PDF文档
     PDF文档是我们日常办公中使用最频繁的文档格式。但因为大多数PDF文档都包含很多页面图像或大量图片,这就导致PDF文档过大,处理起来较为麻烦。PDF文件过大,就会导致传输或者......
  • spark structured streaming (结构化流) join 操作( 官方文档翻译)
    spark结构化流join连接结构化流支持将流dataset/DataFrame与静态dataset/DataFrame,或者另一个流数据集-DataFrame连接起来。流式连接的结果是增量生成的,与流式聚合(str......
  • DRF自动生成接口文档:coreapi和Swagger
    我们在开发完一个接口后,RESTframework可以自动帮助我们生成接口文档,我们只需要简单设置即可。下面介绍coreapi和Swagger这两种。一、coreapi1、安装依赖pipinstallc......
  • 【校招VIP】[约起来] 开发文档:活动发布模块的模型
    今天我们来看活动发布模块第二节课,开发文档的设计。开发文档是根据原型图的功能点去做数据库和接口的设计,接口设计属于单独的接口文档,后面的课程会讲。这节课主要包括三个......
  • Linux libxls和xlslib读写Excel文档【转】
    转自:https://www.joxrays.com/linux-xls/这里要讨论的是两款开源库libxls和xlslib,前者用与读Excel,后者用于写.所以可以在Linux或Windows上使用libxls(读Excel......
  • 前端项目实战79-postgrest的增删改查简单文档
    Postgrest使用手册1过滤出is_delete=0的数据分页查询并按照id倒叙排列2GEThttp://127.0.0.1:3000/t_wms_location?is_delete=eq......
  • 总结Python设置Excel单元格样式的一切,比官方文档还详细
    OverridetheentrypointofanimageIntroducedinGitLabandGitLabRunner9.4.Readmoreaboutthe extendedconfigurationoptions.Beforeexplainingtheav......
  • 自动生成接口文档
    目录1、安装依赖2、设置接口文档访问路径3、文档描述说明的定义位置restframework可以自动帮助生成接口文档接口文档以网页的方式呈现自动接口文档能生成的是继承自API......