首页 > 其他分享 >中文文档图片版面检测

中文文档图片版面检测

时间:2023-04-28 21:14:01浏览次数:35  
标签:中文 模型 YOLO results print 文档 8npt 版面 model

项目地址:https://github.com/jiangnanboy/layout_analysis

模型训练及推理

本项目根据开源中文版面数据CDLA ,利用yolov8训练两个模型8mpt与8npt,

CDLA是一个中文文档版面分析数据集,面向中文文献类(论文)场景。包含以下10个label:

正文标题图片图片标题表格表格标题页眉页脚注释公式
Text Title Figure Figure caption Table Table caption Header Footer Reference Equation

训练:

from ultralytics import YOLO

def train_model():
    # 加载模型
    print('model load。。。')
    model = YOLO("8npt/best.pt")  # 加载模型
    print('model load completed。。。')
    #使用模型
    model.train(data="img-layout.yaml", epochs=300, device=1)# , lr0=0.0001)  # 训练模型
    metrics = model.val()  # 在验证集上评估模型性能

8npt

 

8mpt

 

推理:

from ultralytics import YOLO
def infer():
    model = YOLO('8npt/best.pt')
    results = model('img.jpg')
    print(results[0].plot())
    cv2.imwrite('result.png', results[0].plot())

 

标签:中文,模型,YOLO,results,print,文档,8npt,版面,model
From: https://www.cnblogs.com/little-horse/p/17363159.html

相关文章

  • Cobar使用文档(可用作MySQL大型集群解决方案)
    Cobar使用文档(可用作MySQL大型集群解决方案)2014-06-17 1514举报简介: 原文:http://blog.csdn.net/shagoo/article/details/8191346项目已经迁移到Git上面,地址为:https://github.com/alibaba/cobar最近好不容易抽空研究了下Cobar,感觉这个产品确实很不错(在文档方面比Amoeba强多了......
  • Java 读取UTF-8文件中文乱码
    Java读取UTF-8文件中文乱码 InputStreamReaderisr=newInputStreamReader(newFileInputStream(file),"UTF-8");BufferedReaderread=newBufferedReader(isr);  例如:privatestaticStringreadUTF8File(StringfilePath)throwsIOException{ InputStreamReaderi......
  • 超简单!Java 项目自动生成接口文档教程
    你还在用word、markdown埋头苦干写接口文档?写文档这件事恐怕是每个开发都万分抗拒的事情了。本篇文章详细教你如何利用插件工具,在IDEA中自动生成API文档。先来看看从IDEA中生成文档的效果如下图。下图是使用Apifox插件(Apifoxhelper)从IDEA生成的文档(右)效果。第一步......
  • Unity 2019.1 中文更新日志速览版
    洪流学堂微信公众号。洪流学堂,学Unity快人几步Unity2019.1已经正式发布,快来看看一些核心新功能吧!完整版的中文更新日志可在洪流学堂微信公众号回复2019.1获取。今年Unity的第一个技术版本——Unity2019.1已经发布。它包括许多新的可用于生产的功能,例如BurstCompiler,Lightweight......
  • 网安等保-国产Linux操作系统银河麒麟KylinOS-V10SP3常规配置、系统优化与安全加固基线
    [点击......
  • 前端学习文档记录
    没有特意总结,只是将自己看到的觉得比较好的文档记录一下,方便下次以后学习(持续更新中……)  Linux基础知识总结一: Express框架 这个学着更舒服https://www.expressjs.com.cn/4x/api.html#res.append 官方文档JShttps://developer.mozilla.org/zh-CN/docs/Web/JavaScriptjqueryd......
  • 父元素设置相对定位和overflow:hidden会清除子元素绝对定位的脱离文档流效果
     当父元素同时设置相对定位和overflow:hidden时会使得子元素的绝对定位的脱离文档流效果失效。原因:绝对定位会根据最近的设置了绝对定位或相对定位的祖先元素进行定位,绝对定位会使得元素脱离文档流,但这里overflow:hidden会消除脱离文档流的效果,导致了son在设置了绝对定位后依然......
  • N2、中文文本分类
    ......
  • Marior去除边距和迭代内容矫正用于自然文档矫正
    一、简要介绍本文简要介绍了论文“Marior:MarginRemovalandIterativeContentRectificationforDocumentDewarpingintheWild”的相关工作。照相机捕捉到的文档图像通常会出现透视和几何变形。考虑到视觉美感较差和OCR系统性能下降,对其进行纠正具有重要的价值。最近......
  • Python关于jsonpath路径里面包含中文或进行参数化的解决方案
    jsonpath路径包含中文当jsonpath路径包含中文时,我们只需要在jsonpath路径里面把中文用引号包裹即可准备json文件{"data":[{"Details":[{"姓名":"张三"}]}......