网站首页
编程语言
数据库
系统相关
其他分享
编程问答
Chunkr
2024-11-18
Chunkr: 在线PDF文档解析与OCR工具
介绍1版面分割模型这部分属于另一个项目(pdf-document-layout-analysis)的内容,可以移步查看具体模型的介绍和训练过程。1.1机器学习模型基于LIGHTGBM算法,并且只需要使用CPU资源,因此对硬件要求不高,速度快,但是只能处理文字类型的PDF。1.2VGT模型能处理图片PDF,同时把版面内容