首页 > 其他分享 >移动端重排版PDF阅读器比较

移动端重排版PDF阅读器比较

时间:2023-02-12 23:33:05浏览次数:46  
标签:端重 重排 KOReader 阅读器 PDF 排版 页面

PDF是一种跨操作系统平台的电子文件格式,它能在各种不同的平台上以相同的版式显示。很多扫描书籍或者电子书籍都会采用PDF格式存储。

但是移动端由于屏幕的限制,以原版展示PDF会导致画面缩放严重,影响阅读体验。

 现在能在移动端重排版PDF的软件主要有小白PDF阅读器和基于开源项目k2pdfopt二次开发的软件如KOReader和国内的带有重排功能的电子书阅读器。

由于KOReader与国内带有重排功能的电子书阅读器的重拍效果基本一致,所以下面就只比较小白PDF阅读器与KOReader的重排效果了。

一、简单图文混排PDF页面重排对比

KOReader基本能实现简单图文混排页面的重排,但是在段落和有项目符号的地方重排效果还有待改进,小白PDF阅读器的重排效果对比来看要好很多。

二、复杂图文PDF页面重排对比

面对比较复杂的PDF页面,KOReader重排效果稍差,未能将被包围的“眼镜”图片区域识别出来并重新排版并且将图片标题排版错了,而小白PDF阅读器就能智能的将“眼镜”图片及小标题识别出来,并重新排版;同时还智能的识别了页面标题,并在重新排版时给与优化显示。在段落间隔以及文本间隔的处理方面,小白PDF阅读器更能接近原始页面的比例,效果更加自然舒适。

三、扫描质量较差的PDF重排版对比

这个时扫描质量较差的PDF页面,周围有干扰,并且页面倾斜;对比来看小白PDF阅读器的重拍版效果还是可以接受的,而KOReader阅读器的重排效果就差强人意了。通过这个页面可以看到小白PDF阅读器排版前自动矫正了倾斜页面并对C语言代码部分的重排效果做了特别的优化;基本上保留了原版的代码格式。

四、针对编程技术类书籍的重排版对比

这张PDF原图中有一段java代码,KOReader阅读器直接无视了这段代码给当成普通文本重拍版了,未能保留代码个缩进等格式,造成整体的重排效果比较混乱。小白PDF阅读器智能的识别了这段代码,并保持了原有代码的缩进等,并在重排版自动换行时考虑了整体的缩进情况,整体效果非常好。小白PDF阅读器针对编程类PDF书籍做了特别优化,能智能识别java、c\c++、c#、python、go、js等常见的编程语言和json、xml文本格式,在重拍版时会尽量保持原有格式。

五、针对论文类的多列文档的重排版比较

这个文档其实是很复杂的从上到下分为表头、表格及表格标题、左右分栏的文本、图表及标题、左右分栏的文本。通过对比可以发现KOReader阅读器排版效果非常不理想,标题混乱、未能正确识别表格、左右分栏的文本块也排版混乱。而小白PDF阅读器则表现非常好,正确识别了各种元素,并能很好的重排版。

六、试题类PDF重排版对比

小白PDF阅读器针对试题类的PDF页面做了专门优化,能自动智能识别单选多选等类型的试题页面,并在排版时优化显示效果,KOReader阅读器则没有任何优化,直接当成文本显示了,所以针对试题类的PDF文件,小白PDF阅读器的重排版效果要更好一些。

六、带有数学公式类PDF重排版对比

可能是由于左侧竖杠的干扰,KOReader阅读器直接已原版显示了,未能重新排版。小白PDF阅读器则表现优异,自动排除了左侧竖杠的干扰,能正确识别页面元素,并能智能识别数学公式在排版时优化显示。

 

通过对比两款能将PDF页面自动重排的阅读器的效果可以看出,小白PDF阅读器的排版显示效果要好于KOReader阅读器的,由于KOReader及一众国内能自动重排PDF页面的阅读器大部分都基于k2pdfopt开源项目,所以小白PDF阅读器的重排版功能,目前来看时效果最好的

标签:端重,重排,KOReader,阅读器,PDF,排版,页面
From: https://www.cnblogs.com/wlz8/p/17114323.html

相关文章

  • .Net Core 操作PDF模板
    1.安装PdfSharpCore   2.PdfSharpCore.Pdf.PdfDocumentdoc=PdfSharpCore.Pdf.IO.PdfReader.Open(temppath,PdfDocumentOpenMode.Modify);//创建一个文档实例,t......
  • 【ArcPy】从地图文档MXD出图(PDF或JPG格式)
    Python工具代码,非Python窗口脚本,可以自行编辑处理一下。#coding=gbkimportarcpyfromarcpyimportmappingimportosdefmain():inFolder=arcpy.GetParamete......
  • 解决一个移动端pdf预览问题
    最近测试提了一个问题,移动端部分页面的pdf,在预览时只能放大一点,和另外的页面放大程度差距很大,希望可以增加这些页面的pdf放大程度,下面记录了解决问题的过程首先看了代码,......
  • 计算机操作系统 第四版 电子书 pdf
    作者:汤小丹出版社:西安电子科技大学出版社 关注公众号:红宸笑。回复:电子书即可  本书对传统和现代的操作系统原理与实现均作了较为全面的介绍。介绍了OS的发......
  • 2024王道计算机考研408单科书四本全 电子书 pdf
    关注公众号:红宸笑。回复:考研即可  ......
  • 文本pdf转epub的一点体会(续)
    如果同时提取文本和图片,需要实现IRenderListener接口里的RenderImage和RenderText方法。RenderImage方法:publicvoidRenderImage(ImageRenderInfoinfo)......
  • 数据结构 C语言版 第2版 严蔚敏 电子书 pdf
    作者:严蔚敏出版社:人民邮电出版社原作名:严蔚敏,李冬梅,吴伟民 关注公众号:红宸笑。回复:电子书即可  《数据结构(C语言版第2版)/21世纪高等学校计算机规划教......
  • 计算机组成原理 第2版 唐朔飞 电子书 pdf
    作者:唐朔飞出版社:高等教育出版社 关注公众号:红宸笑。回复:电子书即可  《面向21世纪课程教材•普通高等教育"十一五"国家级规划教材:计算机组成原理(第2......
  • 识别pdf图片文字内容的方法
    场景:pdf电子书是扫描的图片,需要将图片里的文字内容进行输出1、首先下载QQ浏览器来打开pdf(pdf名称不要含有中文,否则后续代码识别会报错),QQ浏览器里面有逐页保存图片的功能,使......
  • 富文本编辑器实现pdf自动上传
    ​ 当前功能基于PHP,其它语言流程大致相同 1.新增上传wordjson配置在ueditor\php\config.json中新增如下配置:     /* 上传word配置 */    "wordAction......