PDF是一种跨操作系统平台的电子文件格式,它能在各种不同的平台上以相同的版式显示。很多扫描书籍或者电子书籍都会采用PDF格式存储。
但是移动端由于屏幕的限制,以原版展示PDF会导致画面缩放严重,影响阅读体验。
现在能在移动端重排版PDF的软件主要有小白PDF阅读器和基于开源项目k2pdfopt二次开发的软件如KOReader和国内的带有重排功能的电子书阅读器。
由于KOReader与国内带有重排功能的电子书阅读器的重拍效果基本一致,所以下面就只比较小白PDF阅读器与KOReader的重排效果了。
一、简单图文混排PDF页面重排对比
KOReader基本能实现简单图文混排页面的重排,但是在段落和有项目符号的地方重排效果还有待改进,小白PDF阅读器的重排效果对比来看要好很多。
二、复杂图文PDF页面重排对比
面对比较复杂的PDF页面,KOReader重排效果稍差,未能将被包围的“眼镜”图片区域识别出来并重新排版并且将图片标题排版错了,而小白PDF阅读器就能智能的将“眼镜”图片及小标题识别出来,并重新排版;同时还智能的识别了页面标题,并在重新排版时给与优化显示。在段落间隔以及文本间隔的处理方面,小白PDF阅读器更能接近原始页面的比例,效果更加自然舒适。
三、扫描质量较差的PDF重排版对比
这个时扫描质量较差的PDF页面,周围有干扰,并且页面倾斜;对比来看小白PDF阅读器的重拍版效果还是可以接受的,而KOReader阅读器的重排效果就差强人意了。通过这个页面可以看到小白PDF阅读器排版前自动矫正了倾斜页面并对C语言代码部分的重排效果做了特别的优化;基本上保留了原版的代码格式。
四、针对编程技术类书籍的重排版对比
这张PDF原图中有一段java代码,KOReader阅读器直接无视了这段代码给当成普通文本重拍版了,未能保留代码个缩进等格式,造成整体的重排效果比较混乱。小白PDF阅读器智能的识别了这段代码,并保持了原有代码的缩进等,并在重排版自动换行时考虑了整体的缩进情况,整体效果非常好。小白PDF阅读器针对编程类PDF书籍做了特别优化,能智能识别java、c\c++、c#、python、go、js等常见的编程语言和json、xml文本格式,在重拍版时会尽量保持原有格式。
五、针对论文类的多列文档的重排版比较
这个文档其实是很复杂的从上到下分为表头、表格及表格标题、左右分栏的文本、图表及标题、左右分栏的文本。通过对比可以发现KOReader阅读器排版效果非常不理想,标题混乱、未能正确识别表格、左右分栏的文本块也排版混乱。而小白PDF阅读器则表现非常好,正确识别了各种元素,并能很好的重排版。
六、试题类PDF重排版对比
小白PDF阅读器针对试题类的PDF页面做了专门优化,能自动智能识别单选多选等类型的试题页面,并在排版时优化显示效果,KOReader阅读器则没有任何优化,直接当成文本显示了,所以针对试题类的PDF文件,小白PDF阅读器的重排版效果要更好一些。
六、带有数学公式类PDF重排版对比
可能是由于左侧竖杠的干扰,KOReader阅读器直接已原版显示了,未能重新排版。小白PDF阅读器则表现优异,自动排除了左侧竖杠的干扰,能正确识别页面元素,并能智能识别数学公式在排版时优化显示。
通过对比两款能将PDF页面自动重排的阅读器的效果可以看出,小白PDF阅读器的排版显示效果要好于KOReader阅读器的,由于KOReader及一众国内能自动重排PDF页面的阅读器大部分都基于k2pdfopt开源项目,所以小白PDF阅读器的重排版功能,目前来看时效果最好的
标签:端重,重排,KOReader,阅读器,PDF,排版,页面 From: https://www.cnblogs.com/wlz8/p/17114323.html