1、书签原始数据获得
一般有许多软件可以通过提供章节序号 章节标题 章节页码
的格式来生成目录
第1章 基础A1 1
1.1 Scala解释器1
1.2 声明值和变量 3
1.3 常用类型 4
1.4 算术和操作符重载 5
1.5 调用函数和方法 7
1.6 apply方法8
1.7 Scaladoc9
对于该格式,可以网上搜索书籍复制粘贴,也可以对目录页取OCR。
网上获取来源:
序列 | 途径 | 备注 |
a | 书籍网上商城 | 京东,亚马逊,当当,中国图书网 |
b | pdf上直接拷贝 | PDF文字可直接拷贝 |
c | OCR文字识别 | 区域识别并保持排版格式的,比如Adobe Acrobat |
2、书签目录生成
通过原始数据生成目录:
pdf-bookmark
https://github.com/ifnoelse/pdf-bookmark
PdgCntEditor
https://www.jianshu.com/p/9683e7094871
直接OCR生成目录:
PDF 补丁丁
https://www.jianshu.com/p/1adca25a64b3