• 2024-08-01Marker效果试用,也是pdf2md
        主要原理Marker的工作原理基于深度学习模型。它首先通过OCR技术(如果需要的话)提取文本(采用启发式算法和tesseract工具),然后检测页面布局并确定阅读顺序(使用布局分割器[1]和列检测器[2])。接下来,Marker会对每个文本块进行清洁和格式化处理(运用启发式算法和nougat[3