网站首页
编程语言
数据库
系统相关
其他分享
编程问答
idxes
2024-06-12
【文档智能 & RAG】RAG增强之路:增强PDF解析并结构化技术路线方案及思路
前言现阶段,尽管大模型在生成式问答上取得了很大的成功,但由于大部分的数据都是私有数据,大模型的训练及微调成本非常高,RAG的方式逐渐成为落地应用的一种重要的选择方式。然而,如何准确的对文档进行划分chunks,成为一种挑战,在现实中,大部分的专业文档都是以PDF格式存储,低精度的