• 2024-09-11【拥抱AI】RAG数据清洗工具MinerU
    MinerU是做什么的?MinerU是一款开源的数据提取工具,由上海人工智能实验室(上海AI实验室)的OpenDataLab团队开发。它主要用于将复杂的PDF文档、网页和电子书转换为易于分析的Markdown格式,同时支持多种语言的识别和处理。MinerU的功能包括布局检测、公式识别、光学字符识别(OCR)以
  • 2024-07-27MinerU、Magic-PDF、Magic-Doc
    文章目录一、关于MinerU二、Magic-PDF1、简介2、项目全景3、流程图4、子模块仓库三、Magic-PDF上手指南1、配置要求2、安装配置1.安装Magic-PDF2.下载模型权重文件3.拷贝配置文件并进行配置4.使用CUDA或MPS加速推理CUDAMPS3、使用说明1)通过命令行使用直接使用