首页 > 编程语言 >C# 将PDF文档转换为Markdown文档

C# 将PDF文档转换为Markdown文档

时间:2024-11-01 14:20:30浏览次数:2  
标签:Markdown 转换 C# 文档 pdf PDF NET

将PDF文件转换为Markdown格式是一个非常实用的需求,尤其是在需要将内容从固定布局的PDF文件中提取出来,并转换为更易于编辑和处理的文本格式时。本文将介绍如何通过C#代码将PDF文档转换Markdown(MD)文档。

 

需要用到第三方库 Spire.PDF for .NET。可以从以下链接下载产品包后手动添加引用,或者直接通过NuGet安装。

https://www.e-iceblue.cn/Downloads/Spire-PDF-NET.html

 

C# 将PDF转为Markdown文档

步骤:

  1. 创建 PdfDocument 类的对象
  2. 通过 LoadFromFile() 方法加载PDF文档;
  3. 通过 SaveToFile(string filename, FileFormat.Markdown) 将加载的PDF文档转换为markdown文档。

示例代码:

using Spire.Pdf;

namespace PDFToMarkdown
{
    class Program
    {
        static void Main(string[] args)
        {
            //加载PDF文档
            PdfDocument pdf = new PdfDocument();
            pdf.LoadFromFile("测试.pdf");

            //将PDF转换为MD文档
            pdf.SaveToFile("PDF转Markdown.md", FileFormat.Markdown);
            pdf.Close();
        }
    }
}


 

该Spire.PDF for .NET库支持多种在.NET 程序创建、读取、转换、打印PDF文档的操作,更多示例可以参考:

https://www.e-iceblue.cn/spirepdfnet/spire-pdf-for-net-program-guide-content.html

 

对于生成文档中的水印,点击申请临时授权移除并完整试用:

https://www.e-iceblue.cn/misc/temporary-license.html

标签:Markdown,转换,C#,文档,pdf,PDF,NET
From: https://www.cnblogs.com/Yesi/p/18520083

相关文章

  • Emacs安装
    Emacs安装#Installessentialbuildtoolssudoapt-getinstallbuild-essentialtexinfolibx11-devlibxpm-devlibjpeg-devlibpng-devlibgif-devlibtiff-devlibgtk2.0-devlibncurses-devgnutls-devlibgtk-3-devgitautoconf#Clonesourcegitclone--depth=1h......
  • Go:select时,如果通道已经关闭会怎么样?
    1.for循环里被关闭的通道packagemainimport( "fmt" "time")funcmain(){ c:=make(chanint) gofunc(){ time.Sleep(time.Second) c<-10 close(c) }() for{ select{ casex,ok:=<-c: fmt.Println(x,ok) time.Slee......
  • SketchUp Pro 套件中的 Style Builder 有什么作用
    SketchUpPro套件中的StyleBuilder提供用户个性化样式创建工具,能自定义线条样式以制造独特的呈现效果,增强图示个性,支持载入手绘线条,赋予设计作品更有温度的觉感。StyleBuilder是SketchUpPro的一部分,允许用户轻松设计和创建自己的笔触样式,让模型呈现出手绘效果。使用这一工具,你......
  • 在包装网站pacdora充值的时候用了这个折扣码,会员价直接打折!比平时便宜多了
    只需要按照图片示意的步骤操作就行了!需要手动充值,自动续费是不享受折扣的,用折扣码充值完后记得关掉自动续费包月功能~pacdora会员折扣码:JYC20字母用大写!不要有空格键!每次充值时输入折扣码,充值好后记得关掉自动续费功能,折扣码只有手动有效! ......
  • Ubuntu20.04版本安装pytorch(宝宝级攻略)
     前言在学习深度学习时,安装pytorch是必要的,现在想出一个宝宝级的攻略,希望能够帮助大家节约时间。如果大家通过我的攻略安装成功,请在评论区打出“好用“希望能够帮助到更多人。1.安装前的准备1.检查你的Ubuntu是否安装了显卡驱动程序Ubuntu20.04版本的NVIDIA显卡驱动程序......
  • pacdora3D设计网站用这个码充值,果然便宜很多
     pacdora包装设计网站会员折扣码保存好,字母用大写,中间不要有空格键          【 pacdora会员折扣码:JYC20】       注意:需要手动充值!充值时输入折扣码就能享受折扣价!!!!连续包月自动扣费无法享受折扣价,所以,充值完记得取消连续包月,下次继续......
  • 看CG-FS-M2 金属风速传感器 如何在项目中运用
    产品概述采用电路模块技术开发变送器,操作简单,使用方便,用于实现对环境风速的测量,根据需求可输出脉冲信号,0.4-2V电压或4-20mA电流信号,RS485信号。功能特点◆体积小,携带方便、安装简捷◆测量精度高,量程宽,稳定性好◆结构设计合理,外观质量佳◆数据信息线性度好,信号传输距离长......
  • SpringBoot:Failed to obtain JDBC Connection解决方案
    在第一次给自己的SpringBoot链接mysql的时候会出现很多问题可能的问题和解决方案本地的mysql没办法用root登陆这个一般是因为mysql在初始的时候默认root角色不能用密码登陆的原因可以用sudomysql先用最高权限进入mysql然后查看一下root的信息SELECTUser,Host,pl......
  • Leetcode—624. 数组列表中的最大距离【中等】
    2024每日刷题(198)Leetcode—624.数组列表中的最大距离实现代码classSolution{public:intmaxDistance(vector<vector<int>>&arrays){intm=arrays.size();intn=arrays[0].size();intmn=arrays[0][0];intmx=ar......
  • Richard Matthew Stallman
      RichardMatthewStallman被誉为自由软件的斗士和精神领袖,是伟大的理想主义者。作品:GNUEmacsGPLCopyLeftFSF  进入八十年代后,黑客社群在软件工业商业化的强大压力下日渐土崩瓦解,黑客文化正在受到攻击,Matthew作为一名黑客,于1985年发表了著名的GNU宣言(GNUManifes......