首页 > 其他分享 >三种方法让.NET轻松实现Excel转PDF

三种方法让.NET轻松实现Excel转PDF

时间:2023-06-13 12:44:55浏览次数:43  
标签:Spire Excel HTML new PDF NET 方法

前一段时间有网友问Excel转pdf怎么转pdf,小编帮他实现了一个,方法是使用EPPlus和PdfSharp组件实现,由于依赖OfficeOpenXml他也没有用上,后来小编又实现了二种不依赖OfficeOpenXml的方法。本文将介绍这三种方法实现Excel转pdf。

一、EPPlus和PdfSharp组件实现

逻辑是先将Excel内容转换为HTML字符串,然后再将HTML字符串转换为PDF文件。转换过程中的格式和样式可能会有一些差异,您可能需要根据需求进行进一步的调整和优化。

使用方法

1、首先使用“NuGet 包管理器”安装EPPlus和PdfSharp

2、在代码页面引用

using IronPdf;
using OfficeOpenXml;

3、建两个方法ConvertExcelToPdf和ExcelToHtml

ConvertExcelToPdf方法用于将Excel文件转换为PDF文件,ExcelToHtml这个方法将Excel工作表的内容转换为HTML字符串。代码如下:

 public static void ConvertExcelToPdf(string excelFilePath, string pdfFilePath)
        {
            // 读取Excel文件
            using (ExcelPackage package = new ExcelPackage(new FileInfo(excelFilePath)))
            {
                ExcelPackage.LicenseContext = LicenseContext.NonCommercial;
                ExcelWorksheet worksheet = package.Workbook.Worksheets[0]; // 假设要转换的工作表是第一个工作表

                // 创建一个HTML字符串,将Excel内容转换为HTML
                string htmlContent = ExcelToHtml(worksheet);

                // 使用IronPDF将HTML字符串转换为PDF
                var renderer = new HtmlToPdf();
                renderer.PrintOptions.MarginTop = 0;
                renderer.PrintOptions.MarginBottom = 0;
                renderer.PrintOptions.MarginLeft = 0;
                renderer.PrintOptions.MarginRight = 0;
                var pdf = renderer.RenderHtmlAsPdf(htmlContent);

                // 保存PDF文件
                pdf.SaveAs(pdfFilePath);
            }
        }

          public static string ExcelToHtml(ExcelWorksheet worksheet)
        {
            var sb = new StringBuilder();
            sb.AppendLine("<table>");
            var startRow = worksheet.Dimension.Start.Row;
            var endRow = worksheet.Dimension.End.Row;
            var startColumn = worksheet.Dimension.Start.Column;
            var endColumn = worksheet.Dimension.End.Column;

            for (int row = startRow; row <= endRow; row++)
            {
                sb.AppendLine("<tr>");

                for (int col = startColumn; col <= endColumn; col++)
                {
                    var cellValue = worksheet.Cells[row, col].Value;
                    sb.AppendLine("<td>" + (cellValue != null ? cellValue.ToString() : "") + "</td>");
                }

                sb.AppendLine("</tr>");
            }
            sb.AppendLine("</table>");
            return sb.ToString();
        }

  //调用方法
string excelFilePath = "C:\\Users\\user\\Desktop\\test.xlsx";
string pdfFilePath = "C:\\Users\\user\\Desktop\\test.pdf";
exceltopdf.ConvertExcelToPdf(excelFilePath, pdfFilePath);

主要有两个方法:

ConvertExcelToPdf: 这个方法用于将Excel文件转换为PDF文件。它首先使用ExcelPackage类从Excel文件中读取数据。然后,调用ExcelToHtml方法将Excel内容转换为HTML字符串。接下来,使用IronPDF库中的HtmlToPdf类将HTML字符串转换为PDF对象。最后,将PDF对象保存到指定的PDF文件路径中。

ExcelToHtml: 这个方法将Excel工作表的内容转换为HTML字符串。它使用StringBuilder来构建HTML字符串。首先,它添加

标签作为表格的开始。然后,通过遍历工作表的行和列,将每个单元格的值添加到HTML字符串中作为一个td元素。最后,添加table标签作为表格的结束,并将构建好的HTML字符串返回。

缺点:此方法可能需要依赖office,网友回复反馈;另外需要用html进行格式处理,也是个麻烦事情。

效果:

、Spire组件实现

逻辑是首先使用Spire.XLS库加载Excel文件,并使用Spire.PDF库创建PDF文档。然后,我们遍历Excel文件的每个工作表,将表格内容逐个绘制到PDF页面上。

使用方法

1、首先使用“NuGet 包管理器”安装Spire。注意的是需要安装Spire,不要安装Spire.XLS和Spire.PDF否则会出现不兼容的问题。

2、在代码页面引用

using Spire.Pdf;
using Spire.Pdf.Graphics;
using Spire.Xls;

3、只需要建一个方法ConvertExcelToPdf。传入要转换的excel路径和输出的路径,代码如下:

   public static void ConvertExcelToPdf(string excelFilePath, string pdfFilePath)
        {
            // 加载Excel文件
            Workbook workbook = new Workbook();
            workbook.LoadFromFile(excelFilePath);
            // 创建PDF文档
            PdfDocument pdfDocument = new PdfDocument();
            // 添加Excel表格内容到PDF
            foreach (Worksheet sheet in workbook.Worksheets)
            {
                PdfPageBase pdfPage = pdfDocument.Pages.Add();
                PdfDocument document = new PdfDocument();
                PdfTrueTypeFont fonts = new PdfTrueTypeFont(@"C:\Windows\Fonts\simfang.ttf", 10f);
                // 获取Excel表格的行数和列数
                int rowCount = sheet.LastRow + 1;
                int columnCount = sheet.LastColumn + 1;
                // 将Excel表格内容逐个添加到PDF
                for (int row = 1; row <= rowCount; row++)
                {
                    for (int column = 1; column <= columnCount; column++)
                    {
                        string value = sheet.Range[row, column].Text;
                        if (value != null)
                        // 绘制单元格内容到PDF页面
                        {
                            pdfPage.Canvas.DrawString(value, fonts, PdfBrushes.Black, column * 70, row * 20);
                        }
                    }
                }
            }
            // 保存PDF文件
            pdfDocument.SaveToFile(pdfFilePath);
            Console.WriteLine("PDF转换完成。");
        }
  //调用方法跟上面一样

此方法需要注意的是Spire默认不支持中文,需要我们单独引用中文字库,在代码的13行就是引用字库的地方,大家可以把字库拷贝到自己的项目引用。

缺点:默认不支持中文字库,需要单独引用;另外输出格式不带表格(可能可以调);免费版本有水印,这个网上有解决方案,大家可以去某度搜索。

效果如下:

三、NPOI和iTextSharp组件实现

逻辑是通过使用NPOI库读取Excel文件,然后使用iTextSharp库创建PDF文档。

使用方法

1、首先使用“NuGet 包管理器”安装NPOI和iTextSharp。

2、在代码页面引用

using NPOI.SS.UserModel;
using NPOI.XSSF.UserModel;
using iTextSharp.text;
using iTextSharp.text.pdf;

3、需要建二个方法,ConvertExcelToPdf和GetChineseFont方法,GetChineseFont主要作业是字符格式转换。ConvertExcelToPdf传入要转的excel路径和输出的路径,代码如下:

     public static void ConvertExcelToPdf2(string excelFilePath, string pdfFilePath)
        {
            Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);
            // 加载Excel文件
            using (FileStream fileStream = new FileStream(excelFilePath, FileMode.Open, FileAccess.Read))
            {
                IWorkbook workbook = new XSSFWorkbook(fileStream);
                ISheet sheet = workbook.GetSheetAt(0);
                // 创建PDF文档
                Document document = new Document();
                // 创建PDF写入器
                PdfWriter writer = PdfWriter.GetInstance(document, new FileStream(pdfFilePath, FileMode.Create));
                // 打开PDF文档
                document.Open();
                // 添加Excel表格内容到PDF
                PdfPTable table = new PdfPTable(sheet.GetRow(0).LastCellNum);
                table.WidthPercentage = 100;

                foreach (IRow row in sheet)
                {
                    foreach (ICell cell in row)
                    {
                        string value = cell.ToString();
                        PdfPCell pdfCell = new PdfPCell(new Phrase(value, GetChineseFont()));
                        table.AddCell(pdfCell);
                    }
                }
                document.Add(table);
                // 关闭PDF文档
                document.Close();
            }
            Console.WriteLine("PDF转换完成。");
        }
        static Font GetChineseFont()
        {
            var baseFont = BaseFont.CreateFont(@"C:\Windows\Fonts\simfang.ttf", BaseFont.IDENTITY_H, BaseFont.EMBEDDED);
            return new Font(baseFont, 12);
        }
 //调用方法跟方法一一样
//欢迎关注公众号:DOTNET开发跳槽,领取海量面试题。加微信号xbhpnet入群交流

此方法跟Spire一样默认不支持中文,需要我们单独引用中文字库,方法GetChineseFont就是处理引用中文字库。另外需要需要在 NuGet 里添加 System.Text.Encoding.CodePages并注册,否则会报错,注册如下。

Encoding.RegisterProvider(CodePagesEncodingProvider.Instance);

缺点:此方法也比较坑,不支持中文,还需要引用额外的字库支持组件CodePages。

效果如下:

结语

本文介绍了.NET三种方法实现Excel转pdf,他们各有优点,第一种可以自定义样式,第二种依赖独立组件,第三种显示效果更佳,从使用效果来看小编推荐第三种。其实还有很多组件实现Excel转pdf,比如Aspose.Cells,有的需要授权收取费用、大家自己可以研究一下。本项目是基于.NET7在windows下测试运行,在linux下没有实验过,大家可以尝试一下。大家还有什么好的方式实现Excel转pdf呢?欢迎留言讨论。

来源公众号:DotNet开发跳槽

标签:Spire,Excel,HTML,new,PDF,NET,方法
From: https://www.cnblogs.com/xbhp/p/17477212.html

相关文章

  • 将JSON数据导入Excel中
    将JSON数据导入Excel中1、将在浏览器中的JSON数据复制出来,在桌面或者其他位置创建一个文本文件,将JSON数据粘贴进去,并将文件名的后缀改为.JSON格式,例如JSON.JSON{"students":[{"name":"JohnDoe","math":90,"science":85,"english&......
  • Java 利用POI对象 SXSSFWorkbook 导出Excel
    最开始调用的方法是(标记的地方): workbook=newHSSFWorkbook();和workbook=newXSSFWorkbook();这两个方法就是导出Excel的最关键的方法,接下来我来说说这两个方法作用:1.HSSFWorkbook:是操作Excel2003以前(包括2003)的版本,扩展名是.xls;2.XSSFWorkbook:是操作Excel2007的版本......
  • 根据复杂excel文档模板导出excel表格
    1,首先导入阿里的jar包<dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>3.0.2</version></dependency> 2,将模板excel文件放在对应目录下,取文件时根据存放路径取①模板内容 ②模板存放位置    3,编写util类......
  • 一文解读.NET 数据库事务
    事务是数据库系统中的重要概念,本文讲解作者从业CRUD十余载的事务多种使用方式总结。以下所有内容都是针对单机事务而言,不涉及分布式事务相关的东西!关于事务原理的讲解不针对具体的某个数据库实现,所以某些地方可能和你的实践经验不符。1|0认识事务为什么需要数据库事务?转账是生......
  • 了解 Kubernetes (k8s) 概念,搭建一套集群。
    ......
  • ASP.NET Core 6框架揭秘实例演示[37]:重定向的N种实现方式
    在HTTP的语义中,重定向一般指的是服务端通过返回一个状态码为3XX的响应促使客户端像另一个地址再次发起请求,本章将此称为“客户端重定向“。既然有客户端重定向,自然就有服务端重定向,本章所谓的服务端重定向指的是在服务端通过改变请求路径将请求导向另一个终结点。ASP.NET下的重定......
  • 乘风破浪,遇见最美Windows 11之现代Windows桌面应用开发 - .NET反编译神器dotPeek,免费
    什么是dotPeekhttps://www.jetbrains.com/decompiler/dotPeek是由鼎鼎有名的JetBrains开发的免费.Net反编译软件。其界面和VisualStudio一样现代。获取dotPeekhttps://www.jetbrains.com/decompiler/download/download-thanks.html?platform=windowsWebJetBrains.dotP......
  • python: read excel
    pipinstallxlrdpipinstallxlwtpipinstallxlutilspipinstallxlwingspipinstallXlsxWriterpipinstallopenpyxlpipinstallpandaspipinstallpandasql importDrawSquareimportDecoratorsimportxlrdimportxlwtimportxlwingsasxwimportxlsxwriterim......
  • 尚医通-day04【EasyExcel详细步骤】(内附源码)
    页面预览数据导出数据导入第01章-AlibabaEasyExcel1、EasyExcel介绍1.1、EasyExcel的作用数据导入:减轻录入工作量数据导出:统计信息归档数据传输:异构系统之间数据传输1.2、EasyExcel的特点快速:快速的读取excel中的数据。简洁:映射excel和实体类,让代码变的更加简......
  • Qt打包程序移动到新环境时提示QAxBase::setControl: requested control Excel.Applica
    在新环境中运行程序时发现程序异常结束,查看日志内如如下,异常原因应该是我是程序中对Excel表格操作产生的。Warning:File:()Line:(0)QAxBase::setControl:requestedcontrolExcel.Applicationcouldnotbeinstantiated(2023-06-1217:40:58)Warning:File:()Line:(0)QAx......