首页 > 编程语言 >java将Word转换成PDF三种方法

java将Word转换成PDF三种方法

时间:2023-04-11 19:56:58浏览次数:52  
标签:Word String java System new 文档 pdf jacob PDF

java将Word转换成PDF三种方法
原文链接:https://blog.csdn.net/weixin_38409915/article/details/125317664

网上有很多将Word转换成PDF的方式,这里找了三种比较简单的工具:poi、jacob和aspose。

1.POI

依赖

<dependency>
	<groupId>org.apache.poi</groupId>
	<artifactId>poi-ooxml</artifactId>
	<version>3.17</version>
</dependency>
<dependency>
	<groupId>fr.opensagres.xdocreport</groupId>
	<artifactId>fr.opensagres.poi.xwpf.converter.pdf-gae</artifactId>
	<version>2.0.1</version>
</dependency>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

工具类

FileInputStream fileInputStream = new FileInputStream("F:\\poi笔记.docx");
XWPFDocument xwpfDocument = new XWPFDocument(fileInputStream);
PdfOptions pdfOptions = PdfOptions.create();
FileOutputStream fileOutputStream = new FileOutputStream("F:\\poi笔记.pdf");
PdfConverter.getInstance().convert(xwpfDocument,fileOutputStream,pdfOptions);
fileInputStream.close();
fileOutputStream.close();
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

2.jacob

jacob 缺点:需要 window 环境,而且速度是最慢的需要安装 msofficeWord 以及 SaveAsPDFandXPS.exe ( word 的一个插件,用来把 word 转化为 pdf )

开发流程:

SaveAsPDFandXPS 下载地址: http://www.microsoft.com/zh-cn/download/details.aspx?id=7

jacob 包下载地址: http://sourceforge.net/projects/jacob-project/
  1、安装SaveAsPDFandXPS
  2、下载 jacob 解压后存放路径:
    jacob.jar 放在 C:\Program Files\Java\jdk1.8.0_171\jre\lib\ext目录下
    jacob.dll 放在 C:\Program Files\Java\jdk1.8.0_171\jre\bin 目录下

工具类

public class Word2PdfJacobUtil {
	/* 转PDF格式值 */
	private static final int wdFormatPDF = 17;
	/**
	 * Word文档转换
	 * 
	 * @param inputFile
	 * @param pdfFile
	 */
	public static boolean word2PDF(String inputFile, String pdfFile) {
		ComThread.InitMTA(true);
	    long start = System.currentTimeMillis();
	    ActiveXComponent app = null;
	    Dispatch doc = null;
	    try {
	        app = new ActiveXComponent("Word.Application");// 创建一个word对象
	        app.setProperty("Visible", new Variant(false)); // 不可见打开word
	        app.setProperty("AutomationSecurity", new Variant(3)); // 禁用宏
	        Dispatch docs = app.getProperty("Documents").toDispatch();// 获取文挡属性
	        System.out.println("打开文档 >>> " + inputFile);
	        // Object[]第三个参数是表示“是否只读方式打开”
	        // 调用Documents对象中Open方法打开文档,并返回打开的文档对象Document
	        doc = Dispatch.call(docs, "Open", inputFile, false, true).toDispatch();
	        System.out.println("转换文档 [" + inputFile + "] >>> [" + pdfFile + "]");
            // 调用Document对象的SaveAs方法,将文档保存为pdf格式
            // word保存为pdf格式宏,值为17
            Dispatch.call(doc, "SaveAs", pdfFile, wdFormatPDF);// word保存为pdf格式宏,值为17
	        long end = System.currentTimeMillis();
	        System.out.println("用时:" + (end - start) + "ms.");
	        return true;
	    } catch (Exception e) {
	        e.printStackTrace();
	        System.out.println("========Error:文档转换失败:" + e.getMessage());
	    } finally {
	        Dispatch.call(doc, "Close", false);
	        System.out.println("关闭文档");
	        if (app != null)
	            app.invoke("Quit", new Variant[] {});
            // 如果没有这句话,winword.exe进程将不会关闭
            ComThread.Release();
            ComThread.quitMainSTA();
        }
	    return false;
	}
	}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49

测试运行:

public static void main(String[] arg){
		String docPath = "C:\\Users\\Administrator\\Desktop\\test.docx";
		String pdfPath = "C:\\Users\\Administrator\\Desktop\\test.pdf";
        boolean res = Word2PdfJacobUtil.word2PDF(docPath, pdfPath);
        System.out.println(res);
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

结果如下:
在这里插入图片描述

3.aspose

当文档中含有中文字符时,该段代码的执行需要调用操作系统的本地字体库支持,否则所有中文字符都将乱码。

该段代码如果想要在Linux服务器上完美运行,需要给Linux服务器安装中文字体库

如何在Linux环境安装Windows字体库,将在本人的另一篇文章里详细讲解
Java使用Spire.Pdf或Aspose-Words实现Word转换Pdf在Linux服务器上的中文乱码问题

建议将jar包下载下来并上传私服里去
依赖

<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>15.8.0</version>
</dependency>
  • 1
  • 2
  • 3
  • 4
  • 5

使用aspose不需要像jacob那样往jdk里加入ddl文件,但是需要在项目里加入一个license.xml,不然生成的pdf会有水印
license.xml如下:

<?xml version="1.0" encoding="UTF-8" ?> 
<License>
  <Data>
    <Products>
      <Product>Aspose.Total for Java</Product>
      <Product>Aspose.Words for Java</Product>
    </Products>
    <EditionType>Enterprise</EditionType>
    <SubscriptionExpiry>20991231</SubscriptionExpiry>
    <LicenseExpiry>20991231</LicenseExpiry>
    <SerialNumber>8bfe198c-7f0c-4ef8-8ff0-acc3237bf0d7</SerialNumber>
  </Data>
  <Signature>sNLLKGMUdF0r8O1kKilWAGdgfs2BvJb/2Xp8p5iuDVfZXmhppo+d0Ran1P9TKdjV4ABwAgKXxJ3jcQTqE/2IRfqwnPf8itN8aFZlV3TJPYeD3yWE7IT55Gz6EijUpC7aKeoohTb4w2fpox58wWoF3SNp6sK6jDfiAUGEHYJ9pjU=</Signature>
</License>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

工具类:

public class Word2PdfAsposeUtil {
	public static boolean getLicense() {
        boolean result = false;  
        try {  
            InputStream is = Test.class.getClassLoader().getResourceAsStream("\\license.xml"); // license.xml应放在..\WebRoot\WEB-INF\classes路径下
            License aposeLic = new License();  
            aposeLic.setLicense(is);  
            result = true;  
        } catch (Exception e) {
            e.printStackTrace();  
        }  
        return result;  
    }  
    public static boolean doc2pdf(String inPath, String outPath) {
        if (!getLicense()) { // 验证License 若不验证则转化出的pdf文档会有水印产生  
            return false;  
        }
        FileOutputStream os = null;
        try {  
            long old = System.currentTimeMillis();
            File file = new File(outPath); // 新建一个空白pdf文档
            os = new FileOutputStream(file);
            Document doc = new Document(inPath); // Address是将要被转化的word文档  
            doc.save(os, SaveFormat.PDF);// 全面支持DOC, DOCX, OOXML, RTF HTML, OpenDocument, PDF,  
                                         // EPUB, XPS, SWF 相互转换  
            long now = System.currentTimeMillis();
            System.out.println("pdf转换成功,共耗时:" + ((now - old) / 1000.0) + "秒"); // 转化用时
        } catch (Exception e) {
            e.printStackTrace();
            return false;
        }finally {
            if (os != null) {
                try {
                    os.flush();
                    os.close();
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }
        }
        return true;
    }  
  }
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46

测试运行:

 public static void main(String[] arg){
        String docPath = "C:\\Users\\Administrator\\Desktop\\test.docx";
        String pdfPath = "C:\\Users\\Administrator\\Desktop\\test.pdf";
        Word2PdfAsposeUtil.doc2pdf(docPath,pdfPath);
}
  • 1
  • 2
  • 3
  • 4
  • 5

结果:
在这里插入图片描述

jacob和aspose相关jar下载

链接:https://pan.baidu.com/s/1D10sJOihQc551tZPv9uWwQ
提取码:zsgg

微信扫一扫即可获取文件(已包含提取码)
微信扫一扫即可获取文件

标签:Word,String,java,System,new,文档,pdf,jacob,PDF
From: https://www.cnblogs.com/sunny3158/p/17307436.html

相关文章

  • java实现给图片添加水印(文字水印或图片水印)
    java实现给图片添加水印(文字水印或图片水印)原文链接:https://blog.csdn.net/qq_26383975/article/details/125996277本文介绍java实现在图片上加文字水印的方法,水印可以是图片或者文字,操作方便。目录一、java实现给图片添加文字水印1.获取原图片对象信息1.1读取本地图......
  • java arrays类方法parallelSort,学习总结
    Arrays.sort与Arrays.parallelSort区别Arrays.sort()Arrays.sort()方法对对象或原始数据类型的数组进行排序。此方法中使用的排序算法是Dual-Pivot Quicksort。 换句话说,它是快速排序算法的自定义实现,以实现更好的性能。此方法是单线程的 ,有两种变体:sort(array)–将整......
  • java -- Map接口和可变参数
    MapMap:映射,是双列集合顶层接口java.util.Map<k,v>k:key键唯一v:value值可重复常用方法和EntrypublicVput(Kkey,VValue)//指定的键与指定值添加到Map集合中,添加成功返回null,添加失败返回之前的值publicVputIfAbsent(Kkey,VValue)//jdk1.8后新增......
  • (之前的项目复习)我的Java项目实战--校园餐饮商户外卖系统03
    开发笔记三分类管理业务开发公共字段自动填充问题分析前面我们已经完成了后台系统的员工管理功能开发,在新增员工时需要设置创建时间、创建人、修改时间、修改人等字段,在编辑员工时需要设置修改时间和修改人等字段。这些字段属于公共字段,也就是很多表中都有这些字段,如下:能......
  • Java 生成水印图片
    Java生成水印图片原文链接:https://blog.csdn.net/qq_42151956/article/details/121976565工具类返回BufferedImage,写入文件生成水印图片,可见代码一、核心代码/***生成背景透明的文字水印**@paramwidth生成图片宽度*@paramheight生成图片高度*@param......
  • umeditor粘贴图片自动上传到服务器(Java版)
    ​ 当前功能基于PHP,其它语言流程大致相同 1.新增上传wordjson配置在ueditor\php\config.json中新增如下配置:     /* 上传word配置 */    "wordActionName":"wordupload",/* 执行上传视频的action名称 */    "wordFieldName":"upfile",/* 提交的......
  • 在网页中写javascript
    在网页中写Javascript1.在网页中直接嵌入<scriptlanguage="javascript"></script>**script标签可以放在head和body标签里面**<scriptlanguage="javascript">varnow=newDate();varhour=now.getHours();var......
  • 聊聊如何运用JAVA注解处理器(APT)
    什么是APTAPT(AnnotationProcessingTool)它是Java编译期注解处理器,它可以让开发人员在编译期对注解进行处理,通过APT可以获取到注解和被注解对象的相关信息,并根据这些信息在编译期按我们的需求生成java代码模板或者配置文件(比如SPI文件或者spring.fatories)等。APT获取注解及生成代......
  • KindEditor粘贴图片自动上传到服务器(Java版)
    ​图片的复制无非有两种方法,一种是图片直接上传到服务器,另外一种转换成二进制流的base64码目前限chrome浏览器使用首先以um-editor的二进制流保存为例:打开umeditor.js,找到UM.plugins['autoupload'],然后找到autoUploadHandler方法,注释掉其中的代码。加入下面的代码://判断剪贴......
  • Java实现Excel导入和导出,看这一篇就够了(珍藏版)
    前言Java实现表格的相关操作进行了封装,本次封装是基于POI的二次开发,最终使用只需要调用一个工具类中的方法,就能满足业务中绝大部门的导入和导出需求。1.功能测试1.1测试准备在做测试前,我们需要將【2.环境准备】中的四个文件拷贝在工程里(如:我这里均放在了com.zyq.util.exc......