OpenXML 常用方法
概述
Open XML SDK
基于System.IO.Packaging API
构建而成,并提供强类型类来处理符合Open XML
文件格式规范的文档。
- 强类型类:在C#中,强类型类指的是在定义类时明确指定了其属性、方法参数和返回值的类型。
标准
Office OpenXML
(简称为OOXML)是可由不同平台上的多个应用程序自由实现的字处理文档、演示文稿电子表格的开放式标准.
分类
-
Word processing document(Word):使用WordProcessingML标记进行描述。一个 WordprocessingML 文档由一组文章组成,其中每篇文章属于下列项之一:
- 主文档
- 词汇表文档
- 页眉和页脚
- 注释
- 文本框
- 脚注和尾注
-
Presentations (演示文稿):使用PresentationML标记进行描述。
- 幻灯片母版
- 备注母版
- 讲义母版
- 幻灯片版式
- 说明
-
Spreadsheet workbooks(电子表格工作薄):使用SpreadsheetML 标记进行描述。
- 工作薄部件
- 一张或多张工作表
- 图标
- 表
- 自定义XML
Word
Word 格式变迁
Office Word格式分为doc和docx两种:
-
doc是Word 97-2003使用的格式;docx是Word2007及其之后的版本的默认格式。
-
doc使用OLE复合文档技术。
docx使用Office OpenXML协议,为由Microsoft开发的一种以XML为基础并以ZIP格式压缩的电子文件规范,支持文件、表格、备忘录、幻灯片等文件格式。
docx 本质
Word文档(.docx)实质上是一个包含多个XML文件和资源的ZIP压缩包。
主要由以下部分组成:
|- [Content_Types].xml 描述整个文档的信息
|- _rels 存放关系文件,定义ZIP包中各个Part之间的关系
|- docProps 存放文档的属性信息
|- app.xml 记录应用程序特定的文档属性
|- core.xml 存储核心属性
|- word 文档的主要内容存放于此目录
|- _rels
|- document.xml.rels
|- theme
|- document.xml 文档中所有可见文字的内容和属性及不可见部分的内容和属性
|- fontTable.xml
|- settings.xml 存储文档的设置
|- styles.xml
|- webSettings.xml
提示:我们可以新建一个Word文档,更改其后缀名.docx
为.zip
,解压缩后查看其内部结构。
Negut包
Open
Word Processing
遇到的问题
Blazor WebAssembly项目:
- .NET 6.0框架
- DocumentFormat.OpenXML 2.20.0
报错:ReferenceError
引用文章
- Word解析之Word内部结构:
https://blog.csdn.net/pdfcxc/article/details/113260490
- 复合文档格式文件格式研究
https://club.excelhome.net/thread-227502-1-1.html
标签:xml,XML,常用,Word,OpenXML,docx,文档,方法 From: https://www.cnblogs.com/wubing7755/p/18609219