首页 > 其他分享 >OpenXML常用方法

OpenXML常用方法

时间:2024-12-17 14:52:53浏览次数:8  
标签:xml XML 常用 Word OpenXML docx 文档 方法

OpenXML 常用方法

概述

Open XML SDK基于System.IO.Packaging API构建而成,并提供强类型类来处理符合Open XML文件格式规范的文档。

  • 强类型类:在C#中,强类型类指的是在定义类时明确指定了其属性、方法参数和返回值的类型。

标准

Office OpenXML(简称为OOXML)是可由不同平台上的多个应用程序自由实现的字处理文档、演示文稿电子表格的开放式标准.

ECMA-376

MS-OE376

ISO/IEC 29500

MS-OI29500

分类

  1. Word processing document(Word):使用WordProcessingML标记进行描述。一个 WordprocessingML 文档由一组文章组成,其中每篇文章属于下列项之一:

    • 主文档
    • 词汇表文档
    • 页眉和页脚
    • 注释
    • 文本框
    • 脚注和尾注
  2. Presentations (演示文稿):使用PresentationML标记进行描述。

    • 幻灯片母版
    • 备注母版
    • 讲义母版
    • 幻灯片版式
    • 说明
  3. Spreadsheet workbooks(电子表格工作薄):使用SpreadsheetML 标记进行描述。

    • 工作薄部件
    • 一张或多张工作表
    • 图标
    • 自定义XML

Word

Word 格式变迁

Office Word格式分为doc和docx两种:

  1. doc是Word 97-2003使用的格式;docx是Word2007及其之后的版本的默认格式。

  2. doc使用OLE复合文档技术

    • OLE:是能让应用程序创建包含不同来源的复合文档的技术。
    • 复合文档:是微软开发、用于实现COM结构化存储的文件格式,用于把多个对象内容存放在同一个硬盘文件。

    docx使用Office OpenXML协议,为由Microsoft开发的一种以XML为基础并以ZIP格式压缩的电子文件规范,支持文件、表格、备忘录、幻灯片等文件格式。

docx 本质

Word文档(.docx)实质上是一个包含多个XML文件和资源的ZIP压缩包。
主要由以下部分组成:

|- [Content_Types].xml 描述整个文档的信息
|- _rels 存放关系文件,定义ZIP包中各个Part之间的关系
|- docProps 存放文档的属性信息
    |- app.xml 记录应用程序特定的文档属性
    |- core.xml 存储核心属性
|- word 文档的主要内容存放于此目录
    |- _rels 
        |- document.xml.rels
    |- theme
    |- document.xml 文档中所有可见文字的内容和属性及不可见部分的内容和属性
    |- fontTable.xml
    |- settings.xml 存储文档的设置
    |- styles.xml
    |- webSettings.xml

提示:我们可以新建一个Word文档,更改其后缀名.docx.zip,解压缩后查看其内部结构。

Negut包

Open

Word Processing

遇到的问题

Blazor WebAssembly项目:

  • .NET 6.0框架
  • DocumentFormat.OpenXML 2.20.0

报错:ReferenceError

引用文章

  1. Word解析之Word内部结构:

https://blog.csdn.net/pdfcxc/article/details/113260490

  1. 复合文档格式文件格式研究

https://club.excelhome.net/thread-227502-1-1.html

标签:xml,XML,常用,Word,OpenXML,docx,文档,方法
From: https://www.cnblogs.com/wubing7755/p/18609219

相关文章

  • 数据分析的流程、数据分析的常用方法与技术、数据分析的应用场景
    定义与目标定义:数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将其提炼为有价值的信息,以帮助人们做出决策、发现问题、预测趋势等的过程。它涉及数据的收集、清洗、转换、建模、可视化等多个环节。目标:描述现状:通过数据分析来呈现数据的基本特征,如数据的集中......
  • mfc140.dll文件缺失的修复方法分享,全面分析mfc140.dll的几种解决方法
    mfc140.dll是MicrosoftFoundationClasses(MFC)库中的一个动态链接库(DLL)文件,它是微软基础类库的一部分,为Windows应用程序的开发提供了丰富的类库和接口。MFC库旨在简化Windows应用程序的开发过程,提供了一系列预定义的C++类,这些类封装了WindowsAPI函数,使得开发者可以更方便地创......
  • msvcp100.dll文件缺失的修复方法分享,全面分析msvcp100.dll的修复方法
    msvcp100.dll是一个动态链接库(DLL)文件,属于MicrosoftVisualC++2010RedistributablePackage的一部分。这个文件对于运行使用MicrosoftVisualC++2010编译器编译的应用程序至关重要。msvcp100.dll包含了C++标准库的实现,提供了应用程序运行时所需的核心功能,如输入/......
  • 私有化视频平台EasyCVR视频监控器上出现红木纹状干扰的原因与解决方法
    在现代安防监控系统中,视频信号的稳定性和清晰度至关重要。然而,在实际应用中,监控系统常常会受到各种干扰,导致图像质量下降,甚至完全无法观看。这些干扰可能由多种原因引起,包括视频传输线缆的问题、电源污染以及周围环境的电磁干扰等。了解这些干扰的来源并掌握相应的解决方案,对于维......
  • MSSQL AlwaysOn 可用性组(Availability Group)中的所有副本均不健康排查步骤和解决方法
    当遇到MSSQLAlwaysOn可用性组(AvailabilityGroup)中的所有副本均不健康的情况时(MSSQLAG'副本名称':Allreplicasunhealthy),这通常意味着可用性组无法正常工作,数据同步和故障转移功能可能受到影响。以下是一些可能的原因及相应的排查步骤和解决方法:1.检查副本状态首先......
  • 华为网络设备常用巡检命令(建议收藏)
    华为网络设备巡检过程中,使用适当的命令可以帮助运维人员快速了解设备的配置、状态、告警等信息,从而进行有效的设备管理和故障排查。以下是一些常用的华为网络设备巡检命令,涵盖了从基本的文件和目录管理到复杂的网络配置和设备状态监控的各个方面。1、文件和目录管理dir 功......
  • Yocto项目 - 层管理:工具、方法与实践
    引言在Yocto项目中,层(Layer)是实现模块化和灵活构建的核心概念。层通过元数据的形式组织和管理构建信息,不同的层可以独立开发、组合并复用,从而大大简化复杂项目的构建流程。然而,如何有效地管理层,尤其是在多层项目中,可能会成为开发者面临的挑战。本文将详细讲解Yocto项目中......
  • 在CodeBolcks+Windows API下的C++面向对象的编程教程——用面向对象的方法改写用向导
    0.前言我想通过编写一个完整的游戏程序方式引导读者体验程序设计的全过程。我将采用多种方式编写具有相同效果的应用程序,并通过不同方式形成的代码和实现方法的对比来理解程序开发更深层的知识。了解我编写教程的思路,请参阅体现我最初想法的那篇文章中的“1.编程计划”:学习编程......
  • 常用网站
    C++GraphicsLibrary小熊猫C++XEGE绘图库SimulIDE电路仿真软件Java绘图库,类似XEGEPython绘图库,类似XEGEeasyxDev-C++codeblockswxwidgetswxwidgets练习题知识库宝塔discuz知识库码云MSSQLEGE、EasyX、WindowsGDI......
  • Linux 常用命令大全
    1、Linux 管理文件和目录的命令命令功能命令功能pwd显示当前目录ls查看目录下的内容cd改变所在目录cat显示文件的内容grep在文件中查找某字符cp复制文件touch创建文件mv移动文件rm删除文件rmdir删除目录1.1pwd 命令该......