首页 > 其他分享 >HTML Tidy 将HTML转换为XHTML的开源工具

HTML Tidy 将HTML转换为XHTML的开源工具

时间:2023-09-28 11:36:53浏览次数:35  
标签:转换 Tidy tidy gb2312 HTML 文挡 XHTML


基本信息

  • 软件名称:HTML Tidy
  • 开发者主页:tidy.sourceforge.net
  • 软件大小:112K
  • 安装环境:有多平台版本,本站提供Microsoft Windows 95/98/Me/2000/xp平台版本
  • 版本:2005年8月 由W3C香港分部提供 此版本增加了对gb2312编码的支持

软件说明

我们现在的网站大部分都是HTML的,如果希望将它们标准化,手工的一页一页修改非常麻烦。如果有一个工具能自动将HTML转换成符合标准的XHTML就好了。其实在这方面已经有许多商业和免费的工具软件可以使用,这里将要介绍的HTML Tidy 就是一个很基本但很有用的工具,它可以运行在多种平台上,而且是开放源代码的。

安装使用教程

第一步:下载软件;

第二步:解开压缩包到任意目录,可以看见文件夹里只有1个文件tidy.exe;

第三步:如果你双击这个文件没有任何反应,晕哦,它是需要在命令窗口输入指令运行的,要复习一下以前的dos命令了;

第四步:在"开始->程序->附件"中运行"命令提示符",打开命令窗口。进入你的安装目录,例如你安装在d: idy目录,就输入c:

第五步:输入转换命令。例如要转换index.html

tidy -asxhtml index.html -big5 index.html

其中-asxhtml参数的意思是将HTML转换成符合标准的XHTML。-big5是指以big编码输入和输出文挡,-gb2312是指以gb2312编码输入和输出文挡。还有更多的参数可以使用,你可以输入tidy -help(或者-h)查看,如下图:

第六步:这样index.html就已经转换为符合XHTML标准的文挡了。

补充

阿捷试验了几个文挡,成功转换的并不多,不是tidy工具不好,而是我们的代码实在太不规范。tidy要求你的HTML文挡中的标签至少是按循序嵌套的。tidy好象只是做以下二件事情(可能更多):

  • 1.将不成对的标签加上结束符"/",例如
    转换为
    ,转换为
  • 2.给所有属性值加引号。例如 转换为

tidy也有windows下可视化运行版本,等阿捷研究一下再介绍给大家。工具只是提高我们的工作效率,关键在于我们自己要明白应该怎么做。


下载

标签:转换,Tidy,tidy,gb2312,HTML,文挡,XHTML
From: https://blog.51cto.com/u_1040535/7637308

相关文章

  • pageofficeV6.0另存文件为HTML格式
    转载:另存文件为HTML格式另存文件为HTML格式注意本文中展示的代码均为关键代码,复制粘贴到您的项目中,按照实际的情况,例如文档路径,用户名等做适当修改即可使用。在实际项目开发中,有时需要满足一些没有安装Office软件的客户端电脑或者手机端浏览文档的需求。为了实现这个功能,我们......
  • destoon上做纯js实现html指定页面导出word
    因为最近做了范文网站需要,所以要下载为word文档,如果php进行处理,很吃后台服务器,所以想用前端进行实现。查询github发现,确实有这方面的插件。js导出word文档所需要的两个插件:12FileSaver.jsjquery.wordexport.js首先引入:1234<!--生成wo......
  • 用html写用户注册与登录
    <!DOCTYPEhtml><html><head><title>RegistrationSystem</title><style>body{font-family:Arial,sans-serif;margin:0;padding:20px;}h1{text......
  • python解决ModuleNotFoundError No module named 'HTMLTestRunner'问题修改
    1、报错截图2、解决方法:(1)py2:从http://tungwaiyip.info/software/HTMLTestRunner.html下载HTMLTestRunner.py并将文件放到python2安装目录的Lib下,然后再次运行文件,可成功运行! (2) py3:a: 从http://tungwaiyip.info/software/HTMLTestRunner.html下载HTMLTestRunner.py......
  • HTML中的常见标签
    HTML中的常见标签<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"><metahttp-equiv="X-UA-Compatible"content="IE=edge"><metaname="viewport"content=&q......
  • itext7.pdfhtml For C#
    最近发现itext7(前身为iTextSharp)下有个https://github.com/itext/i7n-pdfhtml的项目可以支持html转PDF下面是官方电子书的翻译内容,原文地址:Chapter1:HelloHTMLtoPDF---第1章:你好HTML到PDF(itextpdf.com)第1章:你好HTML到PDF在本章中,我们将以许多不同的......
  • 批量将 html文件转成PDF文件
    再不会用openai就等被淘汰吧要批量将HTML文件转换为PDF文件,你可以使用一些可以自动化这个过程的工具或编程语言库。以下是一种可能的方法,使用Python编程语言和一个名为pdfkit的库,以及一个名为wkhtmltopdf的命令行工具,它可以将HTML转换为PDF。请按照以下步骤操作:安装必要的工......
  • Linux2.1.13网络源代码学习(https://qiankunli.github.io/2022/07/04/linux_2_1_13_ne
    简介简介源码目录网络分层数据结构套接字套接字与vfssk_buff结构网络协议栈实现——数据struct和协议structlinux1.2.13接收数据收到数据包的几种情况Socket读取发送数据面向过程/对象/ioc以下来自linux1.2.13源码,算是参见Linux1.0的学习笔记。源码目......
  • 使用CSS、HTML、JavaScript实现一个简单的身份验证页
      这是我在博客园的第一篇博客,也是我人生中的第一篇博客。希望它能够记录我的成长,帮助更多的人。  最近在写我们社团的社团网站,有一个页面不太希望普通访客能访问到,所以想做一个“统一身份验证验证”,但是又苦于社团网站搭建是纯静态站,没法做数据库,只能妥协,将账号密码字符串......
  • HTML <a> 标签的 target 属性
    https://www.w3school.com.cn/tags/att_a_target.asp<a>标签的target属性规定在何处打开链接文档。打开新窗口:<ahref="pref.html"target="view_window">Preface</a>在框架中打开窗口:<framesetcols="100,*"><framesrc="toc.h......