如何在 Linux 命令行中优雅的格式化输出 xml,记住这三种方法!

举报
wljslmz 发表于 2023/01/31 14:01:38 2023/01/31
【摘要】 xml(可扩展标记语言)也是一种人类可读的标记语言,但是如同 json 文件一样,没有缩进格式(或者压缩)的 xml 文件,读起来那是挺头疼的。首先来看一下我们这篇文章要达到的目的,如下图所示:要实现这种效果,我们总结了三种方法。作为演示的例子,我们使用如下文件 email.xml:<emails> <email> <from>Sagar</from> <to>Milan</to> <tim...

xml(可扩展标记语言)也是一种人类可读的标记语言,但是如同 json 文件一样,没有缩进格式(或者压缩)的 xml 文件,读起来那是挺头疼的。

首先来看一下我们这篇文章要达到的目的,如下图所示:

要实现这种效果,我们总结了三种方法。作为演示的例子,我们使用如下文件 email.xml:

<emails> <email> <from>Sagar</from> <to>Milan</to> <time>2022-10-14</time>
<subject>Writing a lot these days</subject></email> <email>
<from>Sagar</from> <to>Arvind</to> <time>2022-10-13</time> <subject>Heyy, send me the Goa pictures ASAP!</subject>
</email> </emails>

方法1:使用 xmllint 格式化打印 xml

xmllint 工具提供了 --format 选项,可以让用户重新格式化 xml 文件。如下语法所示:

xmllint --format XML_FILE

比如,作为演示,我们使用 email.xml:

xmllint --format email.xml

格式化输出,默认缩进两个空格。如果想要修改为更多的空格(比如4个空格),可以使用环境变量 XMLLINT_INDENT。

比如,我们使用 email.xml 作为例子,使其缩进为 4 个空格:

XMLLINT_INDENT="    " xmllint --format email.xml

结合前一个例子,大家可以看到区别吗?

方法2:使用 XMLStarlet 工具包

XMLStarlet 提供了一组命令,分别用于不同的目的。其中涉及到了 xml 命令,可以通过该命令来执行与 xml 文件相关的操作。

但是在使用之前,需要手动安装,如下所示:

sudo snap install xmlstarlet

要格式化输出 xml,需要使用 xml 命令的 format 选项,如下所示:

xml format email.xml

另外,它还提供了一些其他的选项,如下:

  • -n 不添加空格,结果类似于文本向左对齐;
  • -t 使用 tab 键输出以提高可读性;
  • -o 省略 xml 生命,除了在文件的顶部添加 <?xml version=”1.0″?>;
  • -s 添加任意数量的空格。

比如,我们使用 fo 添加 6 个空格来格式化输出 xml 文件:

xml fo -s 6 email.xml

方法3:使用 xml_pp 命令

这个方法不是很灵活,因为 xml_pp 是 Perl 的一个模块,名为 XML::Twig。它不会输出内容,但是会直接修改源文件。它在使用之前,同样需要手动安装。如果你使用的是基于 Debian 的系统,可使用如下命令:

sudo apt install xml-twig-tools

比如,我们使用 record 模式来格式化输出 email.xml:

这里,-i 选项用于在原始文件中进行更改,同时用于附加扩展名。-s 选项用于使用样式选项,这里我使用了 record。

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。