- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

XML 与 JSON 相关知识点整理

斑馬斑馬发表于 2021/09/07 10:16:57 2021/09/07

【摘要】 1. XML　　是一门可扩展标记语言（eXtensible Markup Language）。　　.xml文件只是保存XML数据的一种方式，也可以通过在内存中构建XML数据的方式保存，或者是其他方式。　　XML语言不等同于XML文件。1.1 XML的特性　　具有平台无关性，是一门独立的标记语言；　　具有自我描述性。1.2 XML的用途　　用于网络中的数据传输（现在多用JSON）；　　用于存储...

1. XML

　　是一门可扩展标记语言（eXtensible Markup Language）。

　　.xml文件只是保存XML数据的一种方式，也可以通过在内存中构建XML数据的方式保存，或者是其他方式。

　　XML语言不等同于XML文件。

1.1 XML的特性

　　具有平台无关性，是一门独立的标记语言；
　　具有自我描述性。

1.2 XML的用途

　　用于网络中的数据传输（现在多用JSON）；
　　用于存储数据；
　　用于配置文件。

1.3 XML语法格式

1.3.1 XML文档声明

　　标记自己是xml文件，版本1.0，编码格式UTF-8。

<?xml version="1.0" encoding="UTF-8"?>

1.3.2 标记

　　标记，即xml的元素、标签。XML文档是由多个标记组成的。

开始标记(开放标记): <标记名称>
结束标记(闭合标记): </标记名称>

　　标记的语法使用规则：

　　自定义名称，必须遵循以下命名规则

　　名称可以含字母、数字以及其他的字符
　　名称不能以数字或者标点符号开始
　　名称不能以字符 “xml”（或者 XML、Xml）开始
　　名称不能包含空格，不能包含冒号（:）
　　名称区分大小写
　　开始标记与结束标记之间 ,是标记的内容；

　　一个XML文档中, 必须有且且仅允许有一个根标记；

　　标记可以嵌套, 但是不允许交叉；

　　标记的层级称呼 (祖先标记、父标记、兄弟标记、子标记、后代标记)；

　　标记名称允许重复；

　　标记除了开始和结束 , 还有属性；

　　标记中的属性, 在标记开始时描述, 由属性名和属性值组成，可以包含0-n个属性, 每一个属性是一个键值对! 属性名不允许重复 , 键与值之间使用等号连接, 多个属性之间使用空格分割。属性值必须被引号引住。

<persons>
    <person id="10001" groupid="1">//属性有id和groupid
        <name>李四</name>
        <age>18</age>
    </person>
    <person id="10002" groupid="1">
        <name>李四</name>
        <age>20</age>
    </person>
</persons>

　　注释

　　注释不能写在文档文档声明前,注释不能嵌套注释。

<!--注释-->

1.3.3 CDATA

　　CDATA 是不应该由XML解析器解析的文本数据。像 “<” 和 “&” 字符在 XML 元素中都是非法的。 “<” 会产生错误，因为解析器会把该字符解释为新元素的开始。 “&” 会产生错误，因为解析器会把该字符解释为字符实体的开始。

　　某些文本，比如 JavaScript 代码，包含大量 “<” 或 “&” 字符。为了避免错误，可以将脚本代码定义为 CDATA。 CDATA 部分中的所有内容都会被解析器忽略。 CDATA 部分由 “” 结束：

<![CDATA[ 
       //CDATA部分
]]>

1.4 Java解析XML

　　常见面试题：Java中有几种XML解析方式 ? 分别是什么 ? 有什么样的优缺点 ?

1.4.1 SAX解析

1.4.1.1 解析方式

　　事件驱动机制， SAX解析器, 逐行读取XML文件解析 , 每当解析到一个标签的开始/结束/内容/属性时，触发事件。我们可以编写程序在这些事件发生时, 进行相应的处理。

1.4.1.2 优点

　　分析能够立即开始，而不是等待所有的数据被处理；
　　逐行加载,节省内存，有助于解析大于系统内存的文档；
　　有时不必解析整个文档,它可以在某个条件得到满足时停止解析。

1.4.1.3 缺点

　　单向解析，无法定位文档层次，无法同时访问同一文档的不同部分数据；
　　(因为逐行解析, 当解析第n行是, 第n-1行已经被释放了, 无法在进行操作了)

　　无法得知事件发生时元素的层次, 只能自己维护节点的父/子关系；

　　只读解析方式, 无法修改XML文档的内容。

1.4.2 DOM解析

1.4.2.1 解析方式

　　是用与平台和语言无关的方式表示XML文档的官方W3C标准，分析该结构通常需要加载整个文档和内存中建立文档树模型。程序员可以通过操作文档树, 来完成数据的获取、修改、删除等。

1.4.2.2 优点

　　文档在内存中加载, 允许对数据和结构做出更改；
访问是双向的，可以在任何时候在树中双向解析数据。

1.4.2.3 缺点

　　文档全部加载在内存中 , 消耗资源大。

1.4.3 JDOM解析

1.4.3.1 解析方式

　　目的是成为Java特定文档模型，它简化与XML的交互并且比使用DOM实现更快。由于是第一个Java特定模型，JDOM一直得到大力推广和促进。

　　JDOM文档声明其目的是“使用20%（或更少）的精力解决80%（或更多）Java/XML问题” 。

1.4.3.2 优点

　　使用具体类而不是接口，简化了DOM的API；

　　大量使用了Java集合类，方便了Java开发人员。

1.4.3.3 缺点

　　没有较好的灵活性；
　　性能不是那么优异。

1.4.4 DOM4J解析

1.4.4.1 解析方式

　　它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能，包括集成的XPath 支持、XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项，如今你可以看到越来越多的Java软件都在使用DOM4J来读写XML。

1.4.4.2 优点

　　具有性能优异、功能强大和极度易使用的特点；
　　软件开源。很多开源项目都大量采用DOM4J，例如：Hibernate。

1.4.4.3 解析步骤

　　引入jar文件，dom4j.jar；

　　创建一个指向XML文件的输入流；

FileInputStream fis = new FileInputStream("XML文件地址");

　　创建一个XML读取工具的实例对象；

SAXReader sr = new SAXReader();

　　使用读取工具对象，读取XML文档的输入流，并得到文档对象；

Document doc = sr.read(fis);//XML建立的文档树模型

　　通过文档对象，读取XML文档中的根元素。

Element root = doc.gerRootElement();

1.4.4.4 文档对象Document

//常用方法:
    //1. 通过文档对象, 获取XML文档中的根元素对象
    Element root = doc.getRootElement();
    //2. 添加根节点
    Element root = doc.addElement("根节点名称");

1.4.4.5 元素对象Element

//指的是XML文档中的单个节点.
//常用方法:
    //1. 获取节点名称
    String getName();
    //2. 获取节点内容
    String getText();
    //3. 设置节点内容
    String setText();
    //4. 根据子节点的名称 , 获取匹配名称的第一个子节点对象.
    Element element(String 子节点名称);
    //5. 获取所有的子节点对象
    List<Element> elements();
    //6. 获取节点的属性值
    String attributeValue(String 属性名称);
    //7. 获取子节点的内容
    String elementText(String 子节点名称);
    //8. 添加子节点
    Element addElement(String 子节点名称);
    //9. 添加属性
    void addAttribute(String 属性名,String 属性值);

1.4.4.6 XPATH解析

1.4.4.6.1 路径表达式

　　通过路径快速的查找一个或一组元素：

/  : 从根节点开始查找
// : 从发起查找的节点位置查找后代节点
.  : 查找当前节点
…  : 查找父节点
@  : 选择属性，属性使用方式:
[@属性名=‘值’]
[@属性名>‘值’]
[@属性名<‘值’]
[@属性名!=‘值’]

1.4.4.6.2 解析方法

　　通过Node类的两个方法, 来完成查找: (Node是 Document 与 Element 的父接口)。

　　根据路径表达式, 查找匹配的单个节点

Element e = selectSingleNode("路径表达式");

　　根据路径表达式, 查找匹配的多个节点

List<Element> es = selectNodes("路径表达式");

1.4.4.6.3 解析步骤

　　获取到XML资源的输入流

//示例
    String phone = "18313935565";
    URL url = new URL("http://apis.juhe.cn/mobile/get?phone="+phone+"&dtype=xml&key=9f3923e8f87f1ea50ed4ec8c39cc9253");
    URLConnection conn = url.openConnection();//发起通信连接
    InputStream is = conn.getInputStream();//获取字节输入流

　　创建一个XML读取对象

SAXReader sr = new SAXReader();

　　通过读取对象读取XML数据，并返回文档对象

Document doc = sr.read(is);
Node node = doc.selectSingleNode("//company");
System.out.println("运营商："+node.getText());

　　资源释放

is.close();

1.5 Java生成XML

1.5.1 通过DocumentHelper生成

1.5.1.1 生成步骤

　　通过文档帮助器 (DocumentHelper) , 创建空的文档对象

Document doc = DocumentHelper.createDocument();

　　通过文档帮助器 (DocumentHelper) , 创建空的文档对象

Element root = doc.addElement("根节点名称");

　　通过根节点对象root , 丰富我们的子节点

Element e = root.addElement("元素名称")

　　创建一个文件输出流 ,用于存储XML文件

FileOutputStream fos = new FileOutputStream("要存储的位置");

　　将文件输出流, 转换为XML文档输出流

XMLWriter xw = new XMLWriter(fos);

　　写出文档

xw.write(doc);

　　释放资源

xw.close();

1.5.2 通过XStream生成

　　快速的将Java中的对象, 转换为XML字符串。

　　创建XStream对象

XStream x = new XStream();

　　修改目标类生成的节点名称 (默认节点名称为包名.类名)

x.alias("节点名称",类名.class);

　　传入对象 , 生成XML字符串

String xml字符串 = x.toXML("对象");

2. XML和HTML的区别

　　xml标签都是自定义的，html标签是预定义；
　　xml的语法严格，html语法松散；
　　xml是存储数据的，html是展示数据。

3. JSON

　　JS对象简谱 (JavaScript Object Notation, JSON), 是一种轻量级的数据交换格式。

 **一个对象, 由一个大括号表示。**括号中描述对象的属性。通过键值对来描述对象的属性 (可以理解为, 大括号中, 包含的是一个个的键值对)
{
    "name":"xxx",
    "age":3,
    "friends":["xxx","xxx","xxx","xxx",{
                "name":"xxx",
                "info":"xxx"
                }],
    "clothes":{
        "name":"xxx",
        "length":1
    }
}

3.1 JSON的格式特点

　　键与值之间使用冒号连接；
　　多个键值对之间使用逗号分隔；
　　键值对的键应使用引号引住（通常Java解析时, 键不使用引号会报错。而JS能正确解析）；
　　键值对的值, 可以是JS中的任意类型的数据。

3.2 获取JSON中的数据

　　json对象.键名
　　json对象[“键名”]
　　数组对象[索引]

3.3 Java与JSON

3.3.1 Java与JSON的相互转换

　　格式化：将Java中的对象快速的转换为 JSON格式的字符串；

　　解析：将JSON格式的字符串, 转换为Java的对象。

3.3.2 GSON（谷歌）

3.3.2.1 格式化

　　导入JAR包；

　　将目标对象转换成JSON格式的字符串。

String json = new Gson().toJSON("要转换的对象");

3.3.2.2 解析

　　导入JAR包；

　　将JSON字符串转换成Java对象。

对象类型 对象名 = new Gson().fromJson(JSON字符串,对象类型.class);

3.3.3 FastJSON（阿里巴巴）

3.3.3.1 格式化
　　导入JAR包；

　　将目标对象转换成JSON格式的字符串。

String json=JSON.toJSONString(要转换的对象);

3.3.4.2 解析
　　导入JAR包；

　　将JSON字符串转换成Java对象（两种方法）。

对象类型 对象名=JSON.parseObject(JSON字符串, 类型.class);
//List<类型> list=JSON.parseArray(JSON字符串,类型.class);

3.3.4 注意事项

　　如果没有合适的类匹配，可以用Map装入。JSON中存储的属性可能会是一个数组，那么转换成Map之后，他的值是个ArrayList类型的。

————————————————
版权声明：本文为CSDN博主「SyntaxError：」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/weixin_44010763/article/details/114994137

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

XML 与 JSON 相关知识点整理

1. XML

1.1 XML的特性

1.2 XML的用途

1.3 XML语法格式

1.3.1 XML文档声明

1.3.2 标记

1.3.3 CDATA

1.4 Java解析XML

1.4.1 SAX解析

1.4.2 DOM解析

1.4.3 JDOM解析

1.4.4 DOM4J解析

1.5 Java生成XML

1.5.1 通过DocumentHelper生成

1.5.2 通过XStream生成

2. XML和HTML的区别

3. JSON

3.1 JSON的格式特点

3.2 获取JSON中的数据

3.3 Java与JSON

3.3.1 Java与JSON的相互转换

3.3.2 GSON（谷歌）

3.3.3 FastJSON（阿里巴巴）

3.3.4 注意事项

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

XML 与 JSON 相关知识点整理

1. XML

1.1 XML的特性

1.2 XML的用途

1.3 XML语法格式

1.3.1 XML文档声明

1.3.2 标记

1.3.3 CDATA

1.4 Java解析XML

1.4.1 SAX解析

1.4.2 DOM解析

1.4.3 JDOM解析

1.4.4 DOM4J解析

1.5 Java生成XML

1.5.1 通过DocumentHelper生成

1.5.2 通过XStream生成

2. XML和HTML的区别

3. JSON

3.1 JSON的格式特点

3.2 获取JSON中的数据

3.3 Java与JSON

3.3.1 Java与JSON的相互转换

3.3.2 GSON（谷歌）

3.3.3 FastJSON（阿里巴巴）

3.3.4 注意事项

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品