框架选修课之dom4j解析xml字符串实例

举报
tea_year 发表于 2021/12/22 23:04:06 2021/12/22
【摘要】 DOM4J       与利用DOM、SAX、JAXP机制来解析xml相比,DOM4J 表现更优秀,具有性能优异、功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。dom4j是一套开源的api。实际项目中,往往选择dom4j来作为解析xml的利器。 &...

DOM4J

 

    与利用DOM、SAX、JAXP机制来解析xml相比,DOM4J 表现更优秀,具有性能优异、功能强大和极端易用使用的特点,只要懂得DOM基本概念,就可以通过dom4j的api文档来解析xml。dom4j是一套开源的api。实际项目中,往往选择dom4j来作为解析xml的利器。

 

先来看看dom4j中对应XML的DOM树建立的继承关系

  

针对于XML标准定义,对应于图2-1列出的内容,dom4j提供了以下实现:

  

同时,dom4j的NodeType枚举实现了XML规范中定义的node类型。如此可以在遍历xml文档的时候通过常量来判断节点类型了。

 

常用API

 

class org.dom4j.io.SAXReader

 

  • read  提供多种读取xml文件的方式,返回一个Domcument对象

 

interface org.dom4j.Document

 

  • iterator  使用此法获取node
  • getRootElement  获取根节点

 

interface org.dom4j.Node

 

  • getName  获取node名字,例如获取根节点名称为bookstore
  • getNodeType  获取node类型常量值,例如获取到bookstore类型为1——Element
  • getNodeTypeName  获取node类型名称,例如获取到的bookstore类型名称为Element

 

interface org.dom4j.Element

 

  • attributes  返回该元素的属性列表
  • attributeValue  根据传入的属性名获取属性值
  • elementIterator  返回包含子元素的迭代器
  • elements  返回包含子元素的列表

 

interface org.dom4j.Attribute

 

  • getName  获取属性名
  • getValue  获取属性值

 

interface org.dom4j.Text

 

  • getText  获取Text节点值

 

interface org.dom4j.CDATA

 

  • getText  获取CDATA Section值

 

interface org.dom4j.Comment

 

  • getText  获取注释 
  • 
        
    1. //先加入dom4j.jar包
    2. import java.util.HashMap;
    3. import java.util.Iterator;
    4. import java.util.Map;
    5. import org.dom4j.Document;
    6. import org.dom4j.DocumentException;
    7. import org.dom4j.DocumentHelper;
    8. import org.dom4j.Element;
    9. /**
    10. * @Title: TestDom4j.java
    11. * @Package
    12. * @Description: 解析xml字符串
    13. * @author 无处不在
    14. * @date 2012-11-20 下午05:14:05
    15. * @version V1.0
    16. */
    17. public class TestDom4j {
    18. public void readStringXml(String xml) {
    19. Document doc = null;
    20. try {
    21. // 读取并解析XML文档
    22. // SAXReader就是一个管道,用一个流的方式,把xml文件读出来
    23. //
    24. // SAXReader reader = new SAXReader(); //User.hbm.xml表示你要解析的xml文档
    25. // Document document = reader.read(new File("User.hbm.xml"));
    26. // 下面的是通过解析xml字符串的
    27. doc = DocumentHelper.parseText(xml); // 将字符串转为XML
    28. Element rootElt = doc.getRootElement(); // 获取根节点
    29. System.out.println("根节点:" + rootElt.getName()); // 拿到根节点的名称
    30. Iterator iter = rootElt.elementIterator("head"); // 获取根节点下的子节点head
    31. // 遍历head节点
    32. while (iter.hasNext()) {
    33. Element recordEle = (Element) iter.next();
    34. String title = recordEle.elementTextTrim("title"); // 拿到head节点下的子节点title值
    35. System.out.println("title:" + title);
    36. Iterator iters = recordEle.elementIterator("script"); // 获取子节点head下的子节点script
    37. // 遍历Header节点下的Response节点
    38. while (iters.hasNext()) {
    39. Element itemEle = (Element) iters.next();
    40. String username = itemEle.elementTextTrim("username"); // 拿到head下的子节点script下的字节点username的值
    41. String password = itemEle.elementTextTrim("password");
    42. System.out.println("username:" + username);
    43. System.out.println("password:" + password);
    44. }
    45. }
    46. Iterator iterss = rootElt.elementIterator("body"); ///获取根节点下的子节点body
    47. // 遍历body节点
    48. while (iterss.hasNext()) {
    49. Element recordEless = (Element) iterss.next();
    50. String result = recordEless.elementTextTrim("result"); // 拿到body节点下的子节点result值
    51. System.out.println("result:" + result);
    52. Iterator itersElIterator = recordEless.elementIterator("form"); // 获取子节点body下的子节点form
    53. // 遍历Header节点下的Response节点
    54. while (itersElIterator.hasNext()) {
    55. Element itemEle = (Element) itersElIterator.next();
    56. String banlce = itemEle.elementTextTrim("banlce"); // 拿到body下的子节点form下的字节点banlce的值
    57. String subID = itemEle.elementTextTrim("subID");
    58. System.out.println("banlce:" + banlce);
    59. System.out.println("subID:" + subID);
    60. }
    61. }
    62. } catch (DocumentException e) {
    63. e.printStackTrace();
    64. } catch (Exception e) {
    65. e.printStackTrace();
    66. }
    67. }
    68. /**
    69. * @description 将xml字符串转换成map
    70. * @param xml
    71. * @return Map
    72. */
    73. public static Map readStringXmlOut(String xml) {
    74. Map map = new HashMap();
    75. Document doc = null;
    76. try {
    77. // 将字符串转为XML
    78. doc = DocumentHelper.parseText(xml);
    79. // 获取根节点
    80. Element rootElt = doc.getRootElement();
    81. // 拿到根节点的名称
    82. System.out.println("根节点:" + rootElt.getName());
    83. // 获取根节点下的子节点head
    84. Iterator iter = rootElt.elementIterator("head");
    85. // 遍历head节点
    86. while (iter.hasNext()) {
    87. Element recordEle = (Element) iter.next();
    88. // 拿到head节点下的子节点title值
    89. String title = recordEle.elementTextTrim("title");
    90. System.out.println("title:" + title);
    91. map.put("title", title);
    92. // 获取子节点head下的子节点script
    93. Iterator iters = recordEle.elementIterator("script");
    94. // 遍历Header节点下的Response节点
    95. while (iters.hasNext()) {
    96. Element itemEle = (Element) iters.next();
    97. // 拿到head下的子节点script下的字节点username的值
    98. String username = itemEle.elementTextTrim("username");
    99. String password = itemEle.elementTextTrim("password");
    100. System.out.println("username:" + username);
    101. System.out.println("password:" + password);
    102. map.put("username", username);
    103. map.put("password", password);
    104. }
    105. }
    106. //获取根节点下的子节点body
    107. Iterator iterss = rootElt.elementIterator("body");
    108. // 遍历body节点
    109. while (iterss.hasNext()) {
    110. Element recordEless = (Element) iterss.next();
    111. // 拿到body节点下的子节点result值
    112. String result = recordEless.elementTextTrim("result");
    113. System.out.println("result:" + result);
    114. // 获取子节点body下的子节点form
    115. Iterator itersElIterator = recordEless.elementIterator("form");
    116. // 遍历Header节点下的Response节点
    117. while (itersElIterator.hasNext()) {
    118. Element itemEle = (Element) itersElIterator.next();
    119. // 拿到body下的子节点form下的字节点banlce的值
    120. String banlce = itemEle.elementTextTrim("banlce");
    121. String subID = itemEle.elementTextTrim("subID");
    122. System.out.println("banlce:" + banlce);
    123. System.out.println("subID:" + subID);
    124. map.put("result", result);
    125. map.put("banlce", banlce);
    126. map.put("subID", subID);
    127. }
    128. }
    129. } catch (DocumentException e) {
    130. e.printStackTrace();
    131. } catch (Exception e) {
    132. e.printStackTrace();
    133. }
    134. return map;
    135. }
    136. public static void main(String[] args) {
    137. // 下面是需要解析的xml字符串例子
    138. String xmlString = "<html>" + "<head>" + "<title>dom4j解析一个例子</title>"
    139. + "<script>" + "<username>yangrong</username>"
    140. + "<password>123456</password>" + "</script>" + "</head>"
    141. + "<body>" + "<result>0</result>" + "<form>"
    142. + "<banlce>1000</banlce>" + "<subID>36242519880716</subID>"
    143. + "</form>" + "</body>" + "</html>";
    144. /*
    145. * Test2 test = new Test2(); test.readStringXml(xmlString);
    146. */
    147. Map map = readStringXmlOut(xmlString);
    148. Iterator iters = map.keySet().iterator();
    149. while (iters.hasNext()) {
    150. String key = iters.next().toString(); // 拿到键
    151. String val = map.get(key).toString(); // 拿到值
    152. System.out.println(key + "=" + val);
    153. }
    154. }
    155. }

    实例2:

  • 
        
    1. /**
    2. * 解析包含有DB连接信息的XML文件
    3. * 格式必须符合如下规范:
    4. * 1. 最多三级,每级的node名称自定义;
    5. * 2. 二级节点支持节点属性,属性将被视作子节点;
    6. * 3. CDATA必须包含在节点中,不能单独出现。
    7. *
    8. * 示例1——三级显示:
    9. * <db-connections>
    10. * <connection>
    11. * <name>DBTest</name>
    12. * <jndi></jndi>
    13. * <url>
    14. * <![CDATA[jdbc:mysql://localhost:3306/db_test?useUnicode=true&characterEncoding=UTF8]]>
    15. * </url>
    16. * <driver>org.gjt.mm.mysql.Driver</driver>
    17. * <user>test</user>
    18. * <password>test2012</password>
    19. * <max-active>10</max-active>
    20. * <max-idle>10</max-idle>
    21. * <min-idle>2</min-idle>
    22. * <max-wait>10</max-wait>
    23. * <validation-query>SELECT 1+1</validation-query>
    24. * </connection>
    25. * </db-connections>
    26. *
    27. * 示例2——节点属性:
    28. * <bookstore>
    29. * <book category="cooking">
    30. * <title lang="en">Everyday Italian</title>
    31. * <author>Giada De Laurentiis</author>
    32. * <year>2005</year>
    33. * <price>30.00</price>
    34. * </book>
    35. *
    36. * <book category="children" title="Harry Potter" author="J K. Rowling" year="2005" price="$29.9"/>
    37. * </bookstore>

     

文章来源: aaaedu.blog.csdn.net,作者:tea_year,版权归原作者所有,如需转载,请联系作者。

原文链接:aaaedu.blog.csdn.net/article/details/106225727

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

举报
请填写举报理由
0/200