java转义xml中的多余尖括号

举报
江南一点雨 发表于 2021/08/16 23:53:33 2021/08/16
【摘要】 xml中的敏感字符是尖括号,如果xml的值中含有尖括号,那么在解析的时候就会报错,如: <?xml version="1.0" encoding="UTF-8"?><books><book><id>1</id><name><三国<><演><演>义</...

xml中的敏感字符是尖括号,如果xml的值中含有尖括号,那么在解析的时候就会报错,如:

<?xml version="1.0" encoding="UTF-8"?><books><book><id>1</id><name><三国<><><></name><price>4<>5</price><author>罗贯中</author></book></books>

  
 
  • 1
  • 2

需要先对这些xml文件进行处理。
我的一个大概思路是这样的:
先利用正则找出所有的标签,再把标签存入一个ArrayList中,然后对照arraylist中的值,把标签两端的尖括号换成标记的字符串,然后转义掉剩余的所有尖括号,最后再把标记字符串转换成尖括号即可。
代码如下:

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class FilterXMLUtil { /** * 传入一个xml字符串,将其中的多余的<>转义后返回 * @param xmlStr * @return */ public static String filterIllegalityChar(String xmlStr) { //用来存放标签的集合 List<String> tags = new ArrayList<String>(); //去掉最前面的两个尖括号 xmlStr = xmlStr.replace("<?xml", "?xml").replace("\"UTF-8\"?>", "\"UTF-8\"?"); //通过正则找到所有的标签 Pattern tag = Pattern.compile("<([a-zA-Z0-9]+)>"); Matcher mc = tag.matcher(xmlStr); while(mc.find()){ //匹配成功之后将之存入list中 tags.add(mc.group(1)); } /** * 临时替代符号 * <-----------> ^^ * >----------->~~ * </---------->##/ */ for(int i = 0;i<tags.size();i++){ xmlStr = xmlStr.replaceAll("<" + tags.get(i) + ">", "^^"+tags.get(i)+"~~").replaceAll("</"+tags.get(i)+">", "##/"+tags.get(i)+"~~"); } //转义 xmlStr = xmlStr.replaceAll("<", "&lt;").replace(">", "&gt;"); //转换回来 xmlStr = xmlStr.replace("^^", "<").replace("~~", ">").replace("##/", "</").replace("?xml", "<?xml").replace("\"UTF-8\"?", "\"UTF-8\"?>"); return xmlStr; }
}
  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40

输出:

<?xml version="1.0" encoding="UTF-8"?><books><book><id>1</id><name>&lt;三国&lt;&gt;&lt;演&gt;&lt;演&gt;义</name><price>4&lt;&gt;5</price><author>罗贯中</author></book></books>

  
 
  • 1
  • 2

这样就可以解析这个xml字符串了。

文章来源: wangsong.blog.csdn.net,作者:_江南一点雨,版权归原作者所有,如需转载,请联系作者。

原文链接:wangsong.blog.csdn.net/article/details/46706695

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。