&#X开头的文本，怎么转换为汉字

数据社发表于 2022/09/25 03:24:10 2022/09/25

【摘要】今天查询hive中的数据发现一个问题，hive客户端查询显示是&#x开头的乱码，查看原数据库中也是这样，但是在浏览器中可以解析这种编码。 &#xxx;‘ 的格式其实是unicode，&a...

今天查询hive中的数据发现一个问题，hive客户端查询显示是&#x开头的乱码，查看原数据库中也是这样，但是在浏览器中可以解析这种编码。
&#xxx;‘ 的格式其实是unicode，&#后面跟的是unicode字符的十进制值。
Python有内置的标准库来解码，使用起来更为简便：

 import HTMLParser
 s = '&#x3010;&#x8BD5;&#x547C;&#x3011;'
 h = HTMLParser.HTMLParser()
 print h.unescape(s)
  
 
  1
  2
  3
  4

输出：

【试呼】
  
 
  1

完美解决“乱码”问题。

文章来源: dataclub.blog.csdn.net，作者：数据社，版权归原作者所有，如需转载，请联系作者。

原文链接：dataclub.blog.csdn.net/article/details/71435145

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

上滑加载中

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

&amp;#X开头的文本，怎么转换为汉字