【大数据】hive使用split函数注意事项(此处可能有坑,初学者容易出错)

举报
橙子园 发表于 2022/05/26 01:15:12 2022/05/26
【摘要】 注意:我们经常会使用split对字符串做切分,但要注意一点,当原来的值为空值时,容易产生大小为1的空字符串数组[“”],在我们查询时,它和空数组[]输出来是很相似的,但它的大小却是1,如果我们再根据arr...

注意:我们经常会使用split对字符串做切分,但要注意一点,当原来的值为空值时,容易产生大小为1的空字符串数组[“”],在我们查询时,它和空数组[]输出来是很相似的,但它的大小却是1,如果我们再根据array的size判断做一下操作时,很可能出现意想不到的错误。
例如:

one_cate_name
工程科技
哲学与人文科学;医药卫生科技
社会科学I
SELECT split(one_cate_name, ";") as split_name, size(split(one_cate_name, ";")) as num from table_name

  
 
  • 1

得到:
在这里插入图片描述

为避免出现空字符串数组[“”],可以切分时加条件

SELECT 
case when (one_cate_name="") then array() else split(one_cate_name, ";") end as split_name, 
size(split(one_cate_name, ";")) as num from table_name

  
 
  • 1
  • 2
  • 3

在这里插入图片描述

文章来源: blog.csdn.net,作者:橙子园,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/Chenftli/article/details/122494505

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。