【大数据】hive将表中数据分组、然后将每行数据的两个字段拼接成json字符串,放到array里

举报
橙子园 发表于 2022/05/25 23:37:26 2022/05/25
【摘要】 例如: select periodical_code, sort_array(collect_set( concat( "{", concat( ...

例如:

select periodical_code,
sort_array(collect_set(
    concat(
        "{",
        concat(
            concat("\"", p_year, "\""),
            ":",
            concat("\"", p_year_stage, "\"")
        ),
        "}"
    )
)) as year_stage_set
from ods_medical group by periodical_code;

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13

这边使用了hive中的3个函数,concat、collect_set、sort_array

1、cancat 可以将多个字符串连接

2、collect_set 可以将分组后的数据一条一条收集成一个array,而且会去除重复数据

3、sort_array 可以对一个array中的所有元素进行字典序排序

文章来源: blog.csdn.net,作者:橙子园,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/Chenftli/article/details/120271655

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。