【大数据】hive将表中数据分组、然后将每行数据的两个字段拼接成json字符串,放到array里
【摘要】
例如:
select periodical_code,
sort_array(collect_set(
concat(
"{",
concat(
...
例如:
select periodical_code,
sort_array(collect_set(
concat(
"{",
concat(
concat("\"", p_year, "\""),
":",
concat("\"", p_year_stage, "\"")
),
"}"
)
)) as year_stage_set
from ods_medical group by periodical_code;
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
这边使用了hive中的3个函数,concat、collect_set、sort_array
1、cancat 可以将多个字符串连接
2、collect_set 可以将分组后的数据一条一条收集成一个array,而且会去除重复数据
3、sort_array 可以对一个array中的所有元素进行字典序排序
文章来源: blog.csdn.net,作者:橙子园,版权归原作者所有,如需转载,请联系作者。
原文链接:blog.csdn.net/Chenftli/article/details/120271655
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)