2021年大数据常用语言Scala(二十六):函数式编程 分组 groupBy

举报
Lansonli 发表于 2021/09/29 00:40:17 2021/09/29
【摘要】 目录 分组  groupBy 定义 示例 分组  groupBy 我们如果要将数据按照分组来进行统计分析,就需要使用到分组方法 等同于SQL中的 group by的概念, 就是给数据按照指定的列进行分组用。   定义 groupBy表示按照函数将列表分成不同的组 方法签名 def&n...

目录

分组  groupBy

定义

示例


分组  groupBy

我们如果要将数据按照分组来进行统计分析,就需要使用到分组方法

等同于SQL中的 group by的概念, 就是给数据按照指定的列进行分组用。

 

定义

groupBy表示按照函数将列表分成不同的组

方法签名

def groupBy[K](f: (A) ⇒ K): Map[K, List[A]]

方法解析

groupBy方法

API

说明

泛型

[K]

分组字段的类型

参数

f: (A) ⇒ K

传入一个函数对象<br />接收集合元素类型的参数<br />返回一个K类型的key,这个key会用来进行分组,相同的key放在一组中

返回值

Map[K, List[A]]

返回一个映射,K为分组字段,List为这个分组字段对应的一组数据

 

groupBy执行过程分析

 

示例

有一个列表,包含了学生的姓名和性别:

"张三", "男"
"李四", "女"
"王五", "男"

请按照性别进行分组,统计不同性别的学生人数

 

步骤

定义一个元组列表来保存学生姓名和性别

按照性别进行分组

将分组后的Map转换为列表:List(("男" -> 2), ("女" -> 1))

 

参考代码


  
  1. scala> val a = List("张三"->"男""李四"->"女""王五"->"男")
  2. a: List[(StringString)] = List((张三,男), (李四,女), (王五,男))
  3. // 按照性别分组
  4. scala> a.groupBy(_._2)
  5. res0: scala.collection.immutable.Map[String,List[(StringString)]] = Map(男 -> List((张三,男), (王五,男)),
  6. 女 -> List((李四,女)))
  7. // 将分组后的映射转换为性别/人数元组列表
  8. scala> res0.map(x => x._1 -> x._2.size)
  9. res3: scala.collection.immutable.Map[String,Int] = Map(男 -> 2, 女 -> 1)

 

文章来源: lansonli.blog.csdn.net,作者:Lansonli,版权归原作者所有,如需转载,请联系作者。

原文链接:lansonli.blog.csdn.net/article/details/116550528

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。