RDS运维之分组和排序查询

举报
tea_year 发表于 2024/08/23 17:16:59 2024/08/23
【摘要】 分组和排序08 基础查询-单表02:分组和排序Group by 分组group by示例with rollup 关键字用 group by 子句规则过滤分组 havingHAVING和WHERE的差别Order by 排序Order by 子句的位置Order By 执行顺序1. 单列排序2. 按多个列排序3. 指定排序方向分组与排序的区别Group by 分组SQL聚集函数可用来汇总数据。...

分组和排序

Group by 分组

SQL聚集函数可用来汇总数据。这使我们能够对行进行计数,计算和与平均数,获得最大和最小值而不用检索所有数据。


目前为止的所有计算都是在表的所有数据或匹配特定的WHERE子句的数据上进行的。比如:

SELECT emp.empid,emp.ename,emp.sex,emp.age FROM emp where emp.age >25;

但是需要返回25岁以上男性和女性各有多少人怎么办 ?这个时候就可以适用面分组语句 group by了!

分组允许把数据分为多个逻辑组,以便能对每个组进行聚集计算。

分组是在 SELECT 语句的 GROUP BY 子句中建立的。

group by示例

分组示例:统计 25岁以上的男性和女性各有多少人

SELECT emp.sex, count(*) FROM emp where emp.age >25 group by sex

group by sex 将性别进行分组,count(*) 则用于统计每组的总数。

with rollup 关键字

使用 with rollup 关键字,可以得到每个分组以及每个分组汇总级别(针对每个分组)的值

SELECT emp.sex, count(*) as num FROM emp group by sex with ROLLUP


用 group by 子句规则

  1. GROUP BY子句可以包含任意数目的列。这使得能对分组进行嵌套,为数据分组提供更细致的控制。

  2. 如果在GROUP BY子句中嵌套了分组,数据将在最后规定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)

  3. GROUP BY子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数) 。如果在SELECT中使用表达式,则必须在 GROUP BY 子句中指定相同的表达式。不能使用别名。

  4. 除聚集计算语句外,SELECT语句中的每个列都必须在GROUP BY子句中给出。

  5. 如果分组列中具有NULL值,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。

  6. GROUP BY子句必须出现在WHERE子句之后 (如果有 WHERE 子句的话 ),ORDER BY子句之前。


示例:对性别分组后,在最后规定的分组上进行计算(规则1)

SELECT  sex , max(age)  FROM emp group by sex;

1566373331694.png


过滤分组 having

除了能用GROUP BY分组数据外,MySQL还允许过滤分组,规定包括哪些分组,排除哪些分组。例如,可能想要列出至少有两个订单的所有顾客。为得出这种数据,必须基于完整的分组而不是个别的行进行过滤。

之前我们使用 WHERE 子句进行数据过滤。但是过滤指定的是行而不是分组。事实上,WHERE没有分组的概念。

HAVING 非常类似于 WHERE。事实上,目前为止所学过的所有类型的WHERE子句都可以用HAVING来替代。唯一的差别是WHERE过滤行,而HAVING过滤分组。


最重要的是 : having 语句中可以使用函数


SELECT  *  FROM emp group by sex  having age > 23;

1566372772513.png


执行顺序

  1. from emp

  2. group by

  3. having

注意,上面的 select 使用的是星号,显示了所有

//的列。如果把年龄限制调到24 , 结果就只剩下下面的一条数据了。

SELECT  *  FROM emp group by sex  having age > 25;

1566372964895.png


HAVING和WHERE的差别

WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。这是一个重要的区别,WHERE排除的行不包括在分组中。这可能会改变计算值,从而影响HAVING子句中基于这些值过滤掉的分组。

但是 where 和 having 可以同时使用

示例:年龄大于25岁的雇员进行分组,每个性别 多于 2人的数据

SELECT  sex , max(age)  FROM emp  where age > 25 group by sex having count(*) > 2



Order by 排序

检索出的数据并不是以纯粹的随机顺序显示的。如果不排序,数据一般将以它在底层表中出现的顺序显示。这可以是数据最初添加到表中的顺序。但是,如果数据后来进行过更新或删除,则此顺序将会受到MySQL重用回收存储空间的影响。如果不明确规定排序顺序,则不应该假定检索出的数据的顺序有意义。

为了明确地排序用SELECT语句检索出的数据,可使用ORDER BY子句。ORDER BY子句取一个或多个列的名字,据此对输出进行排序。


Order by 子句的位置

  1. 在给出ORDER BY子句时,应该保证它位于FROM子句之后

  2. 如果使用 LIMIT,它必须位于ORDER BY之后。使用子句的次序不对将产生错误消息。

Order By 执行顺序

  1. 执行 from

  2. 执行 where

  3. 执行 select

  4. 执行 order by


1. 单列排序

示例:对雇员的手机号进行排序

select empid , ename , phone,email from emp order by phone

2. 按多个列排序

经常需要按不止一个列进行数据排序。例如,如果要显示雇员清单,可能希望按姓和名排序(首先按姓排序,然后在每个姓中再按名排序) 。如果多个雇员具有相同的姓,这样做很有用。

为了按多个列排序,只要指定列名,列名之间用逗号分开即可(就像选择多个列时所做的那样) 。

select empid ,ename ,sex , phone , email from emp order by sex , phone  

1566283337721.png

在按多个列排序时,排序完全按所规定的顺序进行。上面的查询中,如果 sex的值都是唯一的,phone 就没有再排序的必要了。可以对排序的列的顺序进行互换,来查看排序效果。

3. 指定排序方向

数据排序不限于升序排序(从A到Z) 。这只是默认的排序顺序,还可以使用ORDER BY子句以降序(从Z到A)顺序排序。为了进行降序排序,必须指定DESC关键字。

select empid ,ename ,sex , phone , email from emp order by sex , phone desc

将上面的SQL 语句中 phone 的排序方式修改为 desc ,再来看效果。

1566283518638.png

字母大小写和排序顺序:对于文本数据进行排序的时候,字母大小写的排序顺序完全取决于数据库是如何设置的。MySQL 默认大小写字母相同。


ORDER BY子句对检索出的数据进行排序。这个子句必须是SELECT语句中的最后一条子句。可根据需要,利 用它在一个或多个列上对数据进行排序。


分组与排序的区别

虽然GROUP BY和ORDER BY经常完成相同的工作,但它们是非常不同的。见下表

ORDER BY GROUP BY
排序产生的输出 分组行。但输出可能不是分组的顺序
任意列都可以使用(甚至非选择的列也可以使用) 只可能使用选择列或表达式列,而且必须使用每个选择
不一定需要 如果与聚集函数一起使用列(或表达式),则必须使用

一般在使用GROUP BY子句时,应该也给出ORDER BY子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY排序数据。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。