RDS运维之分组和排序查询
分组和排序
08 基础查询-单表02:分组和排序Group by 分组group by示例with rollup 关键字用 group by 子句规则过滤分组 havingHAVING和WHERE的差别Order by 排序Order by 子句的位置Order By 执行顺序1. 单列排序2. 按多个列排序3. 指定排序方向分组与排序的区别
Group by 分组
SQL聚集函数可用来汇总数据。这使我们能够对行进行计数,计算和与平均数,获得最大和最小值而不用检索所有数据。
目前为止的所有计算都是在表的所有数据或匹配特定的WHERE子句的数据上进行的。比如:
SELECT emp.empid,emp.ename,emp.sex,emp.age FROM emp where emp.age >25;
但是需要返回25岁以上男性和女性各有多少人怎么办 ?这个时候就可以适用面分组语句 group by了!
分组允许把数据分为多个逻辑组,以便能对每个组进行聚集计算。
分组是在 SELECT 语句的 GROUP BY 子句中建立的。
group by示例
分组示例:统计 25岁以上的男性和女性各有多少人
SELECT emp.sex, count(*) FROM emp where emp.age >25 group by sex
group by sex 将性别进行分组,count(*) 则用于统计每组的总数。
with rollup 关键字
使用 with rollup
关键字,可以得到每个分组以及每个分组汇总级别(针对每个分组)的值
SELECT emp.sex, count(*) as num FROM emp group by sex with ROLLUP
用 group by 子句规则
-
GROUP BY子句可以包含任意数目的列。这使得能对分组进行嵌套,为数据分组提供更细致的控制。
-
如果在GROUP BY子句中嵌套了分组,数据将在最后规定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)
-
GROUP BY子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数) 。如果在SELECT中使用表达式,则必须在 GROUP BY 子句中指定相同的表达式。不能使用别名。
-
除聚集计算语句外,SELECT语句中的每个列都必须在GROUP BY子句中给出。
-
如果分组列中具有NULL值,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。
-
GROUP BY子句必须出现在WHERE子句之后 (如果有 WHERE 子句的话 ),ORDER BY子句之前。
示例:对性别分组后,在最后规定的分组上进行计算(规则1)
SELECT sex , max(age) FROM emp group by sex;
过滤分组 having
除了能用GROUP BY分组数据外,MySQL还允许过滤分组,规定包括哪些分组,排除哪些分组。例如,可能想要列出至少有两个订单的所有顾客。为得出这种数据,必须基于完整的分组而不是个别的行进行过滤。
之前我们使用 WHERE 子句进行数据过滤。但是过滤指定的是行而不是分组。事实上,WHERE没有分组的概念。
WHERE过滤行,而HAVING过滤分组。
最重要的是 : having 语句中可以使用函数
SELECT * FROM emp group by sex having age > 23;
执行顺序
-
from emp
-
group by
-
having
注意,上面的 select 使用的是星号,显示了所有
//的列。如果把年龄限制调到24 , 结果就只剩下下面的一条数据了。
SELECT * FROM emp group by sex having age > 25;
HAVING和WHERE的差别
WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。这是一个重要的区别,WHERE排除的行不包括在分组中。这可能会改变计算值,从而影响HAVING子句中基于这些值过滤掉的分组。
但是 where 和 having 可以同时使用
示例:年龄大于25岁的雇员进行分组,每个性别 多于 2人的数据
SELECT sex , max(age) FROM emp where age > 25 group by sex having count(*) > 2
Order by 排序
检索出的数据并不是以纯粹的随机顺序显示的。如果不排序,数据一般将以它在底层表中出现的顺序显示。这可以是数据最初添加到表中的顺序。但是,如果数据后来进行过更新或删除,则此顺序将会受到MySQL重用回收存储空间的影响。如果不明确规定排序顺序,则不应该假定检索出的数据的顺序有意义。
为了明确地排序用SELECT语句检索出的数据,可使用ORDER BY子句。ORDER BY子句取一个或多个列的名字,据此对输出进行排序。
Order by 子句的位置
-
在给出ORDER BY子句时,应该保证它位于FROM子句之后
-
如果使用 LIMIT,它必须位于ORDER BY之后。使用子句的次序不对将产生错误消息。
Order By 执行顺序
-
执行 from
-
执行 where
-
执行 select
-
执行 order by
1. 单列排序
示例:对雇员的手机号进行排序
select empid , ename , phone,email from emp order by phone
2. 按多个列排序
经常需要按不止一个列进行数据排序。例如,如果要显示雇员清单,可能希望按姓和名排序(首先按姓排序,然后在每个姓中再按名排序) 。如果多个雇员具有相同的姓,这样做很有用。
为了按多个列排序,只要指定列名,列名之间用逗号分开即可(就像选择多个列时所做的那样) 。
select empid ,ename ,sex , phone , email from emp order by sex , phone
在按多个列排序时,排序完全按所规定的顺序进行。上面的查询中,如果 sex的值都是唯一的,phone 就没有再排序的必要了。可以对排序的列的顺序进行互换,来查看排序效果。
3. 指定排序方向
数据排序不限于升序排序(从A到Z) 。这只是默认的排序顺序,还可以使用ORDER BY子句以降序(从Z到A)顺序排序。为了进行降序排序,必须指定DESC关键字。
select empid ,ename ,sex , phone , email from emp order by sex , phone desc
将上面的SQL 语句中 phone 的排序方式修改为 desc ,再来看效果。
字母大小写和排序顺序:对于文本数据进行排序的时候,字母大小写的排序顺序完全取决于数据库是如何设置的。MySQL 默认大小写字母相同。
ORDER BY子句对检索出的数据进行排序。这个子句必须是SELECT语句中的最后一条子句。可根据需要,利 用它在一个或多个列上对数据进行排序。
分组与排序的区别
虽然GROUP BY和ORDER BY经常完成相同的工作,但它们是非常不同的。见下表
ORDER BY | GROUP BY |
---|---|
排序产生的输出 | 分组行。但输出可能不是分组的顺序 |
任意列都可以使用(甚至非选择的列也可以使用) | 只可能使用选择列或表达式列,而且必须使用每个选择 |
不一定需要 | 如果与聚集函数一起使用列(或表达式),则必须使用 |
- 点赞
- 收藏
- 关注作者
评论(0)