[数据库] Oracle单表查询总数及百分比和数据横向纵向连接 丨【绽放吧!数据库】

举报
eastmount 发表于 2021/07/25 21:18:23 2021/07/25
【摘要】 这是最近学习SQL语句的统计,其中本文主要涉及以下几个知识点:1.如何统计一张表中某个字段的总数;2.如何联系另一张表进行查询某个字段的总数及百分比; 3.简单介绍decode防止分母为0和trunc保留小数位数等函数;4.通常复杂的SQL语句会涉及到查询结果横向连接和纵向连接。基础性文章,希望对您有所帮助。

        这是最近项目关于SQL语句的,本文简单记录并总结以下几个知识点:
        1.如何统计一张表中某个字段的总数,如不同"专业"的学生数及所占百分比;
        2.如何联系另一张表进行查询某个字段的总数及百分比;
        3.简单介绍decode防止分母为0和trunc保留小数位数等函数;
        4.通常复杂的SQL语句会涉及到查询结果横向连接和纵向连接,这里进行介绍。

        最近买了本《Oracle查询优化改写技巧与案例·有教无类 落落》,推荐大家也阅读下。后面我也会补充一些相关数据的知识,希望对大家有所帮助吧!文章还是以基础知识为主,同时主要是解决实际的问题。同时我采用自问自答的新叙述方法进行介绍~


0. 前言

        假如现在存在如下图所示的一张表,这种表在数据库中是很常见,主要包括字段(序号,教师姓名,单位名称,性别,学历)。该表的信息为:TEST_TEACHER(id,name,dw_name,sex,degree)。

1.问题一: 如何在单表中统计总数及比例

        现在需要统计各个单位的教师人数,及该单位的不同学历的、性别的人数。这是非常常见的问题,当时项目中统计的内容很多,包括:年龄、学缘、职称、专业等等。
        这很简单并且方法很多,常见的主要使用子查询或group by分组。
        group by:

select DW_NAME, COUNT(DW_NAME) as 人数 from TEST_TEACHER
group by DW_NAME
order by DW_NAME;

        输出结果如下图所示:其中order by是按汉语拼音排序输出。

        如果现在需要统计各个学院的男性、女性教师人数,博士、硕士、学士的教师人数,需要怎么办呢?因为它都是同一张表的信息,一种方法是使用子查询,这里介绍另外一种方法,通过CASE WHEN THEN实现。
        CASE WHEN THEN:
select DW_NAME, COUNT(DW_NAME) as SUM, 
    COUNT(CASE WHEN SEX='男' THEN 1 END) as Man, COUNT(CASE WHEN SEX='女' THEN 1 END) as Women,
    COUNT(CASE WHEN DEGREE='博士' THEN 1 END) as BS, COUNT(CASE WHEN DEGREE='硕士' THEN 1 END) as SS
from TEST_TEACHER  
group by DW_NAME order by DW_NAME; 

        输出结果如下图所示:表示如何SEX为"男",统计加1。

        现在如果需要统计每个学院所占所有人数的比例,怎么计算呢?
        传统方法该步骤是分别统计两个数,再通过后台Java或C++进行处理的,或者是使用除法: 学院总数/老师表总数,但是已经使用了分组group by,如果再使用一遍统计TEST_TEACHER总数就会报错。
        这里使用的是Oracle的函数ratio_to_report() over()实现。
        ratio_to_report:
select DW_NAME, COUNT(DW_NAME) as SUM, 
    ratio_to_report(COUNT(1)) OVER(),
    COUNT(CASE WHEN SEX='男' THEN 1 END) as Man, COUNT(CASE WHEN SEX='女' THEN 1 END) as Women
from TEST_TEACHER  
group by DW_NAME order by DW_NAME; 

        输出结果如下图所示:其中计算机3个老师,总数10个老师,比例占0.3。


  

2.问题二: 联系另一张表统计总数及比例

       在设计数据库过程中,通常会将教师的信息设置为一张表,学院信息会存在另一张表中,同理授课信息、发表论文信息都会存在单独的表,再通过教师姓名(或教师编号)连接查询。
       所以这里讲述第二种统计总数及比例的方法,假设还存在一张学院表,如下图所示:该表TEST_DEP结构为(DW_NAME,DW_CODE,YEAR,ADDR)。

       通常是遍历该单位表,然后子查询连接教师表,统计不同单位的人数信息。同样统计专业教师信息、教师发表论文、学院发表论文都是这种方法。
        两表连接子查询:统计总数
select t2.DW_NAME, 
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME) as 总数,
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='男') as 男,
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='女') as 女
from TEST_DEP t2;

        输出结果如下图所示:这种方法是非常常见的一种统计方法,而不是仅仅通过单表,因为数据库往往都会通过外键联系其他表。

        这种两表联系的另一个优势是更方便计算百分比、比例等,因为同一张表使用两次时很麻烦的,如 "select (select * from t1) from t1;"这里使用子查询计算比例代码如下。
        两表连接子查询:统计比例
select t2.DW_NAME, 
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME) as 总数,
    ((select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME) 
    / (select COUNT(*) from TEST_TEACHER)) as 总数比例,
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='男') as 男,
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='女') as 女,
    ((select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='男')
    / (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME)) as 男教师比例
from TEST_DEP t2;

        输出结果如下图所示:

        其中总共10个教师,计算机学院3人,所占比例=3/10=0.4,同时男教师比例为计算机学院男教师2人,女教师1人,故比例=2/3=0.666,这里使用的方法是子查询的除法。其实更常见的方法是获取总数,然后后台业务逻辑进行计算。
 
        

3.问题三: 除法防止分母为0及保留有效位数

        如上图输出为0.6666667,此时需要保留有效位数,这里的方法可以是使用trunc()函数,整数可用floor()函数。
        TRUNC(x[,y])功能: 计算截尾到y位小数的x值,y缺省为0,结果变为一个整数值。
        trunc()是截断操作,floor(x)是小于或等于x的最大整数。
        TRUNC() FLOOR():

select t2.DW_NAME, 
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME) as 总数,
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='男') as 男,
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='女') as 女,
    trunc(((select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='男')
    / (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME))*100,2) as 百分比
from TEST_DEP t2;

        输出结果如下图所示:

        其中输出为66.66,表示计算机学院男教师所占百分比,其中保留2位有效数字的方法为:trunc( 统计男教师子查询 / 统计教师子查询*100,2)。

        Oracle中通常需要统计如男生占全班总人数比例等用法,此时如果分母为0,它会报错"[Err] ORA-01476: divisor is equal to zero"。那怎么办呢?
        解决方法:使用函数decode,当分母为0时直接返回0,否则进行除法运算。
        select a/b from c; 修改成如下即可:select decode(b, 0, 0, a/b) from c;
        例如:decode(XF_ALL, 0, 0,trunc(XF_MATH / XF_ALL * 100, 1)) as BL
        上面子查询除法使用decode的并结合trunc保留2位有效数字的SQL如下。
        decode():

select t2.DW_NAME, 
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME) as 总数,
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='男') as 男,
    (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='女') as 女,
    trunc(decode((select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME),
    0, 0, 
    ((select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME and SEX='男')
    / (select COUNT(*) from TEST_TEACHER t1 where t1.DW_NAME=t2.DW_NAME)))*100,2) as 百分比
from TEST_DEP t2;

        输出结果如下图所示,核心方法:trunc(decode(b,0,0,a/b)*100, 2)。


4.问题四: 查询横向连接和纵向连接

        复杂的SQL语句通常包括横向连接和纵向连接。
        横向连接:使用自定义子查询
        这里使用的方法是子查询自定义命名的方法,该方法只返回一行数据,通常通过Json格式给后台,后台只需要显示即可。它的优势是不论表多复杂或表之间没有关系,而是只需要把值统计在一行,都能联系返回结果。
        如下图所示,这就是横向连接返回的结果,但是需要知道具体的学院名称。

        在统计不同表的总数信息时,使用该方法比较好。
select t1.DW_NAME, t2.ZS, t3.BS, t4.DW_NAME, t5.ZS, t6.BS
from 
(select DW_NAME as DW_NAME from TEST_TEACHER where DW_NAME='软件学院' group by DW_NAME) t1,
(select COUNT(*) as ZS from TEST_TEACHER where DW_NAME='软件学院') t2,
(select COUNT(*) as BS from TEST_TEACHER where DW_NAME='软件学院' and DEGREE='博士') t3,
(select DW_NAME as DW_NAME from TEST_TEACHER where DW_NAME='计算机学院' group by DW_NAME) t4,
(select COUNT(*) as ZS from TEST_TEACHER where DW_NAME='计算机学院') t5,
(select COUNT(*) as BS from TEST_TEACHER where DW_NAME='计算机学院' and DEGREE='博士') t6;

       纵向连接:使用UNION ALL连接
        假设现在只需要统计"软件学院"、"计算机学院"的信息,这里需要纵向连接,则使用UNION ALL自然连接。
        Union:对两个结果集进行并集操作,不包括重复行,同时进行默认规则的排序;
        Union All:对两个结果集进行并集操作,包括重复行,不进行排序。
        注意:COUNT需要使用GROUP BY,这种方法的优势是如果表中存在很多NULL的单位信息或只需要统计几个固定的学院信息,此时使用该方法就比较适合。
        总之,特定的场合需要特定的处理方法。

select DW_NAME, COUNT(DW_NAME) as SUM, 
    ratio_to_report(COUNT(1)) OVER() as BL,
    COUNT(CASE WHEN SEX='男' THEN 1 END) as Man, COUNT(CASE WHEN SEX='女' THEN 1 END) as Women
from TEST_TEACHER WHERE DW_NAME='软件学院' GROUP BY DW_NAME
    UNION ALL
select DW_NAME, COUNT(DW_NAME) as SUM, 
    ratio_to_report(COUNT(1)) OVER() as BL,
    COUNT(CASE WHEN SEX='男' THEN 1 END) as Man, COUNT(CASE WHEN SEX='女' THEN 1 END) as Women
from TEST_TEACHER WHERE DW_NAME='计算机学院' GROUP BY DW_NAME; 

        输出结果如下图所示:


       最后希望文章对你有所帮助,这是一篇我的在线笔记,同时后面结合自己实际项目和SQL性能优化,将分享一些更为专业的文章~还有20多天就要毕业当老师了,哈哈!
       

         希望能与大家一起在华为云社区共同承载,原文地址:https://blog.csdn.net/Eastmount/article/details/51660174

        【绽放吧!数据库】有奖征文火热进行中:https://bbs.huaweicloud.com/blogs/285617

        (By:娜璋之家 Eastmount 2021-07-25 夜于武汉)

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。