联合索引查询原理及生效规则

举报
JavaEdge 发表于 2022/02/19 22:09:31 2022/02/19
【摘要】 一般都是设计联合索引,很少用单个字段做索引,因为还是要尽可能让索引数量少,避免磁盘占用太多,影响增删改性能。有个表存储学生成绩,id是自增主键,包含学生班级、学生姓名、科目名称、成绩分数四个字段,平时查询,可能比较多的就是查找某个班的某个学生的某个科目的成绩。所以,我们可以针对【学生班级,学生姓名,科目名称】建立一个联合索引。有两个数据页:第一个数据页里有三条数据,每条数据都包含联合索引的三...

一般都设计联合索引,很少用单字段做索引,因为还是要尽可能让索引数量少,避免磁盘占用太多,影响增删改性能。

1 数据准备

某表存储学生成绩:

平时查询,较多的是查找【某班某学生某科】的成绩。

所以,可针对【班级,姓名,科目】建立联合索引。

2 数据页结构

  • 第一个数据页有三条数据,每条数据都包含联合索引的三字段值和主键值,数据页内部按序排:先按班级排,若一样则按姓名排序,再一样则按科目名排序。所以数据页内部都按三字段值排序,组成单链表
  • 数据页之间有序。第二个数据页里的三个字段的值都>上一个数据页里三个字段的值,比较方法也是按班级名称、学生姓名、科目名依次比较,数据页间组成双向链表

索引页里就是两条数据,分别指向两个数据页,索引存放的是每个数据页里最小的那个数据的值。

索引页内部的数据页是组成单向链表有序的,如你有多个索引页,索引页之间也有序,组成双向链表。

假设搜索6班+张三+数学的成绩:

select * from student_score where class_name='6班' and student_name='张三' and subject_name='数学'

涉及索引使用规则,where条件的几个字段都是等值查询且where条件的几个字段名称和顺序也跟联合索引一样!此时就是等值匹配规则,上面SQL百分百可用联合索引查询。

3 查询过程

先到索引页找,索引页里有多个数据页的最小值记录,在索引页二分查找,先根据【班级名称】找6班对应数据页,定位到其所在数据页。

在数据页内部本身也是单向链表,直接二分查找,先找6班,发现几条数据都是6班,此时就按张三姓名来二分查找,此时会发现多条数据都是张小强,接着就按科目名称数学二分查找。

定位到下图中的一条数据,6班张三的数学,其对应id=127:

然后就根据主键id=127到聚簇索引按一样思路,从索引根节点开始二分查找迅速定位下个层级的页,不停找,很快就可找到id=127那条数据,然后从里提取所有字段,包括分数,完成!

4 小结

如上就是联合索引的查找过程以及全值匹配规则,假设你的SQL语句的where条件里用的几个字段的名称和顺序,都跟你的索引里的字段一样,同时你还是用等号在做等值匹配,那么直接就会按照上述过程来找。

联合索引就是依次按照各个字段来进行二分查找,先定位到第一个字段对应的值在哪个页里,然后如果第一个字段有多条数据值都一样,就根据第二个字段来找,以此类推,一定可以定位到某条或者某几条数据。

5 索引使用规则

有了联合索引后,SQL怎么写才能让他的查询使用索引?

5.1 等值匹配规则

where语句的字段名称和联合索引字段完全一样,且都是基于等号的等值匹配,那百分百会用上索引。即使你where语句里写的字段的顺序和联合索引里的字段顺序不一致,也没关系,MySQL会自动优化按联合索引的字段顺序。

5.2 最左侧列匹配

假设联合索引是KEY(class_name, student_name, subject_name),那不一定必须在where语句里根三个字段查,只要根据最左侧部分字段来查也可。 如:

select * from student_score where class_name='' and student_name=''

但假设你写:

select * from student_score where subject_name=''

就不行,因为联合索引B+树里,必先按class_name查,再按student_name查,不能跳过前面两个字段,直接按最后一个subject_name查。

若如下SQL:

select * from student_score where class_name='' and subject_name=''

那么只有class_name的值可以在索引里搜索,剩下的subject_name是没法在索引里找的,道理同上。

所以在建立索引的过程中,你必须考虑好联合索引字段的顺序,以及你平时写SQL的时候要按哪几个字段来查。

5.3 最左前缀匹配原则

like查如:

select * from student_score where class_name like '1%'

查找所有1打头的班级的分数,也可用到索引。因为你的联合索引的B+树里,都是按照class_name排序的,所以你要是给出class_name的确定的最左前缀就是1,然后后面的给一个模糊匹配符号,那也是可以基于索引来查找的,这是没问题的。

但是你如果写class_name like ‘%班’,在左侧用一个模糊匹配符,那他就没法用索引了,因为不知道你最左前缀是什么,怎么去索引里找呢?

5.4 范围查找规则

可用

select * from student_score where class_name>'1 班' and class_name<'5班'

这种语句来范围查找某几个班级的分数。

这个时候也是会用到索引的,因为我们的索引的最下层的数据页都是按顺序组成双向链表的,所以完全可以先找到’1 班’对应的数据页,再找到’5班’对应的数据页,两个数据页中间的那些数据页,就全都是在你范围内的数据了!

但你若写:

select * from student_score where class_name>'1 班 ' and class_name<'5 班 ' and student_name>''

这里只有class_name可基于索引来找,student_name范围查询没法用到索引!

即where语句里若有范围查询,那只有对联合索引里最左侧列进行范围查询才能用到索引!

5.5 等值匹配+范围匹配的规则

若用:

select * from student_score where class_name='1班' and student_name>'' and subject_name<''

先可用class_name在索引里精准定位到一波数据,接着这波数据里的student_name都是按顺排的,所以student_name>’‘也会基于索引来查找,但接下来的subject_name<’'不能用索引。

小结

  • 用联合索引的最左侧的多个字段来进行等值匹配+范围搜索
  • 或基于最左侧的部分字段来进行最左前缀模糊匹配
  • 或基于最左侧字段来进行范围搜索
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。