一条 SQL 语句引发的思考

举报
小林coding 发表于 2021/07/15 09:31:12 2021/07/15
【摘要】 很有意思
大家好,我是小林。

昨晚有位读者问了我这个问题:

图片

他创建了一张数据库表,表里的字段只有主键索引(id)和联合索引(a,b,c),然后他执行的 select * from t where c = 0; 这条语句发现走的是索引,他就感觉很困惑,困惑在于两点:

  • 第一点, where c 这个条件并不符合联合索引的最左匹配原则,怎么就查询的时候走了索引呢?

  • 第二点,在这个数据表加了非索引字段,执行同样的查询语句后,怎么变成走的是全表扫描呢?

我先跟大家解释下,什么是最左匹配原则?

这个数据库表创建了(a,b,c)这个联合索引,要能使其生效必须保证 where 条件里最左边是 a 字段,比如以下这几种情况:

  • where a = 0;

  • where a = 0 and b = 0;

  • where a = 0 and c = 0;

  • where a = 0 and b = 0 and c = 0;

  • where a = 0 and c = 0 and b = 0;

而如果 where 条件里最左边的字段不是 a 时,就无法使用到联合索引,比如以下这种情况,就是不符合最左匹配规则:

  • where b = 0;

  • where c = 0;

  • where b = 0 and c =0;

  • where c = 0 and b = 0;

知道了联合索引的最左匹配原则后,再来看看第一个问题。

为什么  select * from t where c = 0; 这条不符合联合索引的最左匹配原则的查询语句走了索引查询呢?

刚开始看到这个问题的时候,我一时也想不到原因,只能大概猜测这条语句可以覆盖索引,所以就走了索引查询。

今早我就发了个朋友圈,因为我朋友圈有差不多 1W 人,觉得朋友圈肯定有大佬能解答这个问题。

图片

果然朋友圈大佬真的多,一个上午就有 50 多个人留言解答了这个问题,我看完后思路也清晰了。

我也把解答思路整理了下,这里贴出来。

首先,这张表的字段没有「非索引」字段,所以select * 相当于 select id,a,b,c,然后这个查询的内容和条件 都在联合索引树里,因为联合索引树的叶子节点包含「索引列+主键」,所以查联合索引树就能查到全部结果了,这个就是覆盖索引。

但是执行计划里的 type 是 index,这代表着是通过全扫描联合索引树的方式查询到数据的,这是因为 where c 并不符合联合索引最左匹配原则。

那么,如果写了个符合最左原则的 select 语句,那么 type 就是 ref,这个效率就比 index 全扫描要高一些。

那为什么选择全扫描联合索引树,而不扫描全表(聚集索引树)呢?

因为联合索引树的记录比要小的多,而且这个 select * 不用执行回表操作,所以直接遍历联合索引树要比遍历聚集索引树要小的多,因此 MySQL 选择了全扫描联合索引树。

再来回答第二个问题。

为什么这个数据表加了非索引字段,执行同样的查询语句后,怎么变成走的是全表扫描呢?

因为加了其他字段后,select * from t where c = 0; 查询的内容就不能在联合索引树里找到了,而且条件也不符合最左匹配原则,这样既不能覆盖索引也不能执行回表操作,所以这时只能通过扫描全表来查询到所有的数据。


好了,问题就说完了,不知道大家 get 到了吗?

这篇说的比较粗略,没有详细介绍一些索引的概念,比如聚集索引、联合表索引、覆盖索引、回表操作这些东西。

可能没有点索引基础的同学看的有点懵逼,小林后面在出一篇更详细的。

想看的记得点个赞,鼓励下我!

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。