- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

MySQL怎样处理排序⭐️如何优化需要排序的查询？

菜菜的后端私房菜发表于 2024/05/11 15:15:16 2024/05/11

【摘要】在MySQL的查询中常常会用到 order by 和 group by 这两个关键字，它们的相同点是都会对字段进行排序，那查询语句中的排序是如何实现的呢？

前言

在MySQL的查询中常常会用到 order by 和 group by 这两个关键字

它们的相同点是都会对字段进行排序，那查询语句中的排序是如何实现的呢？

当使用的查询语句需要进行排序时有两种处理情况：

当前记录本来就是有序的，不需要进行排序
当前记录未保持顺序，需要排序

使用索引保证有序

对于第一种情况，常常是使用二级索引中索引列的有序来保证结果集有序，从而不需要进行排序

对于表a，为a2建立二级索引，那么在二级索引上a2就是有序的

 CREATE TABLE `a` (
   `a1` int(11) NOT NULL AUTO_INCREMENT,
   `a2` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL,
   `a3` varchar(255) DEFAULT NULL,
   PRIMARY KEY (`a1`),
   KEY `idx_a2` (`a2`)
 ) ENGINE=InnoDB AUTO_INCREMENT=76 DEFAULT CHARSET=utf8;

select * from a order by a.a2 limit 10

当优化器选择使用a2索引时，a2列的记录本身就是有序的，因此不需要再使用其他开销进行排序

当然，优化器也有可能不使用a2索引（当优化器认为使用a2回表开销太大时会使用全表扫描）

当优化器使用的索引上a2无序时，则会通过其他手段对结果进行排序

filesort

当执行计划的Extra附加信息中出现 Using filesort 时，会使用sort_buffer对结果进行排序

sort_buffer是一块用于排序的内存，sort_buffer可能存放查询需要的所有字段，也可能只存放需要排序的字段和主键

show variables like 'max_length_for_sort_data'

当查询需要的字段长度小于 max_length_for_sort_data 时，则会将查询需要的所有字段放入sort_buffer中，然后对需要排序的列进行排序，最后返回结果

当查询需要的字段长度大于 max_length_for_sort_data 时，只会将需要排序的字段和主键值放入sort_buffer中，等到排序后再去查询聚簇索引获取需要查询的列（相当于又多了一次回表）

在sort_buffer中进行排序时，如果内存足够则会在内存中进行排序，如果内存不够则会使用磁盘的临时文件来辅助排序

开启 optimizer_trace 可以查看是否使用临时文件辅助排序

 #开启优化器追踪
 SET optimizer_trace='enabled=on'; 
 
 #sql语句
 select * from student order by student_name limit 10000;
 
 #查看优化器追踪的信息
 SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G;

排序使用的算法是归并算法，先分割成多个小文件排序再进行合并

其中number_of_tmp_files 为使用到的临时文件数量，sort_buffer_size 为sort_buffer大小

因此当使用order by、group by等需要排序的关键字时，最好建立合适的索引

如果数据量小可以在sort buffer中排序，如果数据量太大还需要与磁盘交互

总结

当查询语句需要排序时会分为不用排序和需要排序两种情况

当使用的索引有序时则不用再进行排序，通过索引来保证有序

当使用的索引无序时则会使用sort_buffer进行排序，当查询字段的长度未超过限制时，sort_buffer中每条记录会存储需要查询的列

如果超过限制，则sort_buffer只会存储需要排序的列和主键值，排序后再通过主键值进行回表获取需要查询的列

当数据量太大不够在内存中排序完，会使用磁盘页辅助排序，使用归并算法将排序数据分散在多个页再合并

可以通过追踪优化器 optimizer_trace 分析内容查看辅助页的数量等信息

为需要排序的列建立合适的索引，避免使用磁盘页辅助排序

当无法使用索引时可以调整sort buffer 或 max_length_for_sort_data（谨慎）

最后（不要白嫖，一键三连求求拉~）

本篇文章被收入专栏由点到线，由线到面，构建MySQL知识体系，感兴趣的同学可以持续关注喔

本篇文章笔记以及案例被收入 gitee-StudyJava、 github-StudyJava 感兴趣的同学可以stat下持续关注喔~

有什么问题可以在评论区交流，如果觉得菜菜写的不错，可以点赞、关注、收藏支持一下~

关注菜菜，分享更多干货，公众号：菜菜的后端私房菜

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

MySQL怎样处理排序⭐️如何优化需要排序的查询？