- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

华为云MySQL新增“逻辑预读”特性，高效提升分析型业务的执行效率

GaussDB数据库发表于 2019/12/02 10:26:15 2019/12/02

【摘要】无需重建表，轻松解决线性预读失效难题

随着用户对数据访问速度的日益重视，MySQL数据库在最初的设计中，采用了线性预读的方式，提前将即将使用的数据预读到Buffer pool中，来提升数据的访问速度，但在实际使用过程中，线性预读失效的问题愈来愈突出。

对于存在时间比较长，变更又比较频繁的表，除非我们对于这张表进行重建，否则该表会存在大量的数据碎片，导致数据存放不连续，这样会使MySQL原有的线性预读功能失效，导致某些查询语句变很慢，如：全表扫描，范围扫描等。

线性预读存在的问题

频繁变更操作会破坏数据的连续性

一般情况下，当我们在数据存放连续时执行全表扫描，数据库就会异步地把这些数据从磁盘加载到Buffer pool，从而提高数据库的处理速度。比如当我们访问了Row A1，Row A2，Row A3时，数据库会认为你下次有极大的概率去访问Row A4，Row A5，Row A6，从而自动异步地把这些数据加载到Buffer pool中。

但如果在这张表上频繁地执行变更操作，则会破坏数据的连续性。在我们访问Row A1，Row A2，Row A3时，数据库发现这三行数据并不连续，所以数据库不会提前将Row A5，Row A6从磁盘异步地加载到Buffer pool，只能一个一个的去请求、加载，从而影响访问效率。数据连续时，访问500w Row数据需要12s，但是数据不连续时，访问500w Row数据需要34s。

对于在线应用来说，重建表会产生较大的运维风险，数据面临丢失的可能。那到底有没有什么特性可以在不重建表的情况下，弥补线性预读失效的问题呢？

线性预读的失效催生出“逻辑预读”特性

华为云RDS数据库服务，新开发了“逻辑预读”特性，在不重建表的情况下，弥补线性预读失效的问题，从而提高分析型业务的执行效率。

“逻辑预读”特性，在预读数据的时候，首先通过对要预读的数据的页号进行排序，去除数据不连续的影响，然后合并相邻数据页的IO请求，减少磁盘IO的总请求次数，从而提高数据预读的命中率和效率。

华为云数据库团队做了一个测试：采用8核16GB 100GB SSD规格的Linux机器，测试2.4GB大小500w Rows存在碎片的数据，执行select *from tablename（全表扫描查询），结果如下：

由此可见，相比开源版本，华为云MySQL逻辑预读特性大大缩短了访问时长，极大提升了执行效率，为分析型业务的进一步发展注入了新动力。

每一个改变都是为了更好的服务客户，华为云MySQL逻辑预读特性的推出，不仅很好地弥补了线性预读的失效问题，提升了分析型业务的执行效率，更是为客户的业务场景保驾护航，助力其创新发展，实现更多价值。

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

华为云MySQL新增“逻辑预读”特性，高效提升分析型业务的执行效率

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

华为云MySQL新增“逻辑预读”特性，高效提升分析型业务的执行效率

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品