【华为云MySQL技术专栏】MySQL Query Cache使用与实现

举报
GaussDB 数据库 发表于 2025/03/11 10:20:27 2025/03/11
【摘要】 一、背景介绍查询缓存(Query cache,简称QC)是一种数据库优化技术,用于存储查询结果,以便在相同查询再次执行时能够快速返回结果,而无需重新执行查询。MySQL也有QC对应实现,但因其实现存在并发性能差、缓存命中率低等问题,该特性在MySQL 5.7.20标记为不推荐使用,在MySQL 8.0.3里被删除。QC对于特定场景可以显著提升性能,TaurusDB保留QC并对其并发性能进行了...

一、背景介绍

查询缓存(Query cache,简称QC)是一种数据库优化技术,用于存储查询结果,以便在相同查询再次执行时能够快速返回结果,而无需重新执行查询。MySQL也有QC对应实现,但因其实现存在并发性能差、缓存命中率低等问题,该特性在MySQL 5.7.20标记为不推荐使用,在MySQL 8.0.3里被删除。

QC对于特定场景可以显著提升性能,TaurusDB保留QC并对其并发性能进行了优化。本文基于MySQL 8.0.2代码对QC的使用与实现进行分享,介绍TaurusDB如何进行优化。

二、Query Cache使用

在使用QC特性后,MySQL服务端会缓存符合条件的查询与查询结果。

接收查询后,不会立刻解析和执行,而是优先从QC中检索结果返回。

QC是全局的,不同session可以共享QC功能。

 

1 QC缓存、命中流程图

  • QC相关系统参数

相关参数都包含query_cache关键字,用如下SQL查询。

mysql> show variables like '%query_cache%';

1 QC系统参数说明

QC功能开启前提query_cache_type!=offquery_cache_size!=0,具体参数使用见官网说明

  • QC相关统计参数

相关参数都包含Qcache关键字,用如下SQL查询。

2 QC统计参数说明

QC底层是一个内存池,所以包含内存池状态参数。上述参数反应当前QC的使用状态,以供使用者调整优化。如:

1Qcache_hits/(Qcache_hits+Qcache_inserts)可视作缓存命中率,过低说明QC功能对当前业务作用不大,可考虑关闭QC

2Qcache_free_block/Qcache_total_block可视作缓存碎片率,过高可使用flush query cache进行碎片整理或根据业务适当减小query_cache_min_res_unit

三、源码分析

先对QC业务常见场景进行概览,分为以下三种:

第一种,缓存查询,将查询结果存储到 QC 中。

2 内存池状态(1

第二种,查询命中,从 QC 中直接返回查询结果。

3 内存池状态(2

第三种,查询失效。发生影响缓存结果正确性的操作时(如相关表DDLDML),对应缓存失效。

4 内存池状态(3

QC的业务实现和内存池有着密切的关系。为了更好理解QC实现,后文将从内存池设计和QC业务实现两方面进行介绍。需要注意,两者在代码层面不是割离的,都在一个全局对象Query_cache中实现。在设计层面,内存池的方案选择也会受到QC业务影响。

内存池设计

内存池的实现,会先申请一整块连续内存,但在处理申请、释放内存的请求后,整块内存逐渐会被分割为多个内存块(block)。根据内存块是否正在使用,可分为空闲内存块(free block)与非空闲内存块(used block)。

5 内存池变化图

通过图5可以发现,内存池核心接口是内存的申请与释放,并且在内存池使用过程中会出现内存碎片化问题。

那么申请内存时,如何找到内存池中不小于所需大小的空闲块?如何知道各内存块的大小和空闲状态?如果有多个合适的空闲块,如何选择?如果选中的空闲块比申请的大,多余的空间(内部碎片)怎么处理?释放内存时,又该如何处理释放的内存块?

下面将分析QC如何解决上述问题,同时缓解内存的碎片化。

问题一:空闲内存块管理

 

6 内存块抽象图

如图6所示,QC内存池将内存块大小、类型等元信息存储在块头部。用数组(bins)根据块大小对空闲内存块进行管理。

class Query_cache {
  Query_cache_memory_bin *bins;
};

// 一个bin元素维护一条空闲内存块链表,链表有如下特征(设当前数组下标为i):
// 1、链表管理块大小范围在bins[i].size ~ bins[i-1].size之间;
// 2、链表中空闲内存块从小到大有序;
// 3、链表为双向链表,并且头尾相连。
struct Query_cache_memory_bin {
  Query_cache_block *free_blocks; // 空闲内存块链表
  ulong size; // 链表管理块大小范围下限,最小为512B
  uint number; // 当前链表长度 
};

数组长度与成员赋值根据内存池大小经过内部算法确定,算法有如下特征:

7 free block管理

1)数组成员下标越小管理的空闲内存块大小越大。如图7左边所示,bins[0]管理空闲内存块大小大于bin[1]管理的。

2)数组成员下标越大管理的空闲内存块大小范围越小。如图7左边所示,bins[1]管理空闲内存块是5-8M,范围是3M,而bins[3]管理空闲内存块是1-2M,范围是1M)。

考虑到小对象往往会分配更频繁,越可能是性能瓶颈,所以算法会生成更多bin元素对小内存块进行更加细致的管理。

设当前内存池大小为128M,经过一段时间运行后,如图7右边所示(链表首尾相连,图中未画)。

问题二:空闲内存块选择

若申请大小为6M,当前有多个内存块符合申请大小。如图8所示,通常有如下选择策略:

8 内存池物理、逻辑结构

第一种策略,first fit

在物理上进行遍历,返回第一个不小于申请大小free block10M)。此策略寻找空闲内存块时间比较短,但块大小可能超出6M较多,易造成内存碎片。

第二种策略,best fit

best fit返回最小不小于申请大小free block,可利用bins数组查找:

1)根据申请大小找到对应的bin元素(6M对应bins[1])。

2)遍历binfree block链表,因链表有序,返回第一个不小于申请大小的块(8M)。

初看best fit是一个不错的方案,但如果free block链表长度过长,时间会线性增加。因此,QCbest fit基础上进行优化,将第二步的链表遍历修改为:从链表头向后(从小到大)遍历最多5次,若找到符合要求内存块返回,否则从链表尾向前(从大到小)遍历最多5次,返回这五个内存块中最小符合要求的内存块。

问题三:内部碎片处理

若申请8M内存块,但写入数据只有6M,则会出现了2M的内部碎片,如图9所示。若不处理,将影响内存利用率。

9 内部碎片处理

QC的处理方式:如果内部碎片不大于512B不进行处理,否则将内部碎片从内存块中分离,视作新增的free block纳入bins中管理。

问题四:处理释放的内存

内存释放除了需要重置内存块后纳入对应bin管理,还需合并相邻的空闲内存块,以减少内存碎片。

10 内存释放处理

如图10中所示,若释放内存块大小为7M,物理相邻内存块也是空闲,从左到右即为内存池的变化过程。

QC业务设计

关键数据结构

关键数据结构就是前文常提的抽象概念内存块,对应代码中的Query_cache_block

struct Query_cache_block {
  block_type type; // 块类型,主要可分为query\table\result block
  ulong length, used; // 块大小、块已使用大小
  Query_cache_block *pnext,*pprev, // 块物理前后指针
		    *next,*prev; // 块逻辑前后指针,不同块类型有不同使用方式
  int n_tables;	// 块中Query_cache_block_table数组个数
  // 获取第n个Query_cache_block_table
  inline Query_cache_block_table *table(TABLE_COUNTER_TYPE n); 
  inline uchar* data(); // 获取块的data起始地址
  inline Query_cache_query *query(); // 将data以query block方式解析
  inline Query_cache_table *table();// 将data以table block方式解析
  inline Query_cache_result *result();// 将data以result block方式解析
};


11 block内存结构

11中,元信息中Query_cache_block_table数组,作用是维护block之间关联关系,具体用法后文分析。

根据data存储内容不同,block主要被分为三种类型query,table,result block

我们用一个简单SQL的执行作为例子,如查询:select * from t1 join t2 where t1.a = t2.a,来探究一个查询在内存池中对应哪些block

  • query block

12 query block结构图

12中,一个查询对应一个query blockdata记录查询SQL与查询状态(影响输出参数)。

query block中有t1t2Query_cache_block_table链表节点,与t1t2table block关联(table block中解释关联作用)。

Query_cache_query记录元信息,如查询对应的result block指针。

  • table block

13 table,query block关系图

13中,一张表对应一个table blockdata记录数据库名和表名。

table block有Query_cache_block_table链表头节点与相关的query block相连,方便后续通过库表名找到相关query block

  • result block

14 查询结果写入流程图

14中,result blockdata记录MySQL返回客户端的packet内容.

因为packet的发送可能分为多次,所以result block在初次申请内存时,无法确定最终大小,这会导致一个查询可能对应的多个result block的情况,同一个查询的result block之间使用指针维护一个链表。

当查询一对应2result block时,table,query,result block之间对应的关系图如图15所示。

15 tablequeryresult block关系图

QC场景场景实现

16 QC流程图

  • 缓存查询实现

对应图16中,若QC未命中分支,主要有2个步骤:

步骤一,QC存储查询内容。

通过调用Query_cache::store_query,创建query,table block,并维护对应的哈希表和链表。

步骤二,QC存储查询结果。

通过调用query_cache_insert,基于MySQL向客户端返回的packet内容生成result block,可参考查询结果写入流程图(图14)。

  • 缓存命中实现

对应图16中,若QC命中分支,主要有1个步骤,即QC命中判断:在解析前调用Query_cache::send_result_to_client,使用query block哈希表来判断查询是否命中。若命中则直接调用函数net_write_packet,对客户端发送缓存结果。

  • 缓存失效实现

缓存失效场景,相关表发生ddldml、内存池不足导致缓存失效等。参考图15table,,query,result block关系图),dml的缓存失效流程如下:

1)通过库表名在table block的哈希表中找到table block

2) 通过table blockQuery_cache_block_table链表头找到与此表相关query block

3)根据query blockresult block指针,找到对应的result block

4)对上述block进行释放。

其他设计

  • 内存池整理命令

QC提供了命令FLUSH QUERY CACHE,可手动触发内存池空间整理。分为两个步骤:

第一,pack cache,将free block移动到内存池底部。

第二,join result,将属于同一查询的多个result blockresult1.1result1.2)进行合并,此操作将导致内存碎片重新出现,需再进行一次pack cache

17 内存池空间整理

如图17所示,整理后内存池只有1free block,也对result block进行了整合。

  • 并发处理

为了应对MySQL的并发查询,QC内存池需设计并发策略来保证QC业务的正确性。

QC锁。

要求所有对内存池的操作(插入、删除、查询)需提前持有QC锁。其实质是将并发操作序列化,以保证正确性;

查询结果写入持锁优化。

根据图14(查询结果写入流程图),对查询结果写入的持锁范围进行了优化——不需全程持锁,在进行result block写入时持锁即可。

18 写入流程优化

写入流程不需全程持锁,只需对内存池真正操作的 Query_cache::insert函数中持锁即可。但此优化引入一个新问题:如果同时有两个会话进行相同的查询,可能会导致两个线程对查询结果共同写入的情况,造成缓存结果错误。

此优化引入一个新问题:同时有两个会话进行相同查询,造成两个线程对同一查询结果同时写入的情况,造成缓存结果错误。

解决方案:

query block中新增成员变量writer,创建query block时,writer记录线程号,后续result block只能由该线程写入。这样就可以确保每个查询结果,只能由一个线程写入,从而避免缓存结果的错误。

  • 事务场景

1)多语句事务:

单语句事务和多语句事务中,相同查询对应不同的缓存。

-- 查询1进行缓存
select * from t1;
begin;

-- 查询2进行缓存
select * from t1;

2)行锁写锁:

表有行写锁时,不会进行缓存。

begin;
insert into t1 values(1);
-- 不会缓存
select * from t1;

3RC场景:

DML、DDL操作会对相关查询缓存失效,所以,QC中查询缓存都是最新提交的结果,符合读已提交的定义,RC可以正常使用QC特性。

4RR场景:

为了适配RR隔离级别,在表元数据中新增变量(query_cache_inv_id)记录对表的最新操作的事务ID(trx_id)。如果RR事务.trx_id< query_cache_inv_id,则说明该表有当前RR事务看不到的新操作,故该表QC缓存不适用此事务。

-- session 1
begin;
select * from t2; //开启事务1,设trx_id=1
-- session 2
insert into t1 values(1); //t1的query_cache_inv_id设置为当前trx_id(2)
begin;
select * from t1;	//缓存查询
-- session 1
select * from t1; //事务1.trx_id < t1.query_cache_inv_id不走QC

本章对内存池设计和QC业务设计的原理进行了分析,并总结了各自的优缺点。

内存池设计优点:

  1. 利用数组(bins)、链表结构,以内存块大小管理空闲内存,申请内存高效;
  2. 内部碎片及时处理、释放内存时将物理相邻free block合并,自动优化内存池;
  3. 提供FLUSH QUERY CACHE命令可手动触发整理内存池。

内存池设计缺点:

1.内存池大小无法动态调整,调整大小会重新初始化,丢失缓存数据;

2.不支持并发操作内存池,使用QC锁使操作序列化,高并发场景性能下降严重。

查询业务设计优点:

  1. block分类,利用链表、哈希表等结构,简洁实现查询缓存、命中、失效等功能;
  2. 查询结果可分在多个result block存储,提升内存利用率;
  3. 查询结果写入流程中减少QC锁持有的时间,提升性能;
  4. 适配数据库的事务场景,支持RC/RR隔离级别使用。

查询业务设计缺点:

缓存失效方式粗粒度,对表进行任何DML\DDL操作,相关QC都将失效。

四、TaurusDB优化

如上文所示,社区MySQL实现QC内存池不支持并发操作。面对并发查询场景时,性能不仅没有得到优化,反而可能会下降。TaurusDB对此新增了参数query_cache_instances,如表3所示。

3 query_cache_instantces参数说明

该参数可以指定QC内存池个数,将内存池一分为多。QC业务会根据查询的哈希值到指定的内存池进行对应操作,以此减少并发冲突。

为了评估`query_cache_instances` 参数对性能的影响,进行只读场景测试,测试query_cache_instantces参数(011664)在不同并发数下QPS变化。

注:测试环境是笔者开发机,绝对值无参考意义,关注变化趋势。

19 QC性能比较

可以看到,虽然优化原理简单,但是对性能提升是立竿见影的。

五、总结

查询缓存(QC)像一把双刃剑。在读多写少、重复查询多的场景中,QC能显著提升性能。然而,在写多读少的场景中,QC不仅消耗内存资源,还会因为查询缓存和缓存命中判断等额外步骤导致性能下降。

总体来看,QC 是一个使用难度较高的特性。用户需要了解其工作原理,并根据自身业务特点,通过调整相关系统参数、统计参数和优化命令来进行监控与调整。

MySQL 社区版没有解决并发查询性能差的问题,而 TaurusDB 新增的 `query_cache_instances` 参数,则能够在高并发场景下提供更好的性能优化,使用户能够更充分地利用 QC 的优势。

【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。