memcached1.5更好的LRU算法,了解下Maintainer线程

举报
Tom forever 发表于 2019/10/10 10:58:32 2019/10/10
【摘要】 从 Memcached1.5 开始,实现了一个改良的 LRU 算法,也叫做分段 LRU(Segmented LRU)算法,新算法主要是为了更好的利用内容,并提升性能。包括了二个重要的线程,本文先讲解 maintainer 线程,后一篇讲解 crawler 线程。每个 Slab-class 有一个 LRU,每个 LRU 又由四个子 LRU 组成,每个子 LRU 维护独立的锁(mutex loc...

从 Memcached1.5 开始,实现了一个改良的 LRU 算法,也叫做分段 LRU(Segmented LRU)算法,新算法主要是为了更好的利用内容,并提升性能。包括了二个重要的线程,本文先讲解 maintainer 线程,后一篇讲解 crawler 线程。

每个 Slab-class 有一个 LRU,每个 LRU 又由四个子 LRU 组成,每个子 LRU 维护独立的锁(mutex lock),所有的 LRU 由一个独立的线程维护(这和旧的 LRU 算法有很大的不同),称之为 “LRU maintainer” 线程。

每个 item 有一个 flag,存储在其元数据中,标识其活跃程度:

  • FETCHED:如果一个 item 有请求操作,其 flag 等于 FETCHED。

  • ACTIVE:如果一个 item 第二次被请求则会标记为 ACTIVE;当一个 item 发生 bump 或被移动了,flag 会被清空。

  • INACTIVE:不活跃状态。

这四个子 LRU 包含了四个独立的 queue,相关的 queue 可能会迁移到其他的 queue,这么设计就是为了减少 bump 的产生,先看一张图:


861dc180c4d348f09f7618a41282fb35.png

(1)HOT queue:如果一个 item 的过期时间(TTL)很短,会进入该队列,在 HOT queue 中不会发生 bump,如果一个 item 到达了 queue 的 tail,那么会进入到 WARM 队列(如果 item 是 ACTIVE 状态)或者 COLD 队列(如果 item 处于不活跃状态)。

(2)WARM queue:如果一个 item 不是 FETCHED,永远不会进入这个队列,该队列里面的 item TTL 时间相对较长,这个队列的 lock 竞争会很少。该队列 tail 处的一个 item 如果再一次被访问,会 bump 回到 head,否则移动到 COLD 队列。

(3)COLD queue:包含了最不活跃的 item,一旦该队列内存满了,该队列 tail 处的 item 会被 evict。

如果一个 item 被激活了,那么会异步移动到 WARM 队列,如果某个时间段内大量的 COLD item 被激活了,bump 操作可能会处于满负载,这个时候它会什么也不做(不移动到 WARM queue),避免影响工作线程的性能。

(4)TEMP queue:该队列中的 item TTL 通常只有几秒,该列队中的 item 永远不会发生 bump,也不会进入其他队列,节省了 CPU 时间,也避免了 lock 竞争。

HOT 和 WARM LAU queue 有内存使用的限制,而 COLD 和 TEMP 队列没有内存使用限制,这主要是为了避免一些不经常使用的 item 长期占据在相对活跃的队列中。

总结下 LRU Maintainer 线程的任务:

  • 迭代每个子 LRU(每个 Slab-class 有4个),然后查看 tail 部的 item。

  • 查看每个子 LRU 的内存限制,必要的时候移出一些。

  • 回收 tail 部的过期 item(更多的回收由 LRU Crawler 线程处理,后面会说)。

  • 异步处理 COLD queue 的 bump 操作(会产生锁)。

除了让内存使用更有效,分段 LRU 还有一些好处:

  • 直接 get 的时候不会产生 bump,这对于工作线程的扩展性有好处,而且也不会产生 lock 等待。

  • bump 操作都是异步发生的。

  • 写操作扩展性更好,比如不会不会在 set 的时候产生内存回收操作。

  • 每个 item 的元数据不会变多,

从 memcached1.5开始,分段 LRU 机制默认是启用的,如果想显式启用,可以运行下列两个命令中的任意一个:

$ ./memcached -o modern

$ ./memcached -o lru_maintainer

如果 memcached 是 1.4 版本,也可以使用下列命令启动:

$ ./memcached -o modern

在 memcached 运行的时候,也可以通过内部命令动态调整 LRU 算法,比如:

# 使用传统的 LRU 算法 
$ lru mode flat 

# 使用分段 LRU 算法 
$ lru mode segmented

如果采用分段 LRU 算法,还有更多的子命令参数可以使用:

$ lru tune 10 25 0.1 2.0

其中 10 表示 hot 队列的内存占比不能超过 10%,WARM 队列的内存占比不能超过 25%, HOT 队列 tail age 大于 COLD 队列 tail age 的 10%,WARM 队列的 tail age 是 COLD 队列 tail age 的 2 倍。

至于这些参数的作用,引用下面的解释(更容易理解):

HOT and WARM LRU’s are limited in size primarily by percentage of memory used, while COLD and TEMP are unlimited. HOT and WARM have a secondary tail age limit, relative to the age of the tail of COLD. This prevents very idle items from persisting in the active queues needlessly.

另外一个配置:

$ lru temp_ttl ttl

如果 ttl 值小于0,表示禁用 TEMP queue;如果大于 0,那么过期时间小于 TTL 的 item 就会进入 TEMP queue,而且除非 item 过期或删除,否则不会离开该队列。

可以通过 stats settings 了解更多分段 LRU 的设置:

参数说明
lru_maintainer_thread是否启用 maintainer 线程
lru_segmented是否启用 分段 LRU
hot_lru_pctHOT LRU 占所有 LRU 内存的百分比
warm_lru_pctWARM LRU 占所有 LRU 内存的百分比
hot_max_factorHOT 队列 tail age 大于 COLD 队列 tail age 的值
warm_max_factorWARM 队列 tail age 大于 COLD 队列 tail age 的值
temp_lru是否启用 TEMP LRU
temporary_ttl小于该值的 item 进入 TEMP LRU

可以通过 stats 命令了解分段 LRU 的运行数据:

参数说明
moves_to_cold从 HOT/WARM 移动到 COLD 的 item 个数
moves_to_warm从 COLD 移动到 WARM 的 item 个数
moves_within_lruHOT or WARM 交换的个数

也可以输入 stats item 了解详细的分段 LRU 运行数据:

参数说明
number_hot目前在 HOT LRU 中的 item 个数
number_warm目前在 WARM LRU 中的 item 个数
number_cold目前在 COLD LRU 中的 item 个数
number_temp目前在 TEMP LRU 中的 item 个数
age_hotHOT LRU 中最老 item 的时间
age_warmWARM LRU 中最老 item 的时间
ageLRU 中最老 item 的时间

【g z h:yudadanwx】


本文转载自异步社区。

文链接:https://www.epubit.com/articleDetails?id=N515e0dce-31c6-4bd6-bdfe-d301381a6f09


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。