Redis管道Pipelining原理详解

举报
JavaEdge 发表于 2021/06/04 00:20:33 2021/06/04
【摘要】 请求/响应协议和RTT Redis是一种基于客户端-服务端模型及请求/响应协议的TCP服务。 这意味着一个请求会遵循以下步骤: 客户端向服务端发送一个查询请求,并监听Socket返回,通常以阻塞模式,等待服务端响应服务端处理命令,并将结果返回给客户端。 因此,例如下面是4个命令序列执行情况: Client: INCR X Server: 1 Client: IN...

请求/响应协议和RTT

Redis是一种基于客户端-服务端模型及请求/响应协议的TCP服务。
这意味着一个请求会遵循以下步骤:

  • 客户端向服务端发送一个查询请求,并监听Socket返回,通常以阻塞模式,等待服务端响应
  • 服务端处理命令,并将结果返回给客户端。

因此,例如下面是4个命令序列执行情况:

Client: INCR X
Server: 1
Client: INCR X
Server: 2
Client: INCR X
Server: 3
Client: INCR X
Server: 4

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

客户端和服务器通过网络进行连接。该连接可以很快(loopback接口)或很慢(建立一个多次跳转的网络连接)。无论网络如何延迟,数据包总是能从客户端到达服务器,并从服务器返回数据回复客户端。

这个时间被称之为 RTT (Round Trip Time - 往返时间)。当客户端需要在一个批处理中执行多次请求时,这很影响性能(例如添加许多元素到同一个list,或者用很多Keys填充数据库)。如果RTT时间是250ms(在一个很慢的连接下),即使服务器每秒能处理100k的请求数,我们每秒最多也只能处理4个请求。

如果采用loopback接口,RTT就短得多(比如我的主机ping 127.0.0.1只需要44毫秒),但它在一次批量写入操作中仍是一笔巨大开销。还好一种方法可以改善这种情况。

Redis 管道(Pipelining)

一次 请求/响应服务器 能实现处理新的请求,即使旧的请求还未被响应。这样即可将多个命令发送到服务器,而不用等待响应,最后在一个步骤中读取该响应。

这就是管道(pipelining),一种几十年来广泛使用的技术。许多POP3协议支持这个功能,大大加快从服务器下载新邮件的过程。

Redis很早就支持管道(pipelining),因此无论你运行的是什么版本,你都可以使用管道(pipelining)操作Redis。

Pipelining不仅是一种减少往返时间的延迟成本的方法,还大大提高了你在给定的Redis服务器中每秒可执行的总操作量。这是由于以下事实的结果:从访问数据结构和产生响应的角度来看,不使用pipelining,服务每个命令非常廉价,但从执行socket I/O角度来看这非常昂贵。
这涉及到调用read和write的系统调用,这意味着从用户态到内核态。上下文切换是巨大的速度损失。

但当使用Pipelining时,通常使用单个read系统调用读取许多命令,并且通过单个write系统调用传递多个答复。因此,每秒执行的总查询数最初随着较长的管道而几乎呈线性增加,最终达到不使用流水线获得的基准的10倍:

代码案例

在以下基准测试中,我们将使用支持管道的Redis Ruby客户端来测试由于管道带来的速度提高:

$ (printf "PING\r\nPING\r\nPING\r\n"; sleep 1) | nc localhost 6379
+PONG
+PONG
+PONG

  
 
  • 1
  • 2
  • 3
  • 4

这一次我们没有为每个命令都花费了RTT开销,而是只用了一个命令的开销时间。

非常明确的,用管道顺序操作的第一个例子如下:

Client: INCR X
Client: INCR X
Client: INCR X
Client: INCR X
Server: 1
Server: 2
Server: 3
Server: 4

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

使用管道发送命令时,服务器将被迫回复一个队列答复,占用很多内存。所以,如果你需要发送大量的命令,最好是把他们按照合理数量分批次的处理,例如10K的命令,读回复,然后再发送另一个10k的命令,等等。这样速度几乎是相同的,但是在回复这10k命令队列需要非常大量的内存用来组织返回数据内容。

测试

下面我们会使用Redis Ruby客户端进行一些使用管道和不使用管道的情况,测试管道技术对速度的提升效果:

require 'rubygems'
require 'redis'

def bench(descr) start = Time.now yield puts "#{descr} #{Time.now-start} seconds"
end

def without_pipelining r = Redis.new 10000.times { r.ping }
end

def with_pipelining r = Redis.new r.pipelined { 10000.times { r.ping } }
end

bench("without pipelining") { without_pipelining
}
bench("with pipelining") { with_pipelining
}

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

从处于局域网中的Mac OS X系统上执行上面这个简单脚本的数据表明,开启了管道操作后,往返时延已经被改善得相当低了:

without pipelining 1.185238 seconds
with pipelining 0.250783 seconds

  
 
  • 1
  • 2

如你所见,开启管道后,我们的速度效率提升了5倍。

对比 redis 批处理命令,这里的命令互相无任何关系。

管道(Pipelining) VS 脚本(Scripting)

大量 pipeline 应用场景可通过 Redis 脚本(Redis 版本 >= 2.6)得到更高效的处理,后者在服务器端执行大量工作。
脚本的一大优势是可通过最小的延迟读写数据,让读、计算、写等操作变得非常快(pipeline 在这种情况下不能使用,因为客户端在写命令前需要读命令返回的结果)。

应用程序有时可能在 pipeline 中发送 EVAL 或 EVALSHA 命令。Redis 通过 SCRIPT LOAD 命令(保证 EVALSHA 成功被调用)明确支持这种情况。

参考

  • https://redis.io/topics/pipelining

文章来源: javaedge.blog.csdn.net,作者:JavaEdge.,版权归原作者所有,如需转载,请联系作者。

原文链接:javaedge.blog.csdn.net/article/details/113726604

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。