Redis管道Pipelining原理详解
请求/响应协议和RTT
Redis是一种基于客户端-服务端模型及请求/响应协议的TCP服务。
这意味着一个请求会遵循以下步骤:
- 客户端向服务端发送一个查询请求,并监听Socket返回,通常以阻塞模式,等待服务端响应
- 服务端处理命令,并将结果返回给客户端。
因此,例如下面是4个命令序列执行情况:
Client: INCR X
Server: 1
Client: INCR X
Server: 2
Client: INCR X
Server: 3
Client: INCR X
Server: 4
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
客户端和服务器通过网络进行连接。该连接可以很快(loopback接口)或很慢(建立一个多次跳转的网络连接)。无论网络如何延迟,数据包总是能从客户端到达服务器,并从服务器返回数据回复客户端。
这个时间被称之为 RTT (Round Trip Time - 往返时间)。当客户端需要在一个批处理中执行多次请求时,这很影响性能(例如添加许多元素到同一个list,或者用很多Keys填充数据库)。如果RTT时间是250ms(在一个很慢的连接下),即使服务器每秒能处理100k的请求数,我们每秒最多也只能处理4个请求。
如果采用loopback接口,RTT就短得多(比如我的主机ping 127.0.0.1只需要44毫秒),但它在一次批量写入操作中仍是一笔巨大开销。还好一种方法可以改善这种情况。
Redis 管道(Pipelining)
一次 请求/响应服务器 能实现处理新的请求,即使旧的请求还未被响应。这样即可将多个命令发送到服务器,而不用等待响应,最后在一个步骤中读取该响应。
这就是管道(pipelining),一种几十年来广泛使用的技术。许多POP3协议支持这个功能,大大加快从服务器下载新邮件的过程。
Redis很早就支持管道(pipelining),因此无论你运行的是什么版本,你都可以使用管道(pipelining)操作Redis。
Pipelining不仅是一种减少往返时间的延迟成本的方法,还大大提高了你在给定的Redis服务器中每秒可执行的总操作量。这是由于以下事实的结果:从访问数据结构和产生响应的角度来看,不使用pipelining,服务每个命令非常廉价,但从执行socket I/O角度来看这非常昂贵。
这涉及到调用read和write的系统调用,这意味着从用户态到内核态。上下文切换是巨大的速度损失。
但当使用Pipelining时,通常使用单个read系统调用读取许多命令,并且通过单个write系统调用传递多个答复。因此,每秒执行的总查询数最初随着较长的管道而几乎呈线性增加,最终达到不使用流水线获得的基准的10倍:
代码案例
在以下基准测试中,我们将使用支持管道的Redis Ruby客户端来测试由于管道带来的速度提高:
$ (printf "PING\r\nPING\r\nPING\r\n"; sleep 1) | nc localhost 6379
+PONG
+PONG
+PONG
- 1
- 2
- 3
- 4
这一次我们没有为每个命令都花费了RTT开销,而是只用了一个命令的开销时间。
非常明确的,用管道顺序操作的第一个例子如下:
Client: INCR X
Client: INCR X
Client: INCR X
Client: INCR X
Server: 1
Server: 2
Server: 3
Server: 4
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
使用管道发送命令时,服务器将被迫回复一个队列答复,占用很多内存。所以,如果你需要发送大量的命令,最好是把他们按照合理数量分批次的处理,例如10K的命令,读回复,然后再发送另一个10k的命令,等等。这样速度几乎是相同的,但是在回复这10k命令队列需要非常大量的内存用来组织返回数据内容。
测试
下面我们会使用Redis Ruby客户端进行一些使用管道和不使用管道的情况,测试管道技术对速度的提升效果:
require 'rubygems'
require 'redis'
def bench(descr) start = Time.now yield puts "#{descr} #{Time.now-start} seconds"
end
def without_pipelining r = Redis.new 10000.times { r.ping }
end
def with_pipelining r = Redis.new r.pipelined { 10000.times { r.ping } }
end
bench("without pipelining") { without_pipelining
}
bench("with pipelining") { with_pipelining
}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
从处于局域网中的Mac OS X系统上执行上面这个简单脚本的数据表明,开启了管道操作后,往返时延已经被改善得相当低了:
without pipelining 1.185238 seconds
with pipelining 0.250783 seconds
- 1
- 2
如你所见,开启管道后,我们的速度效率提升了5倍。
对比 redis 批处理命令,这里的命令互相无任何关系。
管道(Pipelining) VS 脚本(Scripting)
大量 pipeline 应用场景可通过 Redis 脚本(Redis 版本 >= 2.6)得到更高效的处理,后者在服务器端执行大量工作。
脚本的一大优势是可通过最小的延迟读写数据,让读、计算、写等操作变得非常快(pipeline 在这种情况下不能使用,因为客户端在写命令前需要读命令返回的结果)。
应用程序有时可能在 pipeline 中发送 EVAL 或 EVALSHA 命令。Redis 通过 SCRIPT LOAD 命令(保证 EVALSHA 成功被调用)明确支持这种情况。
参考
- https://redis.io/topics/pipelining
文章来源: javaedge.blog.csdn.net,作者:JavaEdge.,版权归原作者所有,如需转载,请联系作者。
原文链接:javaedge.blog.csdn.net/article/details/113726604
- 点赞
- 收藏
- 关注作者
评论(0)