【Linux系统编程】深入剖析:四大IO模型机制与应用(阻塞、非阻塞、多路复用、信号驱动IO 全解读)
目录
10.1.3 epoll超时检测 -epoll也可以实现超时时间检测
概述:
在Linux环境下,主要存在四种IO模型,它们分别是阻塞IO(Blocking IO)、非阻塞IO(Non-blocking IO)、IO多路复用(I/O Multiplexing)和异步IO(Asynchronous IO)。下面我将逐一介绍这些模型的定义:
1. 阻塞IO (Blocking IO)
阻塞IO是最传统的IO模型。当一个进程发起一个IO请求时,比如读或写操作,如果数据尚未准备好(例如在读操作中,数据尚未到达),那么这个进程会被挂起,直到数据准备好为止。这意味着进程在此期间不能做任何其他事情,直到IO操作完成。这是由于在内核态和用户态之间的切换,内核必须完成IO操作并将控制权交回给用户态的应用程序。
2. 非阻塞IO (Non-blocking IO)
非阻塞IO与阻塞IO的主要区别在于,当IO操作未完成时,进程不会被挂起。相反,如果数据尚未准备好,系统调用会立即返回一个错误。这允许应用程序检查错误并立即进行下一次尝试,而不是等待数据准备好。然而,这通常意味着应用程序需要不断轮询,直到数据可用,这可能会导致不必要的CPU使用。
3. IO多路复用 (I/O Multiplexing)
IO多路复用模型允许一个单一的进程同时监听多个文件描述符(如网络套接字)的IO事件。当其中一个文件描述符准备好进行IO操作时,应用程序会被通知。这通常通过select()
, poll()
, 或 epoll()
等系统调用来实现。这些函数会阻塞,直到至少有一个文件描述符准备好,然后返回,允许应用程序处理那些已经准备好的描述符。这种方式大大提高了处理多个并发连接的效率。
4. 信号驱动IO (Signal-driven IO)
信号驱动IO是一种异步IO机制,它允许应用程序在数据准备好时通过信号通知来处理IO事件。这种模型特别适合于多路复用场景,尤其是当处理大量并发连接时。
阻塞式IO
- 特点:最简单,最常用,但是效率低。
- 当前学习函数:
- 读阻塞:
read
,recv
,recvfrom
- 写阻塞:
write
,send
,accept
,connect
TCP: 有链接 : 有发送缓存区,有接收缓存区
UDP: 无连接 : 没有发送缓存区,但是有接受缓存区 (不会出现TCP粘包)
- 读阻塞:
非阻塞式IO
- 特点:避免了长时间等待,但可能频繁检查资源状态,浪费CPU资源。
信号驱动IO(Signal-driven IO)
- 特点:
异步通知模式, 需要底层驱动的支持
信号IO实例:
操作鼠标设备,当有输入的时候获取输入数据,没有输入时循环输出hello world。
IO多路复用 (I/O Multiplexing)
头文件
C
声明
C
功能
select
函数用于监测一组文件描述符的IO事件,直到其中一个或多个描述符就绪或超时为止。
参数
nfds
:最大的文件描述符加一,即监测的最大文件描述符数量。readfds
:读就绪描述符集。writefds
:写就绪描述符集(可为NULL)。exceptfds
:异常就绪描述符集(可为NULL)。timeout
:超时时间,为NULL则无限期阻塞等待。
返回值
<0
:错误。>0
:有事件产生。==0
:超时。
超时时间结构体
C
Select宏函数
FD_CLR(fd, set)
: 清除描述符fd
在集合set
中的状态。FD_ISSET(fd, set)
: 判断fd
是否在set
集合中产生事件。FD_SET(fd, set)
: 将fd
加入到集合set
中。FD_ZERO(set)
: 清空集合set
。
基本流程
- 构建文件描述符集合。
- 清空集合。
- 添加关心的文件描述符。
- 调用
select
。 - 检查产生事件的文件描述符。
- 执行相应的逻辑处理。
Select的特点与限制
- 最多监听1024个文件描述符(千级别)。
- 被唤醒后需重新轮询所有描述符,效率较低。
- 每次调用
select
会清空描述符集合,需频繁拷贝用户空间到内核空间,效率低下。
规则
- 监测范围通常为0至1023。
- 标准输入、输出、错误分别占据0、1、2三个文件描述符。
- 最大监测文件描述符数量为
fd+1
。 - 事件产生时,对应描述符在集合中会被置1,未产生事件的置0。
select
调用后会清空集合,需在调用前备份集合以优化性能。
select实例:
同时检测键盘输入和sockfd事件 -TCP实现同时连接多个客户端
Poll函数详解
特点
- 动态文件描述符个数:根据
poll
函数的第一个参数确定,提供了比select
更灵活的文件描述符数量控制。 - 轮询效率:虽然被唤醒后仍需遍历所有描述符,但无需像
select
那样每次调用都重建或清空文件描述符集合,仅需一次从用户空间到内核空间的数据拷贝,效率相对较高。
流程
- 创建
pollfd
结构体数组。 - 配置每个结构体的文件描述符及其关注的事件。
- 记录数组中最后一个有效元素的下标。
- 调用
poll
函数进行事件监测。 - 遍历数组,检查哪些文件描述符产生了事件。
- 根据触发的事件执行相应的处理逻辑。
声明与头文件
C
功能
poll
函数用于监视并等待多个文件描述符的属性变化,直到其中一个或多个描述符就绪或超时为止。
参数
fds
:关心的文件描述符数组。nfds
:数组中有效元素的数量。timeout
:超时时间(毫秒)。-1为无限期阻塞,0为非阻塞。
结构体pollfd
C
返回值
<0
:错误。>0
:有事件产生。==0
:超时时间已到。
优势与局限
- 优势:不受1024文件描述符限制,无需每次调用都重设或清空集合,提高了处理大量描述符的效率。
- 局限:被唤醒后仍需遍历所有描述符,可能在高并发场景下影响性能。
Poll 实例:
epoll:高效事件驱动的I/O模型
特点对比
- select 和 poll:同步轮询模型,逐一检查所有文件描述符的就绪状态。
- epoll:异步事件驱动模型,基于事件的触发机制,只处理真正就绪的文件描述符,极大提升了效率。
epoll机制概览
- 红黑树:用于高效管理大量文件描述符,每个节点是一个文件描述符及其相关属性。
- 链表:事件链表,当文件描述符上的事件发生时,通过回调机制将其添加到链表中,供后续处理。
epoll的使用步骤
- 创建epoll实例(红黑树的根节点)。
- 注册、修改或删除文件描述符及事件监听。
- 阻塞等待事件,一旦有事件产生,进行处理。
函数接口
epoll_create
C
- 功能:创建epoll实例,即红黑树的根节点。
- 返回值:成功返回epoll文件描述符,失败返回-1。
epoll_ctl
C
- 功能:控制epoll实例,包括添加、修改和删除文件描述符的监听事件。
- 参数:
epfd
:epoll文件描述符。op
:操作类型。fd
:目标文件描述符。event
:事件结构体。
- 返回值:成功返回0,失败返回-1。
epoll_wait
C
- 功能:等待并获取就绪事件。
- 参数:
epfd
:epoll文件描述符。events
:事件集合,用于接收就绪事件。maxevents
:单次调用最多返回的事件数量。timeout
:超时时间(毫秒)。
- 返回值:成功返回实际发生的事件数量,失败返回-1。
注意事项
- epoll的效率远高于select和poll,尤其在处理大量并发连接时。
- epoll的文件描述符上限受系统限制,一般远大于1024,可达数十万。
- epoll的事件处理机制使得它非常适合构建高并发的网络服务器。
epoll 实例:
三者的特点以及区别
网络超时检测
使用网络超时事件检测的原因:
1) 避免进程在没有数据时无限制的阻塞。
2)当设定的时间到, 进程从原操作进行返回,然后继续执行
10.1 函数的参数可以设置超时
10.1.1 select 超时检测
10.1.2 poll超时检
10.1.3 epoll超时检测 -epoll也可以实现超时时间检测
10.2 setsockopt 设置套接字属性
10.2.1 socket属性
选项名称 |
说明 |
数据类型 |
========= SOL_SOCKET 应用层 ========== |
||
SO_BROADCAST |
允许发送广播数据 |
int |
SO_DEBUG |
允许调试 |
int |
SO_DONTROUTE |
不查找路由 |
int |
SO_ERROR |
获得套接字错误 |
int |
SO_KEEPALIVE |
保持连接 |
int |
SO_LINGER |
延迟关闭连接 |
struct linger |
SO_OOBINLINE |
带外数据放入正常数据流 |
int |
SO_RCVBUF |
接收缓冲区大小 |
int |
SO_SNDBUF |
发送缓冲区大小 |
int |
SO_RCVLOWAT |
接收缓冲区下限 |
int |
SO_SNDLOWAT |
发送缓冲区下限 |
int |
SO_RCVTIMEO |
接收超时 |
struct timeval |
SO_SNDTIMEO |
发送超时 |
struct timeval |
SO_REUSEADDR |
允许重用本地地址和端口 |
int |
SO_TYPE |
获得套接字类型 |
int |
SO_BSDCOMPAT |
与BSD系统兼容 |
int |
========== IPPROTO_IP IP层/网络层 ========== |
||
IP_HDRINCL |
在数据包中包含IP首部 |
int |
IP_OPTINOS |
IP首部选项 |
int |
IP_TOS |
服务类型 |
int |
IP_TTL |
生存时间 |
int |
IP_ADD_MEMBERSHIP |
将指定的IP加入多播组 |
struct ip_mreq |
============ IPPRO_TCP 传输层 ============== |
||
TCP_MAXSEG |
TCP最大数据段的大小 |
int |
TCP_NODELAY |
不使用Nagle算法 |
int |
10.3.1 sigaction 修改信号的行为
- 点赞
- 收藏
- 关注作者
评论(0)