一文讲透TCP三次握手到底怎么实现的

举报
JavaEdge 发表于 2021/06/04 01:12:09 2021/06/04
【摘要】 怎么使用这些套接字格式完成连接的建立? 1 服务端准备连接 1.1 创建套接字 要创建一个可用的套接字,需要使用下面的函数: int socket(int domain, int type, int protocol) 1 domain PF_INET、PF_INET6以及PF_LOCAL等,即套接字类型type SOCK_STREAM 字节流,对应TCP;S...

怎么使用这些套接字格式完成连接的建立?

1 服务端准备连接

1.1 创建套接字

要创建一个可用的套接字,需要使用下面的函数:

int socket(int domain, int type, int protocol)

  
 
  • 1
  • domain
    PF_INET、PF_INET6以及PF_LOCAL等,即套接字类型
  • type
    • SOCK_STREAM
      字节流,对应TCP;
    • SOCK_DGRAM
      数据报,对应UDP;
    • SOCK_RAW
      原始套接字。
  • protocol
    原本用来指定通信协议,但现在基本废弃。因为通过前面两个参数已经指定协议。所以protocol一般写成0即可。

1.2 bind

创建的socket如果需要被使用,就需要调用bind函数把socket和socket地址绑定。

调用bind函数的方式如下:

bind(int fd, sockaddr * addr, socklen_t len)

  
 
  • 1
  • sockaddr * addr
    通用地址格式,传入的参数可能是IPv4、IPv6或本地socket格式。
  • len
    传入的地址长度,bind函数会根据该字段判断传入的参数addr怎么解析。

可以把bind函数理解成这样:

bind(int fd, void * addr, socklen_t len)

  
 
  • 1

不过BSD设计socket的时候大约是1982年,那时C语言还没void *语法,为解决该问题,BSD的设计者们创造性地设计了通用地址格式来作为支持bind和accept等这些函数的参数。

对于使用者,每次需将IPv4、IPv6或本地socket格式转化为通用socket格式,就像下面的IPv4 socket地址格式:

struct sockaddr_in name;
bind (sock, (struct sockaddr *) &name, sizeof (name)

  
 
  • 1
  • 2

对实现者,可根据该地址结构的前两个字节判断出是哪种地址。为处理可变长结构,需要读取函数里的len参数,即可解析和判断地址。

设置bind时,对地址和端口可以有多种处理方式。
可将地址设置成本机IP地址,等于告诉os内核,仅处理目标IP是本机IP地址的IP包。
但我们写代码时并不知道将会被部署到啥机器,通配地址解决该问题,告诉os内核只要目标地址是咱们的都可以。比如一台机器有两块网卡,IP地址分别是202.61.22.55和192.168.1.11,那么向这两个IP请求的请求包都会被我们的程序处理。

配置通配地址

  • IPv4,使用INADDR_ANY
  • IPv6,使用IN6ADDR_ANY
struct sockaddr_in name;
/* IPV4通配地址 */
name.sin_addr.s_addr = htonl (INADDR_ANY);

  
 
  • 1
  • 2
  • 3

端口

如果把端口设置成0,就相当于把端口的选择权交给内核,内核会根据一定的算法选择一个空闲的端口,完成套接字的绑定。这在服务器端不常使用。

一般来说,服务器端的程序一定要绑定到一个众所周知的端口上。服务器端的IP地址和端口数据,相当于打电话拨号时需要知道的对方号码,如果没有电话号码,就没有办法和对方建立连接。

我们来看一个初始化IPv4 TCP 套接字的例子:

#include <stdio.h>
#include <stdlib.h>
#include <sys/socket.h>
#include <netinet/in.h>


int make_socket (uint16_t port)
{
  int sock;
  struct sockaddr_in name; /* 创建字节流类型的IPV4 socket. */
  sock = socket (PF_INET, SOCK_STREAM, 0);
  if (sock < 0) { perror ("socket"); exit (EXIT_FAILURE); } /* 绑定到port和ip. */
  name.sin_family = AF_INET; /* IPV4 */
  name.sin_port = htons (port);  /* 指定端口 */
  name.sin_addr.s_addr = htonl (INADDR_ANY); /* 通配地址 */
  /* 把IPV4地址转换成通用地址格式,同时传递长度 */
  if (bind (sock, (struct sockaddr *) &name, sizeof (name)) < 0) { perror ("bind"); exit (EXIT_FAILURE); } return sock
}

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35

listen:接上电话线,一切准备就绪。

bind函数只是让socket和地址关联。如果要让别人打通电话,还需要我们把电话设备接入电话线,让服务器真正处于可接听状态,这就需要listen函数。

初始化创建的socket,之后会主动发起请求(通过调用connect函数)。通过listen函数,可以将原来的"主动"socket转换为"被动"socket,告诉操作系统内核:“我这个socket是用来等待用户请求的。”当然,操作系统内核会为此做好接收用户请求的一切准备,比如完成连接队列。

listen函数原型:

int listen (int socketfd, int backlog)

  
 
  • 1
  • socketfd
    socket描述符
  • backlog
    未完成连接队列的大小,即可以接收的并发数目。越大,并发数理论上越大。但参数过大也会占用过多系统资源,所以Linux并不允许对这个参数进行改变。

accept

当客户端的连接请求到达时,服务器端应答成功,连接建立,这时内核需把该事件通知到应用程序,让应用程序感知到这个连接。

accept这个函数的作用就是连接建立之后,内核和应用程序之间的桥梁。它的原型是:

int accept(int listensockfd, struct sockaddr *cliaddr, socklen_t *addrlen)

  
 
  • 1
  • listensockfd
    套接字,通过bind,listen一系列操作而得到的套接字。返回值有两部分,cliadd是通过指针方式获取的客户端的地址,addrlen地址的大小
    函数的返回值,代表与客户端的连接。

两个socket描述字:

  • 输入参数,监听socket描述字listensockfd
  • 返回的已连接socket描述字

为什么要把两个套接字分开呢?
网络程序需要并发处理,不可能一个应用程序运行后只能服务一个客户。

所以监听socket一直都存在,服务成千上万的客户,直到这个监听socket关闭。一旦一个客户和服务器连接成功,完成了TCP三次握手,操作系统内核就为这个客户生成一个已连接套接字,让应用服务器使用这个已连接套接字和客户进行通信处理。如果应用服务器完成了对这个客户的服务,比如一次网购下单,一次付款成功,那么关闭的就是已连接套接字,这样就完成了TCP连接的释放。请注意,这个时候释放的只是这一个客户连接,其它被服务的客户连接可能还存在。最重要的是,监听套接字一直都处于“监听”状态,等待新的客户请求到达并服务。

客户端发起连接的过程

第一步建立一个套接字,不一样的是客户端需要调用connect发起请求。

connect

客户端和服务器端的连接建立,是通过connect函数完成的。这是connect的构建函数:

int connect(int sockfd, const struct sockaddr *servaddr, socklen_t addrlen)

  
 
  • 1
  • 2
  • 3
  • sockfd
    连接套接字,通过前面讲述的socket函数创建
  • servaddr、addrlen
    指向套接字地址结构的指针和该结构的大小。
    套接字地址结构必须含有服务器的IP地址和端口号。

客户在调用函数connect前不必非得调用bind函数,如果需要,内核会确定源IP地址,并选择一个临时端口作为源端口。

如果是TCP套接字,那么调用connect函数将激发TCP的三次握手过程,而且仅在连接建立成功或出错时才返回。其中出错返回可能有以下几种情况:

三次握手无法建立,客户端发出的SYN包没有任何响应,于是返回TIMEOUT错误。这种情况比较常见的原因是对应的服务端IP写错。
客户端收到了RST(复位)回答,这时候客户端会立即返回CONNECTION REFUSED错误。这种情况比较常见于客户端发送连接请求时的请求端口写错,因为RST是TCP在发生错误时发送的一种TCP分节。产生RST的三个条件是:目的地为某端口的SYN到达,然而该端口上没有正在监听的服务器(如前所述);TCP想取消一个已有连接;TCP接收到一个根本不存在的连接上的分节。
客户发出的SYN包在网络上引起了"destination unreachable",即目的不可达的错误。这种情况比较常见的原因是客户端和服务器端路由不通。
根据不同的返回值,我们可以做进一步的排查。

著名的TCP三次握手: 这一次不用背记

你在各个场合都会了解到著名的TCP三次握手,可能还会被要求背下三次握手整个过程,但背后的原理和过程可能未必真正理解。我们刚刚学习了服务端和客户端连接的主要函数,下面结合这些函数讲解一下TCP三次握手的过程。这样我相信你不用背,也能根据理解轻松掌握这部分的知识。

这里我们使用的网络编程模型都是阻塞式的。所谓阻塞式,就是调用发起后不会直接返回,由操作系统内核处理之后才会返回。 相对的,还有一种叫做非阻塞式的,我们在后面的章节里会讲到。

TCP三次握手

服务器端通过socket,bind和listen完成了被动套接字的准备工作,被动的意思就是等着别人来连接,然后调用accept,就会阻塞在这里,等待客户端的连接来临;客户端通过调用socket和connect函数之后,也会阻塞。接下来的事情是由操作系统内核完成的,更具体一点的说,是操作系统内核网络协议栈在工作。

客户端的协议栈向服务器端发送了SYN包,并告诉服务器端当前发送序列号j,客户端进入SYNC_SENT状态;
服务器端的协议栈收到这个包之后,和客户端进行ACK应答,应答的值为j+1,表示对SYN包j的确认,同时服务器也发送一个SYN包,告诉客户端当前我的发送序列号为k,服务器端进入SYNC_RCVD状态;
客户端协议栈收到ACK之后,使得应用程序从connect调用返回,表示客户端到服务器端的单向连接建立成功,客户端的状态为ESTABLISHED,同时客户端协议栈也会对服务器端的SYN包进行应答,应答数据为k+1;
应答包到达服务器端后,服务器端协议栈使得accept阻塞调用返回,这个时候服务器端到客户端的单向连接也建立成功,服务器端也进入ESTABLISHED状态。
形象一点的比喻是这样的,有A和B想进行通话:

A先对B说:“喂,你在么?我在的,我的口令是j。”
B收到之后大声回答:“我收到你的口令j并准备好了,你准备好了吗?我的口令是k。”
A收到之后也大声回答:“我收到你的口令k并准备好了,我们开始吧。”
可以看到,这样的应答过程总共进行了三次,这就是TCP连接建立之所以被叫为“三次握手”的原因了。

总结

这一讲我们分别从服务端和客户端的角度,讲述了如何创建套接字,并利用套接字完成TCP连接的建立。

服务器端通过创建socket,bind,listen完成初始化,通过accept完成连接的建立。
客户端通过创建socket,connect发起连接建立请求。

文章来源: javaedge.blog.csdn.net,作者:JavaEdge.,版权归原作者所有,如需转载,请联系作者。

原文链接:javaedge.blog.csdn.net/article/details/113784188

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。