云数据中心网络与SDN:1.11 跨越数据中心的二层——DCI优化

举报
华章计算机 发表于 2019/06/03 02:48:56 2019/06/03
【摘要】 本书摘自《云数据中心网络与SDN: 技术架构与实现》——书中第1章,第1.11.1节,作者是张晨。

1.11 跨越数据中心的二层——DCI优化

前几节谈了数据中心内部的大二层技术。为了实现高可用,数据中心需要进行灾备或者多活的部署,这就要求数据中心间也能够实现二层网络的互通,这种场景通常称为DCI(DC Interconnect)。DCI的实现方式有很多种,可以使用MSTP或者WDM等传输方案,也可以使用以VPLS为典型代表的MPLS L2VPN。VPLS能够将数据中心间的网络模拟成一个以太网交换机,可实现多点对多点的二层互联,这是早期主流的DCI技术。不过,VPLS在技术的实现上存在着以下缺陷。

依赖于泛洪来学习MAC地址,会占用广域网链路上宝贵的带宽资源。

STP和HSRP需要跨DC收敛,常常会导致出向路由次优。

Full Mesh的PW隧道维护起来太复杂。

对多宿主场景的支持不够,不支持PE双活与负载均衡。

这些缺陷使得VPLS难以实现真正意义上的大二层,因此业界出现了一些针对“大二层”进行优化的DCI技术,主要包括Cisco OTV、Huawei EVN以及H3C EVI。

1.11.1 Cisco OTV

OTV(Overlay Transport Virtualization)是Cisco提出的DCI技术,在Nexus 7K中提供了实现。OTV通过为传统的二层VPN增加控制平面来进行MAC地址学习和ARP代理,避免了不必要的跨Internet泛洪;通过在DC间隔离STP BDPU和HSRP Hello,实现了出向路由最优;通过动态封装建立无状态的隧道增强了可扩展性;能够自动完成对多宿主的探测,支持基于VLAN的负载分担和基于vPC的双活机制。

OTV数据平面的封装格式如图1-32所示,外层IP头后面跟着8字节的OTV Shim头,原始以太网帧中的VLAN header也被移到了Shim头中作为租户二层网络的标识,Shim头中还有一个Overlay ID,一个Overlay可以看作一个以太网,一个Overlay中可以传输多个VLAN的流量。

图1-32 OTV封装格式

OVT设备通过IGMP加入OTV组播组,在ED(OTV Edge Device)间建立邻居关系,使用IS-IS在邻居间学习(VLAN,MAC,Remote IP)来转发信息。考虑到Internet对IP组播的限制,OTV支持头端复制的伪广播机制模拟邻居间的3层组播,这种情况下就只能手工配置邻居了。一个OTV网络中典型的单播通信流程如图1-33所示,假设OTV邻居已经建立。

VM 1发送ARP Request到ED 1上。ED 1学习MAC 1的本地接入端口,然后封装OTV Shim头通过data组播组发送到ED 2。同时,ED 1通过control组播组传输IS-IS LSP,告知ED 2 VM 1的位置信息。ED 2收到IS-IS更新,得知VM 1连接在ED 1上。ED 2收到data组播组的ARP请求后解封装,本地泛洪到VM 2。VM 2回复ARP Reply到ED 2上,ED 2学习MAC 2的本地连接端口,然后封装OTV Shim头封装好ED 1的IP地址单播给ED 1。同时,ED 2通过control组播组传输IS-IS LSP,告知ED 1 VM 2的位置信息。ED 1收到IS-IS更新,得知VM 2连接在ED 2上。ED 1收到携带ARP Reply的单播后,解封装转发给VM 1。

在上述过程中,ED一旦学习到IS-IS LSP,就会在control组播组中告诉邻居相应的信息,因此在VM跨数据中心迁移场景下,ED间能迅速得知VM的新位置,大大缩短了收敛的时间。除了上述外,OTV还具备以下特性。

STP隔离。OTV将STP BPDU在ED上进行阻塞,避免了跨站点STP计算。由于站点间通过控制平面进行MAC学习,因此DC间不会出现环路,只要在每个DC站点内部运行生成树协议保证DC内无环即可。这种做法极大地提高了二层的收敛速度和扩展性。

未知单播隔离。OTV禁止未知单播的跨站点广播,认为IS-IS能够学习到所有合法MAC地址的信息。针对静默主机,可以手工配置静态MAC地址对应远端OTV接口的表项。

ARP代理。对远端站点返回的ARP 回复进行监听,当再收到本地查询同样目的IP的ARP请求时直接代理回复,减少跨站点的泛洪。

出向/入向路径优化。OTV在ED上阻塞HSRP Hello,避免站点A中的主机到站点B中网关进行路由所引发的次优路径问题。OTV设备支持健康路由注入和LISP(Locator/ID Separation Protocol,RFC 6830),以实现入向路径最优。

多宿、负载分担和双活机制。ED设备间自动选举AED(Authority Edge Device)作为主设备转发流量,其他ED作为备份。ED间也可以基于VLAN进行AED选举,实现负载均衡。ED间还可以通过vPC进行跨设备链路聚合,以实现ED的双活。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。