跨区域部署,看AnyShare如何实现内容访问加速
大数据时代,无论是信息化趋势还是国家政策需要,各行各业都走向了云计算之路。目前国内企业级用户部署的文档管理产品,主要有以下2种方式:一种是使用公有云文档产品;另一种是将私有云产品部署在本地数据中心。
当用户采用公有云方式时,一般对于用户数据量以及安全性要求不高,比较适用于小型企业;而对于中大型企业客户,对数据和安全性要求较高,一般采用本地私有化部署的文档管理平台。然而,当把私有云产品部署在本地数据中心之后,却碰到了以下几个难题:
- 私有部署的文档管理平台,一般部署在总部数据中心。对于分支机构来说,每次访问文档数据时,都需要远程访问总部数据节点;尤其是对于在外出差的员工,由于总部对外出口带宽资源有限,导致访问文档速度非常慢。
- 对于数据安全性要求更高的企业,一般会采用VPN方式,但是远程访问体验非常差。
- 部分企业有可能借助于第三方CDN厂商来提供文档访问效率。由于文档、视频、图片等文件时效性要求很高,只能采用CDN动态加速方式,但是却导致频繁的回源请求,流量成本非常高。
因此,如何解决跨区域型集团企业、垂直行业内文档数据快速访问是国内IT建设面临的新课题。在一些大型集团、企业组织机构众多,人员往来频繁,跨区域共建共享需求迫切的背景下,爱数提出了“一种基于内容分发机制的企业级跨区域文档快速访问方法”。该方式能够在多地域(机房)同时部署多个节点的文档服务器,这些分布式在各地的文档服务器组成一个虚拟文件服务器集群,统一对外提文档访问服务,并且每个地域(机房)的文档服务器之间定期同步热点数据,在不过多占用网络带宽的前提下提高文档数据访问效率。
一、 跨区域部署方案概览
AnyShare跨区域部署解决方案提供了一种基于内容分发机制的企业级跨区域文档快速访问方法,能够以最经济的方式满足跨区域文档访问。
在“多地域同时登陆,网络带宽有限”的前提下,AnyShare满足文档数据快速访问。如下图所示,AnyShare支持在多个地域部署多套文档服务器,每个地域的文档服务器自带一个反向代理服务与缓存服务器节点,这些跨区域的文档服务器之间组成一个虚拟文件服务器集群。
图1:跨区域部署示意图
为了节约网络带宽资源,这些分布在各个地域的文档服务器之间默认没有文档数据交换,终端用户默认访问本地域的文档服务器中数据,当本地域文档服务器中不存在时,访问反向代理服务中数据,若此时反向代理服务中也不存在时,则远程访问目标地域服务器中的文档数据,同时该地域的反向代理服务器自动将该文档数据推送至其他地域反向代理服务器。
二、跨区域访问实现流程
1. 终端用户数据请求:普通用户访问文档数据时,系统自动将将该用户的请求定向到该用户所属地域的文档服务器节点。
2. 文档访问请求查询:当前请求到达本地域文档服务器时,首先查询本地域文档服务器中是否包含用户所需的文件,若存在则直接返回给用户;若不存在,则转向本地反向代理服务器进行请求查询。若本地反向代理服务器存在,则返回给用户;若不存在,则向中心区域管理服务器进行请求。
3. 数据回源:中心区域管理服务器根据请求文件的“地域”属性信息,将用户请求重定向至文件所在的地域文档服务器。
4. 数据download:从该文件归属地的服务器中download至该归属地的缓存服务器。
5. 数据分发:文档从该归属地的反向代理服务器分发至各个地域的反向代理服务器,再由反向代理服务器转存至本地缓存服务器。
6. 文件返回:当用户请求的文件分发至用户归宿地的反向代理服务器时,将系统自动将该用户请求转至该反向代理服务器,由反向代理服务器将数据返回给终端用户。
三、跨区域部署方案价值
文件数据就近存储:
由于企业级客户网络带宽有限的实际现况,不可能实现数据在各个地域文档服务器中实时同步,因此在AnyShare技术方案中增加了“地域”这个属性参数。用户隶属于某个地域,而且用户产生的文档也有“地域”这个属性值。
各个地域的文档服务器默认彼此之间没有文档数据交换,彼此之间仅同步元数据信息以及用户数据信息,以保证分散在各个地域的用户所能够看到的文件视图是相同的。 某个地域的用户产生的文件数据就近存放在该用户所在地的文件服务器中。在各分支结构中,各个地域内部之间数据访问以及交互的场景占据了绝大多数比例,仅有少量的业务数据需要跨地域访问。因此,这种数据就近访问的方式,特别适用于网络带宽较小的应用场景。当用户需要访问其他地域数据时,首先冲向访问本地域反向代理服务器。
文档系统节点无状态:
在发生服务器异常、网络中断时,AnyShare技术方案通过虚拟集群内部文档服务器无状态化,保证某地域节点异常时,所属用户依然能够访问文档数据。
文档元数据信息以及用户数据,以中心区域的管理服务器为主模块。各个地域的文档服务器,将新产生的元数据信息与用户数据,实时同步至中心区域的管理服务器或其他地域的文档管理服务器。通过这种方式保证各个地域的用户能够“看到”相同的用户信息与文档信息。
当其中一个地域文档服务器(包括中心文档服务器)宕机时,该区域内的用户访问请求将重新定向至临近的文档服务器,保证用户依然可以访问其他区域的文档数据,而不会因为中心文档服务器宕机导致整个集群无法访问。
热点数据跨地域分发:
由于企业网络带宽资源有限,各个地域的文档服务器默认没有文档数据同步,文档数据仅存放在上传文档的用户所在地域的文档服务器中。由于大多数用户访问本区域内的文档情况较多,因而跨地域download数据的场景较少发生。
为了减少跨地域的数据访问,每个地域的文档服务器会部署反向代理服务器和缓存服务器。当该地域内的用户第一次跨区域访问文档时,反向代理服务器自动缓存该文档,并且分发至其他地域的缓存服务器(系统默认该数据为热点数据,并且根据规则反向代理服务器定期清理过期的热点数据),后续其他地域用户访问该文档时,部署在各个地域的反向代理服务器直接返回给文档数据,而不需要每次直接回源获取数据。
- 点赞
- 收藏
- 关注作者
评论(0)