- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《大数据技术丛书Flink原理、实战与性能优化》—1.2　数据架构的演变

华章计算机发表于 2019/06/01 22:06:51 2019/06/01

【摘要】本书摘自《大数据技术丛书Flink原理、实战与性能优化》一书中的第1章，第1.2.1节，编著是张利兵。

1.2　数据架构的演变

近年来随着开源社区的发展，越来越多新的技术被开源，例如雅虎的Hadoop分布式计算框架、UC伯克利分校的Apache Spark等，而伴随着这些技术的发展，促使着企业数据架构的演进，从传统的关系型数据存储架构，逐步演化为分布式处理和存储的架构。

1.2.1　传统数据基础架构

如图1-1所示，传统单体数据架构（Monolithic?Architecture）最大的特点便是集中式数据存储，企业内部可能有诸多的系统，例如Web业务系统、订单系统、CRM系统、ERP系统、监控系统等，这些系统的事务性数据主要基于集中式的关系性数据库（DBMS）实现存储，大多数将架构分为计算层和存储层。存储层负责企业内系统的数据访问，且具有最终数据一致性保障。这些数据反映了当前的业务状态，例如系统的订单交易量、网站的活跃用户数、每个用户的交易额变化等，所有的更新操作均需要借助于同一套数据库实现。

图1-1　传统数据结构

单体架构的初期效率很高，但是随着时间的推移，业务越来越多，系统逐渐变得很大，越来越难以维护和升级，数据库是唯一的准确数据源，每个应用都需要访问数据库来获取对应的数据，如果数据库发生改变或者出现问题，则将对整个业务系统产生影响。

后来随着微服务架构（Microservices?Architecture）的出现，企业开始逐渐采用微服务作为企业业务系统的架构体系。微服务架构的核心思想是，一个应用是由多个小的、相互独立的微服务组成，这些服务运行在自己的进程中，开发和发布都没有依赖。不同的服务能依据不同的业务需求，构建的不同的技术架构之上，能够聚焦在有限的业务功能。

如图1-2所示，微服务架构将系统拆解成不同的独立服务模块，每个模块分别使用各自独立的数据库，这种模式解决了业务系统拓展的问题，但是也带来了新的问题，那就是业务交易数据过于分散在不同的系统中，很难将数据进行集中化管理，对于企业内部进行数据分析或者数据挖掘之类的应用，则需要通过从不同的数据库中进行数据抽取，将数据从数据库中周期性地同步到数据仓库中，然后在数据仓库中进行数据的抽取、转换、加载（ETL），从而构建成不同的数据集市和应用，提供给业务系统使用。

图1-2　微服务架构

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

《大数据技术丛书Flink原理、实战与性能优化》—1.2　数据架构的演变

1.2　数据架构的演变

1.2.1　传统数据基础架构

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

《大数据技术丛书Flink原理、实战与性能优化》—1.2 数据架构的演变

1.2 数据架构的演变

1.2.1 传统数据基础架构

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

《大数据技术丛书Flink原理、实战与性能优化》—1.2　数据架构的演变

1.2　数据架构的演变

1.2.1　传统数据基础架构