- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

kafka解决了什么问题？

拿烟斗的小男孩发表于 2017/11/28 14:51:23 2017/11/28

【摘要】假设你意气风发，要开发新一代的互联网应用，以期在互联网事业中一展宏图。借助云计算，很容易开发出如下原型系统： 1.Web应用：部署在云服务器上，为个人电脑或者移动用户提供的访问体验。 2.SQL数据库：为Web应用提供数据持久化以及数据查询。这套架构简洁而高效，很快便能够部署到华为云等云计算平台，以便快速推向市场。互联网不就是讲究小步快跑嘛！

    假设你意气风发，要开发新一代的互联网应用，以期在互联网事业中一展宏图。借助云计算，很容易开发出如下原型系统：
         1.Web应用：部署在云服务器上，为个人电脑或者移动用户提供的访问体验。
         2.SQL数据库：为Web应用提供数据持久化以及数据查询。
    这套架构简洁而高效，很快便能够部署到华为云等云计算平台，以便快速推向市场。互联网不就是讲究小步快跑嘛！
    好景不长。随着用户的迅速增长，所有的访问都直接通过SQL数据库使得它不堪重负，不得不加上缓存服务以降低SQL数据库的荷载；为了理解用户行为，开始收集日志并保存到Hadoop上离线处理，同时把日志放在全文检索系统中以便快速定位问题；由于需要给投资方看业务状况，也需要把数据汇总到数据仓库中以便提供交互式报表。此时的系统的架构已经盘根错节了，考虑将来还会加入实时模块以及外部数据交互，真是痛并快乐着……
    这时候，应该跑慢一些，让灵魂跟上来。
    本质上，这是一个数据集成问题。没有任何一个系统能够解决所有的事情，所以业务数据根据不同用途存而放在不同的系统，比如归档、分析、搜索、缓存等。数据冗余本身没有任何问题，但是不同系统之间像意大利面条一样复杂的数据同步却是挑战。
    这时候就轮到Kafka出场了。
    Kafka可以让合适的数据以合适的形式出现在合适的地方。Kafka的做法是提供消息队列，让生产者单往队列的末尾添加数据，让多个消费者从队列里面依次读取数据然后自行处理。之前连接的复杂度是O(N^2)，而现在降低到O(N)，扩展起来方便多了：
    在Kafka的帮助下，你的互联网应用终于能够支撑飞速增长的业务，成为下一个BAT指日可待。
    以上故事说明了Kafka主要用途是数据集成，或者说是流数据集成，以Pub/Sub形式的消息总线形式提供。但是，Kafka不仅仅是一套传统的消息总线，本质上Kafka是分布式的流数据平台，因为以下特性而著名：
    1. 提供Pub/Sub方式的海量消息处理。
    2.以高容错的方式存储海量数据流。
    3.保证数据流的顺序。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

kafka解决了什么问题？

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

kafka解决了什么问题？

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品