- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

kfk作为存储系统的场景

瓷喵发表于 2018/01/22 10:18:12 2018/01/22

【摘要】 Kafka可以作为数据存储系统使用，数据被冗余地存储在磁盘上，无论是50K还是50TB的数据，Kafka的伸缩处理能力保证存储的性能不会受到影响。客户端的确认机制可以保证数据被完全正确的持久化。读取数据的时候，客户端可以自己控制需要读取的位置。充分利用文件系统Kafka大量依赖文件系统去存储和缓存消息。对于硬盘有个传统的观念是硬盘总是很慢，这使很多人怀疑基于文件系统的架构能否提供优异的性能。实际上

Kafka可以作为数据存储系统使用，数据被冗余地存储在磁盘上，无论是50K还是50TB的数据，Kafka的伸缩处理能力保证存储的性能不会受到影响。
客户端的确认机制可以保证数据被完全正确的持久化。读取数据的时候，客户端可以自己控制需要读取的位置。

充分利用文件系统

Kafka大量依赖文件系统去存储和缓存消息。对于硬盘有个传统的观念是硬盘总是很慢，这使很多人怀疑基于文件系统的架构能否提供优异的性能。实际上硬盘的快慢完全取决于使用它的方式。设计良好的硬盘架构可以和内存一样快。

在6块7200转的SATA RAID-5磁盘阵列的线性写速度差不多是600MB/s，但是随即写的速度却是100k/s，差了差不多6000倍。现代的操作系统都对此做了大量的优化，使用了 read-ahead 和 write-behind的技巧，读取的时候成块的预读取数据，写的时候将各种微小琐碎的逻辑写入组织合并成一次较大的物理写入。对此的深入讨论可以查看这里，它们发现线性的访问磁盘，很多时候比随机的内存访问快得多。

为了提高性能，现代操作系统往往使用内存作为磁盘的缓存，现代操作系统乐于把所有空闲内存用作磁盘缓存，虽然这可能在缓存回收和重新分配时牺牲一些性能。所有的磁盘读写操作都会经过这个缓存，这不太可能被绕开除非直接使用I/O。所以虽然每个程序都在自己的线程里只缓存了一份数据，但在操作系统的缓存里还有一份，这等于存了两份数据。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

kfk作为存储系统的场景

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

kfk作为存储系统的场景

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品