GaussDB(for Cassandra)如何高效支撑海量数据复杂查询?

GaussDB 数据库 发表于 2023/01/06 09:19:50 2023/01/06
【摘要】 12月22日,Cassandra Day China 2022在线上举行,大会邀请了众多知名企业的技术专家,从实际使用角度带来Cassandra的相关应用经验分享。华为云NoSQL数据库高级工程师马明迪受邀参会并分享了GaussDB(for Cassandra)的核心技术与复杂查询场景最优解,以及优秀实践成果。华为云NoSQL数据库高级工程师马明迪数据库技术作为底层支撑之一,正在为世界范围内...

12月22日,Cassandra Day China 2022在线上举行,大会邀请了众多知名企业的技术专家,从实际使用角度带来Cassandra的相关应用经验分享。华为云NoSQL数据库高级工程师马明迪受邀参会并分享了GaussDB(for Cassandra)的核心技术与复杂查询场景最优解,以及优秀实践成果。

图片

华为云NoSQL数据库高级工程师马明迪

数据库技术作为底层支撑之一,正在为世界范围内不同行业的应用带来源源不断的动力。Cassandra作为数据库技术中的佼佼者之一,广泛应用于社交娱乐、IOT、数据仓库等场景。随着业务的迅猛发展,企业随之而来的业务数据量急速攀升,流量洪峰场景频繁出现,业务高可用诉求强烈。

作为国内领先的云原生多模非关系型数据库,华为云GaussDB NoSQL高度兼容MongoDB、Cassandra、Redis、InfluxDB四款主流NoSQL接口,支持跨3AZ高可用集群,相比社区版具有分钟级计算扩容、秒级存储扩容、数据强一致、超低时延、高速备份恢复等优势。

华为云GaussDB(for Cassandra)基于业界领先的计算存储分离架构,性能较自建数据库平均提升了2倍,单套实例实现百TB存储,适用于海量数据场景下的极致高可用、高扩展;支持分钟级快速扩展,扩容过程性能稳定无抖动;提供极致高可用,容忍最大N-1节点故障,任意盘或节点故障,数据秒级接管,保障业务持续可用;还支持异地双活,实现业务恢复和故障恢复解耦,Region级高可用。

复杂查询作为Cassandra的典型应用场景,通常采用基于主键的查询方式,即通过完整主键的精确查询、指定分区键的范围查询以及简单的聚合能力来处理,对于非主键条件查询的支持度并不友好,即通过原生二级索引、全表扫描、物化视图等方式查询,主要缺点为限制条件较多,资源消耗大,灵活性不足。

为了解决上述问题,华为云GaussDB(for Cassandra) 对架构进行升级,内嵌Lucene搜索引擎与存储引擎搭配,实现KV存储引擎与搜索引擎的深度融合,保持了系统的整体统一,又扩展了复杂查询能力;利用统一接入层承载开源Cassandra语义,并提供JSON接口,易于扩展。同时通过计算层融合管理和双引擎融合存储,提升数据流转效率和强读写能力,并基于云原生架构,提升资源利用效率,节约成本。

华为云GaussDB(for Cassandra)的增强索引解决方案在实际应用场景中表现优异。比如,在某企业应用场景中,GaussDB(for Cassandra)高效承载海量数据处理和高并发写入,提供了极致扩展性,满足业务高速增长;还提供了多维度的查询和统计,以及多个场景的排序需求,轻松应对各种复杂查询场景。

在华为自身业务实践中,GaussDB(for Cassandra)助力华为终端云高效管理10000多个Cassandra节点,轻松支撑PB级数据和千万级并发访问,实现分钟级计算扩容和秒级存储扩容,Lucene加持,实现强大的索引能力,全力保障数据库稳定运行。

随着企业数字化转型进入深水区,未来,企业将更加需要高可靠、强扩展、高可用、简单灵活的数据库服务,华为云GaussDB将持续深耕技术与服务,不断为企业提供数字化转型最优解,让千行百业的用户都能随时、随地、随心地上云和用云。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。