【云驻共创】三年蝶变,跨越生态拐点!openGauss让海量数据与开源社区并辔齐驱

举报
炒香菇的书呆子 发表于 2024/04/12 15:10:39 2024/04/12
【摘要】 近年来,国产数据库行业热闹非凡,各种技术路线层出不穷。然而,由于技术路线过于分散,缺乏统一的发展规划,整个产业未能形成合力。为此,国产数据库难以跟上全球数据库的高速发展步伐,满足市场的迫切需求。 此时,国产数据库该如何出圈?

摘要


数据库作为IT世界的"超级英雄",上要撑起应用,下要稳住基础设施,是承上启下的关键角色。

近年来,国产数据库行业热闹非凡,各种技术路线层出不穷。然而,由于技术路线过于分散,缺乏统一的发展规划,整个产业未能形成合力。为此,国产数据库难以跟上全球数据库的高速发展步伐,满足市场的迫切需求。

此时,国产数据库该如何出圈?

openGuass的回答是:经验上厚积薄发,行动上拥抱开源12月28日,openGauss Summit 2023盛大召开,我们看到群英荟萃共探数据库创新之道,离构建千行万业坚实数据基石的梦想又近了一步。

1. 国产数据库行业百家争鸣

数字化转型的浪潮之下国产数据库飞速发展阶段,一路狂飙。如今,国内数据库行业涌现出众多不同类型和用途的数据库产品,还与人工智能、大数据、云计算、工业物联网、区块链等技术玩起了“跨界合作”数据库领域形成了技术与产业齐头并进的强大联盟

1.1 MySQL5.7停服,机遇还是挑战

众所周知,2023年10月21日MySQL5.7正式退出历史舞台,这意味着无法获得针对使用该版本时遇到的问题的官方支持和指导,未来将面临多种潜在风险让许多人捏了一把汗

毕竟MySQL5.7用户群体庞大迁移MySQL5.7到其他国产数据库是个大工程,需要对数据库及其上搭载的应用软件和业务系统进行替代、适配、迁移和重构等艰巨繁重的工作。

正因如此,这对国产数据库厂商而言,既是机遇也是挑战

1.2 百花齐放需技术收敛

放眼国内,数据库江湖风云再起,国产英雄各领风但这背后也隐藏着路线不一、各自为战的危机。

目前,在我国目前有将近 300 家企业在从事数据库的产品工作,而真正掌握数据库核心技术的企业少之又少。国产数据库想要崛起,得拧成一股绳,形成以自主创新为基础的软件根技术体系,摆脱对单一供应链的依赖,从而形成对国产数据库产业界的共识,把产业界的所有资源合在一起,打造能够参与国际竞争的数据库产品技术和标准。

中国软件行业协会产业研究部主任宋贺鹏在《中国软件根技术发展白皮书(数据库册)》为数据库厂商应该如何做到技术收敛指明了方向:

1. 建立标准和体系对数据库发展路线进行收敛。

2. 支持数据库规模化的应用,在鼓励创新的同时也要考虑市场的认可程度。

3. 强化数据库的创新,不仅仅在产品研发阶段,更包括对整个产业链的布局,包括对开源社区的支持,对产业界所有合力的凝聚。

4. 形成合力,使数据库产业界朝一致方向发展

1.3 国产数据库扛把子 openGauss强势崛起

与此同时,国产数据库近年来,在核心技术和市场占有率上一直被国外大厂压制得喘不过气来。

如今,通用数据库的标准、规范和核心技术绝大部分都掌握在国外数据库大厂手中,国产通用数据库犹如困兽,遭到专利围堵,寸步难行。

这样的大环境之下,openGuass却实现了“逆袭”。通过采用厚积薄发,不断积累技术经验,拥抱开源,创新架构的方式,与产业,行业,开发者共建、共享、共治,从而得以在上百种国产数据库中脱颖而出,强势崛起。

2.拥抱开源大潮,引领创新潮流

一直以来,openGauss社区稳扎稳打,凭借深厚的内核研发实力和架构创新,成功应对了数据量激增和非结构化数据的挑战。

除了坚实的技术基础,行业的发展也离不开人才的培养和生态的建设openGauss社区致力于推动数据库产业的协同发展,通过众多合作伙伴的共同努力,共建openGauss根社区,为各行各业筑牢数据基石。在这一过程中,社区为整个生态系统的建设和发展贡献了不可估量的力量


2.1 厚积薄发,不断夯实数据库技术

眼看着行业数智化的大潮汹涌而来,数据量瞬间爆炸,就像打开了潘多拉的魔盒一样,不仅要支持多模数据类型,还要能应对各种部署形态的挑战;不仅要玩转通用算力,还得搞定智能算力,并且要做到算力的融合;同时还要通过系统性的架构创新,这样才能够真正做到高效处理高维数据。

oepnGauss不断厚积薄发,在内核研发上持续投入,实现 DataKit、DataPod 两大架构创新,分层解耦、资源池化,引领数据库技术发展方向,同时在生态兼容、云原生方向不断开疆拓土。

2.2 openGuass与数据库产业协同发展

毋庸置疑的是,openGuass要打造的是一个满足企业苛刻要求的“四高”开源数据库需要有“高性能、高可用、高智能、安全可信来支撑

为此,openGuass不断夯实数据库技术的基础上,通过架构创新、生态兼容和云原生方向的持续发展,勇敢地迎接行业数智化带来的数据量爆炸性增长和非结构化数据的挑战。像超级英雄一样,保护着企业的数据安全。

在开源方面,通过共建openGauss根社区,推动全产业链的数据库创新,为国内开源数据库社区的建设和发展贡献着自己的力量,让千行万业都能站在坚实的数据基石上蓬勃发展


2.3 拥抱开源,openGauss打造千行万业数据基石

事实上,开源不仅是敲敲代码那么简单,它已经演化为我们打破技术壁垒、引领科技创新的超级利器

如今,openGauss紧随开源的脉动,以破冰之姿探索核心技术,积极构建自主的根社区,与产业伙伴携手同行,共同驱动数据库生态的繁荣昌盛。

3.从璀璨新星到行业标杆

短短三年内openGauss犹如一匹黑马,迅速崭露头角,成为国内最大的开源数据库社区,吸引了无数开发者和企业的热烈追捧!为了满足企业对高性能、高安全、高可用和高智能的迫切需求,openGauss可是铆足了劲儿持续创新,在关键技术方面取得了令人瞩目的显著成果。

同时,openGauss致力于多模多态、算力融合和资源池化的发展方向,推出了智能运维工具DataKit和软硬协同的高性能优化方案DataPod,进一步提升了数据库的性能和可靠性。这些举措使openGauss成为国内最活跃的开源数据库社区之一,并在业界树立了标杆。

3.1 三年波澜壮阔,openGauss披荆斩棘

据悉,openGauss社区目前已经汇聚了 6000 多名开发者,500 多家成员单位,已经成为国内规模最大的开源数据库社区。

三年期间,开发者、贡献者,社区企业数增长 100 倍,开源贡献者增长 50 倍,版本下载量增加 38 倍,代码量增长 16 倍,从2020 年 6 月开源的 130 万行代码发展到今已经 2100 万行,从 Gittee 平台指数看 openGauss 已经成为国内最活跃的开源数据库根社区。

3.2 长期投入,满足企业四高需求

值得一提的是,作为数据库界的扛把子,openGauss 始终在关键技术上进行突破与创新,旨在为用户提供更出色的性能、更高的可靠性、更简便的易用性以及更严密的安全保障。

3.2.1 数据库要高性能

目前openGauss性能已经成为行业的标杆,在高可用方面openGauss提出的10 秒 RTO,已经成为行业标准。2022 年,openGauss提出4 路鲲鹏服务器,使得230 万 TPMC 成为业界的一个标杆通过使用4 路鲲鹏服务器,在多核方面能够有持续的 50%的性能提升。

3.2.2 数据库要高安全

安全一直是企业的命脉,openGuass通过打造软硬结合的全密态,能够保证全生命周期的传输和计算,从全方位,从访问控制,从数据审计,从防篡改做起,保证企业核心的数据资产和安全。

3.2.3 数据库要高可用

openGauss基于Paxos协议能够提供两地三中心高可用方案,页面级并行回放支持备机可读,保持70W tpmC场景主备RTO < 10s不变;文件级并行回放实现按批次分组并行分发,备机回放性能提升50%以上;发布订阅支持用户自定义冲突解决方案,构建完整异地双活能力。为企业提供高安全、高可靠的保证。

3.2.4 数据库要高智能

openGauss不仅能够实现数据库的外端进行索引调优、参数推荐,还能够在数据库内核做成智能优化器,做到了内外结合,能够提升数据库的诊断、运维的手段,做到真正的自治、自修复。

3.3 多模多态、算力融合,资源池化

与此同时,openGauss 凭借其多模多态、算力融合和资源池化等超能力,不仅引领了数据库技术的前进方向,还在整个行业创新舞台上大放异彩。这些超能力让openGauss能够轻松应对各种数据挑战,高效整合计算资源,优化资源利用和管理,就像一个强大的数据守护者,为企业应用提供了坚实可靠的数据支撑。


3.3.1 智能运维工具DataKit

针对行业应用过程中的业务建模、开发、管理、安装部署和迁移运维openGauss社区联合伙伴开发了大量工具,帮助用户从使用数据库到实现数据全生命周期的管理。openGauss社区全新升级社区工具DataKit

基于自主创新研发能力,openGauss组件DataKit用于收集、管理和分析系统内部的性能数据,以便及时发现系统中的性能问题和故障,提高系统的可靠性和稳定性。实现对数据库集群安装即最优、支持数据库迁移更平滑、支持基于专家知识库的故障诊断。

3.3.2 软硬协同,高性能优化DataPod

DataPod通过软硬协同,多机并行等全栈优化方案,全面提升集群性能,实现两节点 TPCC 达到 220WtpmC,TPCH 性能提升了 2.5 倍。围绕极致可靠,结合硬件能力实现同城双集群容灾,达到 RP0=0、RTO<60s。另外,支持超过 100TB 大容量处理。同时,内置原生 AI 能力,支持向量化数据存储,打造大模型数据基座。

DataPod 原生支持多机并行分析,提升复杂查询性能;支持基于存储硬件的日志同步复制,实现同城双集群容灾,从而实现金融级集群高可用。

3.3.3 既要AI for DB 又要 DB for AI

在 DB for AI 方面,从 2.0 版本开始,openGauss开始支持库内原生 AI 算子,经过多次版本演进,openGauss联合伙伴升级为支持向量引擎,开始从简单的支持机器学习应用升级为支持大模型应用。在 AI for DB 方面,从1.0版本支持 DBMind,到 3.1 版本支持 ABO 优化器,未来将会融合大模型和DataKit 插件化架构openGauss在数据库内核方面持续升级,为实现从“GUI 操作”升级到“自然语言交互”,从“自动化解决单点问题”进化为“自主解决系统性问题”。

4. openGauss引领数据库行业变革新浪潮

作为开源界的翘楚,openGauss凭借自主创新和开源共建的独门秘籍,一路过关斩将,取得了令人瞩目的战绩如今,openGauss正迈入了飞速发展的黄金时期。市场份额和生态伙伴数量双双飙升,它的名字在数据库江湖中更加响亮

相关资料显示, openGauss 通过坚持自主创新,开源共建的发展模式,已经取得了积极的成效

技术发展方面,得益于产业链共建、共享、共治,openGauss 在产业、生态、技术、商业四个方向取得了令人瞩目的好成绩,不断保持澎湃的创新动力。2023 年线下集中式新增市场份额达到 21.9%,从拓展期正式进入快速发展期。

生态方面,目前 openGauss 已有 12 家发行版伙伴,8 家OGSP 伙伴,4 家一体机伙伴,有效支持了千行万业的数字化转型,未来会有更多的企业用户加入 openGauss 路线并不断向前发展。

从拓展期到发展期,openGauss 就像一匹黑马,在数据库领域掀起一股热潮。未来,openGauss将如何在根技术上创新突破,与各行各业的英雄豪杰联手,打造一个更加繁荣的技术生态圈,让我们拭目以待。

5. 总结

openGauss凭借厚积薄发的技术积累、拥抱开源的策略,以及在“四高”特性上的专注研发,成功实现了国产数据库的崛起,并在短短三年内发展成为国内最大的开源数据库社区和行业标杆。其在技术创新、生态建设、市场表现等方面的卓越表现,为我国数据库产业提供了强有力的示范,有力推动了千行万业数据基石的构建进程。

本文参与华为云社区【内容共创】活动第26期

任务3:汇聚数据库创新力量 打造千行万业数据基石 openGauss Summit 2023

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。