攀登不止,华为数据库论文入选SIGMOD 2024,技术创新再谱新篇
6月9日-14日,2024年数据管理国际会议SIGMOD(ACM SIGMOD/PODS International Conference on Management of Data)在智利首都圣地亚哥召开。SIGMOD与ICDE、VLDB并称数据库领域三大顶会,是数据管理领域的最高水平学术会议。
继ICDE 17篇论文入选后,华为多篇论文再次入选SIGMOD 2024, 顶会入选论文已超过100篇。下面节选数据库领域的两篇代表性论文进行分享:
论文一:Robustness of Updatable Learning-based Index Advisors
该论文详细探讨了学习型索引推荐(Learning-based Index Advisors, IA)在面对投毒攻击时的鲁棒性问题。在这种攻击中,攻击者通过向系统输入恶意数据来扰乱IA的学习过程。
论文的核心贡献在于提出了一个名为PIPA的框架,它包括两个主要阶段:
探测阶段:在这一阶段,系统会通过特定的工作负载来探测IA的行为,从而估计其对不同索引的偏好。这是通过观察IA对探测工作负载的响应来实现的,目的是识别出IA可能被投毒攻击影响的脆弱点。
注入阶段:在这一阶段,系统会尝试通过注入特定的工作负载来欺骗IA,使其降低对top索引的排名,同时提升中等排名的索引。这样做的目的是为了测试IA在受到投毒攻击时的反应能力和恢复能力。
综合这两个阶段,PIPA框架能够有效地对IA进行测试,即使在IA经过微调后,也能够捕获其对投毒攻击的敏感性。SIGMOD评委组认为,这项研究的意义不仅提高了IA的安全性,还增强了其在实际应用中的可靠性,为未来的学习型索引推荐提供了重要的参考,特别是应用在云数据库场景中。
论文二:ESTELLE: An Efficient and Cost-effective Cloud Log Engine
该论文是由电子科技大学和华为云数据库创新LAB团队联合攻关发表,提出了一个低成本的云原生日志引擎,解决了海量日志场景下现有解决方案成本较高的问题。
1. 本文提出了一个名为ESTELLE的低成本云原生日志引擎,可以高性能、低开销的写入、存储及查询日志
2. 本文介绍了一种可插拔的日志索引框架,基于ESTELLE-BF和近似倒排索引实现,可以低成本的写入生产,并可以实现高性能的日志全文检索、AND查询及渐进式聚合分析
3. 本文在真实的开源日志数据集上进行试验,证明了ESTELLE在不同日志场景中较高的单核写入能力、较低的存储成本及良好的查询性能
综上,本文提出了一个高性能、低成本的云原生日志引擎ESTELLE,可以在海量写入、低频查询场景下,通过较低的成本,实现较好的日志引擎能力。
此次论文的入选,既是华为在数据库领域持续创新、研发投入的成果,也是华为长期坚持产、学、研、用深度融合的体现。华为通过与全球顶尖学术机构合作,持续推出各类研究计划和人才培养方案,共同攻克数据库难题。
未来,华为将继续加大数据库技术领域的投入,在数据库领域持续创新,将论文理论转化成应用落地,为客户提供创新且有竞争力的数据库产品和服务,推动数据库技术的进步与发展。
- 点赞
- 收藏
- 关注作者
评论(0)