MRS phoenix开源问题-- desc排序数据不一致
【摘要】 问题描述相同的查询条件,使用primary key字段DATADATE进行desc排序后与默认排序ASC的结果不一致;使用非primary key字段进行排序后再使用limit限制查询结果,返回结果为空,不符合预期。问题分析问题描述的两种查询场景都会使用到Phoenix提供的OrderedResultIterator迭代器对查询结果进行处理。服务端的查询分成两个步骤:先通过primary k...
问题描述
- 相同的查询条件,使用primary key字段DATADATE进行desc排序后与默认排序ASC的结果不一致;
- 使用非primary key字段进行排序后再使用limit限制查询结果,返回结果为空,不符合预期。
问题分析
- 问题描述的两种查询场景都会使用到Phoenix提供的OrderedResultIterator迭代器对查询结果进行处理。服务端的查询分成两个步骤:
- 先通过primary key的条件进行查找,如果找不到数据则result为null并返回;
- 对查找的结果使用其他条件进行过滤,如果查找的结果不满足条件,则result为空并返回。
但是OrderedResultIterator只对result为null的数据进行的处理,如果result为空,则会导致新返回的数据覆盖掉队列里面之前的数据,导致数据不正确。
正常情况下,服务侧查询数据,如果数据被filter过滤掉,会继续查找新的数据直到result为null。但是Phoenix使用了small scan,如果一次rpc请求读取的数据(包括被filter过滤掉的数据)超过了4*block size(默认4*64K),则会强制返回空Result。这是导致该问题是偶现的根本原因。
综上所述,要触发该问题需要的条件为:一个region中满足查询条件的两条数据的间隔要超过4*64K,即两条满足查询条件的数据中间要间隔条数大小超过4*64k的其他数据;
OrderedResultIterator对result结果处理不正确,导致空的Result将正常的数据覆盖
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)