【华为云MySQL技术专栏】MySQL 8.0 EXPLAIN ANALYZE 工具介绍

举报
GaussDB 数据库 发表于 2024/10/25 10:53:36 2024/10/25
【摘要】 1. EXPLAIN ANALYZE可以解决什么问题MySQL 8.0.18 版本开始支持查询分析工具EXPLAIN ANALYZE,该工具不仅会实际执行SQL语句,还会展示SQL语句详细的执行信息,包含执行算子(Iterator)粒度的扫描行数、执行耗时、迭代次数等信息。EXPLAIN ANALYZE工具是MySQL EXPLAIN FORMAT=TREE 功能的扩展,除了展示执行计划和代...

1. EXPLAIN ANALYZE可以解决什么问题

MySQL 8.0.18 版本开始支持查询分析工具EXPLAIN ANALYZE,该工具不仅会实际执行SQL语句,还会展示SQL语句详细的执行信息,包含执行算子(Iterator)粒度的扫描行数、执行耗时、迭代次数等信息。

EXPLAIN ANALYZE工具是MySQL EXPLAIN FORMAT=TREE 功能的扩展,除了展示执行计划和代价估算之外,还提供了细粒度执行算子的耗时等信息。这使得DBA和开发人员能够基于代价估算和算子实际执行耗时信息,判断执行计划是否合理,并识别出后续的优化点。

2. EXPLAIN ANALYZE如何使用

TPC-H基准测试中的Q14 查询为例,该SQL为两个表的连接及GROUP BY聚合操作,用于统计发货日志在1996年1月的促销商品收入占比 。

select
	100.00 * sum(case
		when p_type like 'PROMO%'
			then l_extendedprice * (1 - l_discount)
		else 0
	end) / sum(l_extendedprice * (1 - l_discount)) as promo_revenue
from
	lineitem,
	part
where
	l_partkey = p_partkey
	and l_shipdate >= '1996-01-01'
	and l_shipdate < date_add( '1996-01-01', interval '1' month);

通过EXPLAIN FORMAT=TREE语句可以看出执行计划和代价估算信息:

-> Aggregate: sum((lineitem.L_EXTENDEDPRICE * (1 - lineitem.L_DISCOUNT))), sum((case when (part.P_TYPE like 'PROMO%') then (lineitem.L_EXTENDEDPRICE * (1 - lineitem.L_DISCOUNT)) else 0 end))
  -> Nested loop inner join (cost=83997.65 rows=66041)
      -> Filter: ((lineitem.L_SHIPDATE >= DATE'1996-01-01') and (lineitem.L_SHIPDATE < <cache>(('1996-01-01' + interval '1' month)))) (cost=60883.30 rows=66041)
          -> Table scan on lineitem (cost=60883.30 rows=594488)
      -> Single-row index lookup on part using PRIMARY (P_PARTKEY=lineitem.L_PARTKEY) (cost=0.25 rows=1)

通过EXPLAIN ANALYZE语句可以看出每个算子详细的执行信息,如下:

-> Aggregate: sum((lineitem.L_EXTENDEDPRICE * (1 - lineitem.L_DISCOUNT))), sum((case when (part.P_TYPE like 'PROMO%') then (lineitem.L_EXTENDEDPRICE * (1 - lineitem.L_DISCOUNT)) else 0 end)) (actual time=203.753..203.753 rows=1 loops=1)
  -> Nested loop inner join (cost=83997.65 rows=66041) (actual time=0.056..200.386 rows=7884 loops=1)
      -> Filter: ((lineitem.L_SHIPDATE >= DATE'1996-01-01') and (lineitem.L_SHIPDATE < <cache>(('1996-01-01' + interval '1' month)))) (cost=60883.30 rows=66041) (actual time=0.042..183.957 rows=7884 loops=1)
          -> Table scan on lineitem (cost=60883.30 rows=594488) (actual time=0.039..140.993 rows=600572 loops=1)
      -> Single-row index lookup on part using PRIMARY (P_PARTKEY=lineitem.L_PARTKEY) (cost=0.25 rows=1) (actual time=0.002..0.002 rows=1 loops=7884)

相比EXPLAIN FORMAT=TREEEXPLAIN ANALYZE实际执行SQL语句,并统计每个算子的详细耗时信息,每个算子额外提供如下信息

(actual time=m_start..m_end rows=m_rows loops=m_loops)

m_start: 该算子返回第一行数据的实际时间(毫秒)

m_end: 该算子返回所有数据的实际时间(毫秒)

m_rows: 该算子实际的返回行数

m_loops: 该算子实际的迭代次数

例如,Filter算子过滤lineitem表的L_SHIPDATE字段在 ['1996-01-01', '1996-02-01') 区间的数据。

Filter: ((lineitem.L_SHIPDATE >= DATE'1996-01-01') and (lineitem.L_SHIPDATE < <cache>(('1996-01-01' + interval '1' month))))
(cost=60883.30 rows=66041)
(actual time=0.042..183.957 rows=7884 loops=1)

优化器基于统计信息估算出的代价为 60883.30,预测返回行数为 66041;然而,实际执行后发现,真实的返回行数为7884其中,Filter算子过滤掉了592688 (600572 - 7884)迭代次数为1对应于Nested Loop Join中外表的扫描次数,返回给上层算子Nested loop inner join第一行数据的时间为 0.042 毫秒,返回给上层算子所有数据的时间为 183.957 毫秒

例如,点查算子Single-row index lookup on part using PRIMARY,作为Nested loop inner join的内表,通过条件part.p_partkey = lineitem.l_partkey循环获取满足条件的行

Single-row index lookup on part using PRIMARY (P_PARTKEY=lineitem.L_PARTKEY)
(cost=0.25 rows=1)
(actual time=0.002..0.002 rows=1 loops=7884)

优化器估算出的代价为0.25,预测返回行数为 1;然而,实际执行后发现,真实的返回行数为1,迭代次数为7884,与外表FILTER算子执行后的结果数据量相等,每次迭代只返回上层算子1行因此返回给上层算子Nested loop inner join第一行数据的时间和所有数据的时间相等,都是0.002毫秒,可以推算出内表点查的累计耗时为 15.768 毫秒(7884 * 0.002毫秒)。

基于以上分析,我们可以看出该SQL语句执行耗时约200 毫秒lineitem全表扫描耗时约140 毫秒,Filter算子耗时约40 毫秒,part表循环点查约16 毫秒

3. EXPLAIN ANALYZE源码实现

MySQL 8.0 使用火山执行引擎,火山模型是数据库系统中广泛使用的迭代模型。SQL语句经过查询解析生成抽象语法树AST,然后经过查询优化,最终生成执行树,执行树的每个节点对应一个执行算子Iterator。每个算子提供了Init,Read,End接口,每个算子子节点获取数据,执行该算子的相关工作,并返回结果父节点

以MySQL 8.0.22版本为例,提供了37个执行算子来处理数据读取、多表连接、聚合操作、数据物化等多个操作场景,每个执行算子都继承一个基类RowIterator

例如 TableScanIterator处理全表扫描 NestedLoopIterator处理2表连接的类图如图1所示:

图1 TableScanIterator NestedLoopIterator 类图

EXPLAIN ANALYZE 工具的作用是展示SQL语句的执行计划以及详细记录各个算子的执行耗时MySQL 8.0中,这一功能的实现是通过新增一个接口模板TimingIterator将37个执行算子封装起来,以便统计各个执行算子详细执行耗时信息。这样做的好处是实现简单,无需对所有算子单独适配,而且不影响非EXPLAIN ANALYZE语句的执行效率。

例如全表扫描算子TableScanIterator 对应TimingIterator<TableScanIterator>,表连接算子 NestedLoopIterator 对应 TimingIterator<NestedLoopIterator>,其类图如图2所示

2 TimingIterator<TableScanIterator> 和 TimingIterator<NestedLoopIterator> 类图

3.1 执行树生成

数据库优化器在确定最优的访问路径(AccessPath)之 后,会通过函数 CreateIteratorFromAccessPath 生成执行树,该函数会依据算子类型调用NewIterator函数生成对应的算子。如果是普通DQLSELECT语句则生成对应的算子如果是 EXPLAIN ANALYZE语句,则生成一个 TimingIterator< RealIterator> Wapper对象,其中,真实的执行算子保存在 TimingIterator::m_iterator

例如,EXPLAIN ANALYZE语句,TableScanIterator 会生成TimingIterator<TableScanIterator> 算子,NestedLoopIterator 会生成 TimingIterator<NestedLoopIterator> 算子,执行流程如图3所示。

图3 执行树生成流程

3.2 统计算子执行耗时

TimingIterator 模板类的主体实现如下表所示,执行的统计信息记录在几个私有成员变量中

template <class RealIterator>
class TimingIterator final : public RowIterator {
 public:
  bool Init() override;
  int Read() override;
  std::string TimingString() const override; // 打印函数,输出算子执行时间信息

 private:
  uint64_t m_num_rows = 0; // 该算子累计处理的记录数
  uint64_t m_num_init_calls = 0; // 调用 Init 函数的次数
  // 返回第一行的执行时间
  steady_clock::time_point::duration m_time_spent_in_first_row{0}; 
  // 返回所有行的执行时间
  steady_clock::time_point::duration m_time_spent_in_other_rows{0};
  bool m_first_row; // 是否为第一行数据
  RealIterator m_iterator; // 真实的执行算子
};

在SQL语句实际执行过程中,通过 Init Read 函数的调度来记录详细执行信息,具体实现如下:

template <class RealIterator>
bool TimingIterator<RealIterator>::Init() {
  ++m_num_init_calls;  // Init 函数的调用次数递增
  steady_clock::time_point start = now();
  bool err = m_iterator.Init(); // 调用真实执行算子的Init函数
  steady_clock::time_point end = now();
  m_time_spent_in_first_row += end - start; // 累计获取第一行数据的时间
  m_first_row = true;
  return err;
}

template <class RealIterator>
int TimingIterator<RealIterator>::Read() {
  steady_clock::time_point start = now();
  int err = m_iterator.Read(); // 调用真实执行算子的Read 函数
  steady_clock::time_point end = now();
  if (m_first_row) {
    m_time_spent_in_first_row += end - start; // 更新获取第一行数据的时间
    m_first_row = false; // 获取第一行数据结束
  } else {
    m_time_spent_in_other_rows += end - start; // 更新获取所有行数据的时间
  }
  if (err == 0) {
    ++m_num_rows; // 刷新该算子累计处理的记录数
  }
  return err;
}

3.3 打印算子执行耗时

SQL语句执行结束后,会调用函数 TimingIterator<RealIterator>::TimingString 打印算子执行耗时信息,调用堆栈信息如下表所示

dispatch_command
  mysql_parse
    mysql_execute_command
      Sql_cmd_dml::execute
        Sql_cmd_dml::execute_inner
          explain_query
            ExplainIterator
              PrintQueryPlan
                ExplainAccessPath
                  TimingIterator<RealIterator>::TimingString

TimingIterator<RealIterator>::TimingString 函数会基于执行阶段的统计打印以下信息

该算子返回第一行数据的实际时间(毫秒)

该算子返回所有数据的实际时间(毫秒)

该算子实际的返回行数

该算子实际的迭代次数

4. 总结

综上,我们分析了MySQL 8.0 EXPLAIN ANALYZE命令的使用,并结合源码介绍其实现思路,帮助数据库使用者和开发者更好的使用、理解该功能。

当遇到慢查询时,我们也可借助于EXPLAIN ANALYZE工具观察执行计划是否合理、分析SQL执行的主要耗时点,进而去优化SQL执行。

参考资料

https://dev.mysql.com/doc/relnotes/mysql/8.0/en/news-8-0-18.html

https://dev.mysql.com/worklog/task/?id=4168

https://dev.mysql.com/doc/refman/8.0/en/using-explain.html


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。