- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Mysql算法内部算法 - 嵌套循环连接算法

简简单单Onlinezuozuo 发表于 2022/02/19 00:00:48 2022/02/19

【摘要】 Mysql算法内部算法 - 嵌套循环连接算法 1.循环连接算法 // 循环连接算法分为两种 1.嵌套循环连接算法 2.块嵌套循环连接算法123 2.嵌套循环连接算法一个简单的嵌套循环连接（NLJ...

Mysql算法内部算法 - 嵌套循环连接算法

1.循环连接算法

// 循环连接算法分为两种
1.嵌套循环连接算法
2.块嵌套循环连接算法
  
 
  1
  2
  3

2.嵌套循环连接算法

一个简单的嵌套循环连接（NLJ）算法从一个循环中的第一个表中读取一行中的行，将每行传递给嵌套循环，以处理连接中的下一个表。该过程重复多次，因为还有待连接的表。
假设三个表之间的连接 t1，t2以及 t3，那么NLJ算法会这么来执行：

// 规则
Table   Join Type
t1      range
t2      ref
t3      ALL

// 简单的NLJ执行算法
for each row in t1 matching range {
  for each row in t2 matching reference key {
    for each row in t3 {
      if row satisfies join conditions, send to client
    }
  }
}

// NLJ算法的不足
NLJ算法一次将一行从外部循环传递到内部循环，所以通常会在内部循环中多次读取表
  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17

3.块嵌套循环连接算法

块嵌套循环（BNL）连接算法使用在外部循环中读取的行的缓冲来减少内部循环中的表必须被读取的次数。例如，如果将10行读入缓冲区并将缓冲区传递到下一个内循环，则可以将内循环中读取的每行与缓冲区中的所有10行进行比较。这减少了内表必须读取次数的一个数量级。

使用连接缓冲有如下特性：

当连接类型是ALL或者index的时候，可以使用连接缓冲（换句话说，当没有键（索引）可用的时候，对数据和索引各进行一次全扫描） range。缓冲的使用也适用于外连接
连接缓冲区从来不为第一个常数表进行分配，即使它的类型是 ALL或 index。
只有有关系列存储在其连接缓冲区中，而不是整行都放进去。
join_buffer_size 系统变量用于确定处理一个查询的每个连接的缓冲区的大小。
为每个可缓存的连接分配一个缓冲区，因此可以使用多个连接缓冲区处理给定的查询。
在执行连接之前分配连接缓冲区，并在查询完成后释放。

// 使用缓存的循环连接算法
for each row in t1 matching range {
  for each row in t2 matching reference key {
    store used columns from t1, t2 in join buffer
    if buffer is full {
      for each row in t3 {
        for each t1, t2 combination in join buffer {
          if row satisfies join conditions, send to client
        }
      }
      empty join buffer
    }
  }
}

if buffer is not empty {
  for each row in t3 {
    for each t1, t2 combination in join buffer {
      if row satisfies join conditions, send to client
    }
  }
}
  
 
  1
  2
  3
  4
  5
  6
  7
  8
  9
  10
  11
  12
  13
  14
  15
  16
  17
  18
  19
  20
  21
  22

4.块嵌套循环连接算法的优势

如果S是每个存储的大小 
t1，t2组合是连接缓冲区，
C是缓冲区中的组合数，那么t3扫描的次数是：
(S * C)/join_buffer_size + 1 次

// join_buffer_size 优化缓存速度
增加 join_buffer_size 的值可以降低扫描t3的次数
降低的极限是当join_buffer_size大到足以容纳所有上一行的组合数据，没有比这个扫描速度更快的了。
  
 
  1
  2
  3
  4
  5
  6
  7
  8

文章来源: wretchant.blog.csdn.net，作者：简简单单OnlineZuozuo，版权归原作者所有，如需转载，请联系作者。

原文链接：wretchant.blog.csdn.net/article/details/78046554

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

Mysql算法内部算法 - 嵌套循环连接算法

Mysql算法内部算法 - 嵌套循环连接算法

1.循环连接算法

2.嵌套循环连接算法

3.块嵌套循环连接算法

4.块嵌套循环连接算法的优势

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

Mysql算法内部算法 - 嵌套循环连接算法

Mysql算法内部算法 - 嵌套循环连接算法

1.循环连接算法

2.嵌套循环连接算法

3.块嵌套循环连接算法

4.块嵌套循环连接算法的优势

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品