MySQL优化器：indexmerge介绍

作者：传闻中的张先生 | 来源：互联网 | 2018-06-11 18:46

在MySQL官方手册上，关于indexmerge的介绍非常非常少。甚至还有不少误导的地方，这次把5.1版本关于此类优化处理的代码细看了一遍，以案例的方式介绍了各种实用indexmerge访问类型的SQL。后续的还会继续介绍indexmerge实现的主要数据结构，以及成本评估。

在MySQL官方手册上，关于index merge的介绍非常非常少。甚至还有不少误导的地方，这次把5.1版本关于此类优化处理的代码细看了一遍，以案例的方式介绍了各种实用index merge访问类型的SQL。后续的还会继续介绍index merge实现的主要数据结构，以及成本评估。

1. 什么是index merge
- 1.1 index merge的限制：range优先
2. 关于index merge的一些案例
- 2.1 k1_p1 = 2 or k2_p1 = 4
- 2.2 (k1_p1=2 and k1_p2=7) or k2_p1=4\G
- 2.3 (k1_p1=2 or k1_p1=7) or k2_p1=4\G
- 2.4 (k1_p1=2 or k1_p2=7) or k2_p1=4\G
- 2.5 k1_p1=1 or (k1_p1=2 and k1_p2=4 and k2_p1=3)
- 2.6 嵌套的案例1
- 2.7 嵌套的案例2
3. 更多关于range优先原则
- 可以使用range的情况
4. 其他
- 4.1 type in MySQL Explain
- 4.2 示例中的表结构和数据

1. 什么是index merge

MySQL优化器如果发现可以使用多个索引查找后的交集/并集定位数据，那么MySQL优化器就会尝试index merge这类访问方式。index merge主要分为两大类，多个索引交集访问(intersections)，多个索引并集访问，当然这两类还可以组合出更为复杂的方式，例如多个交集后做并集。

1.1 index merge的限制：range优先

MySQL在5.6.7之前，使用index merge有一个重要的前提条件：没有range可以使用。这个限制降低了MySQL index merge可以使用的场景。理想状态是同时评估成本后然后做出选择。因为这个限制，就有了下面这个已知的bad case(参考)：

SELECT * FROM t1 WHERE (goodkey1 <10 OR goodkey2 <20) AND badkey <30;

优化器可以选择使用goodkey1和goodkey2做index merge，也可以使用badkey做range。因为上面的原则，无论goodkey1和goodkey2的选择度如何，MySQL都只会考虑range，而不会使用index merge的访问方式。这是一个悲剧...（5.6.7版本针对此有修复)

2. 关于index merge的一些案例

关于什么是交集/并集在手册中有详细介绍，这里不赘述。这里通过几个案例来看看，哪些情况使用交集，哪些情况使用并集，哪些情况使用更复杂的组合。

示例中使用的表结构和数据参考本文4.2节。

2.1 k1_p1 = 2 or k2_p1 = 4

这是最典型，也是最简单的场景了：

SELECT * FROM tmp_index_merge where key1_part1 = 2 or key2_part1 = 4

explain SELECT * FROM tmp_index_merge where key1_part1 = 2 or key2_part1 = 4\G
            ......
        table: tmp_index_merge
         type: index_merge
          key: ind1,ind2
      key_len: 4,4
        Extra: Using sort_union(ind1,ind2); Using where

2.2 (k1_p1=2 and k1_p2=7) or k2_p1=4\G

这个案例稍微复杂一丁点，第一个索引使用了两个字段：

explain SELECT * FROM tmp_index_merge
where (key1_part1 = 2 and key1_part2 = 7) or key2_part1 = 4\G
            ......
        table: tmp_index_merge
         type: index_merge
          key: ind1,ind2
      key_len: 8,4
        Extra: Using sort_union(ind1,ind2); Using where

2.3 (k1_p1=2 or k1_p1=7) or k2_p1=4\G

这个案例也能够使用index merge。内部的实现比它表面上看起来要复杂，这里简单解释一下：MySQL在递归处理这个WHERE条件时，先处理前一部分(key1_part1 = 2 or key1_part1 = 7)。对于同一个索引的同一个字段进行or操作，MySQL会将其合并成一颗SEL_ARG树(具体参考)，两个条件通过SEL_ARG的Next/prev指针连接。MySQL的range访问方式可以通过遍历这棵树(也可以参考前面这篇文章)。接着优化器再处理or的另一个分支(key2_part1 = 4)发现可以使用第二个索引，于是将index merge加入可能的执行计划列表(后续评估成本，再决定是否实用该访问方式)。

explain SELECT * FROM tmp_index_merge
where (key1_part1 = 2 or key1_part1 = 7) or key2_part1 = 4\G
            ......
        table: tmp_index_merge
         type: index_merge
          key: ind1,ind2
      key_len: 4,4
        Extra: Using sort_union(ind1,ind2); Using where

2.4 (k1_p1=2 or k1_p2=7) or k2_p1=4\G

这种情况是无法直接使用任何索引的。不解释。

explain SELECT * FROM tmp_index_merge
where (key1_part1 = 2 or key1_part2 = 7) or key2_part1 = 4\G
            ......
        table: tmp_index_merge
         type: ALL
possible_keys: ind1,ind2
          key: NULL
        Extra: Using where

2.5 k1_p1=1 or (k1_p1=2 and k1_p2=4 and k2_p1=3)

对于这样的条件，MySQL会发现可以使用range访问方式。而根据前面的"range优先"原则，MySQL不再考虑index merge(这里k1_p1=1和k2_p1=3是可以通过index merge访问方式实现的)。MySQL在考虑使用key1访问的时候，看到的条件是：k1_p1=1 or (k1_p1=2 and k1_p2=4)。这里OR两边的条件可以构造成一颗独立的SEL_ARG。(本文后面小结“更多关于range优先原则”有更多详细介绍)

所以，MySQL会直接使用range，而不再考虑index merge。(怎样的条件无法够着成一颗SEL_ARG树，参考，对于两颗SEL_ARG通过or合并的时候，还有一些更复杂的事情，这里暂时不做介绍)

explain SELECT * FROM tmp_sel_tree
where key1_part1=1 or (key1_part1=2 and key1_part2=4 and key2_part1=3)\G
        table: tmp_sel_tree
         type: range
          key: ind1
      key_len: 8
        Extra: Using where

如果前面这几个案例看明白了，那可以继续了，下面会有一些更复杂的案例：

2.6 嵌套的案例1

这个案例看起来很复杂，但其本质跟最前面提到的"已知的bad case"相同，是一个可以使用index merge，但是被range优先掉的案例。

SELECT * FROM tmp_sel_tree where
  ( key1_part1 = 1 or (key1_part2 = 2 and key2_part1 = 3) ) and
  ( key3_part1 = 5 )

2.7 嵌套的案例2

这个案例跟上面稍有不同，是一个三个索引的index merge，这里MySQL将考虑使用index merge。但是一般来说，这类index merge成本本身较大，容易超过全表的成本：

SELECT * FROM tmp_sel_tree where
  ( key1_part1 = 1 or (key1_part2 = 2 and key2_part1 = 3) ) or
  ( key3_part1 = 5 )

如果成本评估后，发现index merge成本小于全表，则会使用：

table: tmp_sel_tree
         type: index_merge
          key: ind1,ind2,ind3
        Extra: Using sort_union(ind1,ind2,ind3); Using where

3. 更多关于range优先原则

可以使用range的情况

在5.6.7之前的MySQL版本，只要可以使用Range访问方式，那就不会再使用index merge。因为可以使用range访问的WHERE条件是非常多的，除了我们常见的(k1_p1=const and k2_p2>const)，如果参考Range优化相关的数据结构，还会看到更多的WHERE条件可以使用range。

这里拿出其中一个较为复杂的可以使用range访问的WHERE条件，做一个简单分析。

WHERE
  (
    key1_part1 = 3 and key1_part2 > 5 and key2_part1 = 7
  )
  or ( key1_part1 > 2 )

对于索引key2来说，这个条件可以简化为如下，可以使用index merge的访问方式：

(TRUE AND TRUE AND key2_part1 = 7) OR ( key1_part1 <2 )

对于索引key1来说，条件简化为：

(key1_part1 = 3 and key1_part2 > 5 and TRUE) or (key1_part1 > 2)

对于索引key1，这是一个可以使用range访问方式的条件。根据前文Range优化相关的数据结构可以构造成一颗SEL_ARG结构，如下：

$                      $
SEL_ARG[2,∞)   $                      $
       |^      $                      $
   next||      $                      $
       ||prev  $                      $
       v|      $                      $
SEL_ARG[3,3] ==$====>  SEL_ARG[5,∞]   $
               $                      $

range访问会依次SEL_ARG，遍历访问。因为有range访问方式，所以这类条件不会再考虑index merge。

但如果WHERE是如下样子（OR后面条件是key1_part2而不是key1_part1）：

WHERE
  (
    key1_part1 = 3 and key1_part2 > 5 and key2_part1 = 7
  )
  or ( key1_part2 > 2 )

OR后面的key1_part2是无法与前面的key1条件合并成一颗SEL_ARG树，所以也就无法使用range访问。因为or后面条件无法独立使用索引访问，所以也同样无法做index merge访问。

4. 其他

4.1 type in MySQL Explain

在MySQL手册中把Explain中type列称为："EXPLAIN Join Types"。这给很多人产生了误解，这里的Type实际是指在整个JOIN中这个单表的访问方式。例如：

id: 1
  select_type: SIMPLE
        table: tmp_sel_tree
         type: index_merge
possible_keys: ind1,ind2,ind3
          key: ind1,ind2,ind3
      key_len: 4,4,4

常见的单表访问方式有：const/ref/range/index/all

MySQL的优化器主要有两个自由度，一个是确定每个单表的访问方式。另一个就是访问顺序。博客中常说的使用"range优化" "index merge优化"也是指MySQL单表访问方式选择了"range"或者"index merge"。

4.2 示例中的表结构和数据

CREATE TABLE `tmp_index_merge` (
  `id` int(11) NOT NULL,
  `key1_part1` int(11) NOT NULL,
  `key1_part2` int(11) NOT NULL,
  `key2_part1` int(11) NOT NULL,
  `key2_part2` int(11) NOT NULL,
  `key2_part3` int(11) NOT NULL,
  `key3_part1` int(11) NOT NULL DEFAULT '4',
  KEY `ind1` (`key1_part1`,`key1_part2`),
  KEY `ind2` (`key2_part1`,`key2_part2`,`key2_part3`),
  KEY `ind3` (`key3_part1`)
) ENGINE=InnoDB DEFAULT CHARSET=gbk
1 row in set (0.01 sec)
root@test 11:33:22>select * from tmp_index_merge;
+----+------------+------------+------------+------------+------------+------------+
| id | key1_part1 | key1_part2 | key2_part1 | key2_part2 | key2_part3 | key3_part1 |
+----+------------+------------+------------+------------+------------+------------+
|  6 |          6 |          1 |          9 |          2 |          1 |          8 |
|  8 |          9 |          9 |          1 |          6 |          6 |          6 |
|  4 |          1 |          3 |          4 |          9 |          3 |          6 |
| 10 |          9 |          7 |          5 |          7 |          1 |          2 |
|  1 |          4 |          7 |          2 |          1 |          8 |          3 |
|  6 |          6 |          3 |          9 |          3 |          9 |          7 |
|  8 |         10 |          6 |          2 |          1 |          1 |          7 |
|  0 |          9 |          4 |          4 |          8 |          7 |          6 |
|  2 |          9 |          1 |          5 |          4 |          5 |          7 |
|  2 |          7 |         10 |          6 |          1 |          8 |          6 |
|  7 |         10 |          8 |          2 |          3 |          1 |          9 |
|  7 |          3 |          3 |          7 |          7 |          2 |         10 |
|  6 |          6 |          1 |          9 |          2 |          1 |          8 |
|  8 |          9 |          9 |          1 |          6 |          6 |          6 |
|  4 |          1 |          3 |          4 |          9 |          3 |          6 |
| 10 |          9 |          7 |          5 |          7 |          1 |          2 |
|  1 |          4 |          7 |          2 |          1 |          8 |          3 |
|  6 |          6 |          3 |          9 |          3 |          9 |          7 |
|  8 |         10 |          6 |          2 |          1 |          1 |          7 |
|  0 |          9 |          4 |          4 |          8 |          7 |          6 |
|  2 |          9 |          1 |          5 |          4 |          5 |          7 |
|  2 |          7 |         10 |          6 |          1 |          8 |          6 |
|  7 |         10 |          8 |          2 |          3 |          1 |          9 |
|  7 |          3 |          3 |          7 |          7 |          2 |         10 |
+----+------------+------------+------------+------------+------------+------------+

推荐阅读

go
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
go
推荐一个ASP的内容管理框架（ASP Nuke）的优势和适用场景

本文推荐了一个ASP的内容管理框架ASP Nuke，并介绍了其主要功能和特点。ASP Nuke支持文章新闻管理、投票、论坛等主要内容，并可以自定义模块。最新版本为0.8，虽然目前仍处于Alpha状态，但作者表示会继续更新完善。文章还分析了使用ASP的原因，包括ASP相对较小、易于部署和较简单等优势，适用于建立门户、网站的组织和小公司等场景。 ... [详细]

蜡笔小新 2023-12-14 18:11:11
perl
Android 新闻App的本地服务器搭建教程

本文介绍了在开发Android新闻App时，搭建本地服务器的步骤。通过使用XAMPP软件，可以一键式搭建起开发环境，包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表，并设置相应的属性。最后，给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]

蜡笔小新 2023-12-14 17:15:19
perl
如何在MySQL中将零值替换为先前的非零值？

本文介绍了如何在MySQL中将零值替换为先前的非零值的方法，包括使用内联查询和更新查询。同时还提供了选择正确值的方法。 ... [详细]

蜡笔小新 2023-12-14 16:59:24
perl
mysql分组排序_在MySQL中实现分组排序功能

在数据分析工作中，我们通常会遇到这样的问题，一个业务部门由若干业务组构成，需要筛选出每个业务组里业绩前N名的业务员。这其实是一个分组排序的 ... [详细]

蜡笔小新 2023-12-14 14:41:26
cookie
如何限制php数据库链接数和连接超时时间？

本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目，以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数，以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]

蜡笔小新 2023-12-14 14:06:10
format
Oracle Database 10g许可授予信息及高级功能详解

本文介绍了Oracle Database 10g许可授予信息及其中的高级功能，包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明，指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]

蜡笔小新 2023-12-14 13:12:10
js
Hibernate基础映射

在说Hibernate映射前，我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象，以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]

蜡笔小新 2023-12-14 10:57:47
js
MysqlDump_mysqldump全库备份相关知识详解

本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识，包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说，本文提供了一些有价值的参考内容。 ... [详细]

蜡笔小新 2023-12-14 10:03:27
ip
PHP中的MySQL函数库及其常用函数介绍

本文由编程笔记小编整理，介绍了PHP中的MySQL函数库及其常用函数，包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-14 08:19:53
ip
Spring特性实现接口多类的动态调用详解

本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍，以及getBeansOfType方法的应用，解决了在实际工作中遇到的接口及多个实现类的问题。同时，文章还提到了SPI使用的不便之处，并介绍了借助ApplicationContext实现需求的方法。阅读本文，你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]

蜡笔小新 2023-12-14 03:24:19
ip
Oracle分析函数first_value()和last_value()的用法及原理

本文介绍了Oracle分析函数first_value()和last_value()的用法和原理，以及在查询销售记录日期和部门中的应用。通过示例和解释，详细说明了first_value()和last_value()的功能和不同之处。同时，对于last_value()的结果出现不一样的情况进行了解释，并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。 ... [详细]

蜡笔小新 2023-12-13 19:07:23
ip
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
ip
brain是什么意思_brain怎么读_brain翻译_用法_发音_词组_同反义词_脑新东方在线英语词典

本文介绍了brain的意思、读音、翻译、用法、发音、词组、同反义词等内容，以及脑新东方在线英语词典的相关信息。还包括了brain的词汇搭配、形容词和名词的用法，以及与brain相关的短语和词组。此外，还介绍了与brain相关的医学术语和智囊团等相关内容。 ... [详细]

蜡笔小新 2023-12-14 16:52:33
ip
Python版Protobuf安装和使用教程

本文介绍了Python版Protobuf的安装和使用方法，包括版本选择、编译配置、示例代码等内容。通过学习本教程，您将了解如何在Python中使用Protobuf进行数据序列化和反序列化操作，以及相关的注意事项和技巧。 ... [详细]

蜡笔小新 2023-12-14 09:27:58

传闻中的张先生

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章