热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

MySQL的10件事—它们也许和你预想的不一样_MySQL

#10.搜索一个NULL值SELECT*FROMaWHEREa.columnNULL在SQL中,NULL什么也不等于,而且NULL也不等于NULL。这个查询不会返回任何结果的,实际上,当构建那个plan的时候,优化器会把这样的语句优
#10. 搜索一个“NULL”值
  1. SELECT *
  2. FROM a
  3. WHERE a.column = NULL

在SQL中,NULL什么也不等于,而且NULL也不等于NULL。这个查询不会返回任何结果的,实际上,当构建那个plan的时候,优化器会把这样的语句优化掉。

当搜索NULL值的时候,应该使用这样的查询:

  1. SELECT *
  2. FROM a
  3. WHERE a.column IS NULL

#9. 使用附加条件的LEFT JOIN

  1. SELECT *
  2. FROM a
  3. LEFT JOIN
  4. b
  5. ON b.a = a.id
  6. WHERE b.column = 'something'

除了从a返回每个记录(至少一次),当没有真正匹配的记录的时候,用NULL值代替缺失的字段之外,LEFT JOIN和INNER JOIN都是一样的。

但是,在LEFT JOIN之后才会检查WHERE条件,所以,上面这个查询在连接之后才会检查column。就像我们刚才了解到的那样,非NULL值才可以满足相等条件,所以,在a的记录中,那些在b中没有对应的条目的记录不可避免地要被过滤掉。

从本质上来说,这个查询是一个INNER JOIN,只是效率要低一些。

为了真正地匹配满足b.column = 'something'条件的记录(这时要返回a中的全部记录,也就是说,不过滤掉那些在b中没有对应的条目的记录),这个条件应该放在ON子句中:

  1. SELECT *
  2. FROM a
  3. LEFT JOIN
  4. b
  5. ON b.a = a.id
  6. AND b.column = 'something'

#8. 小于一个值,但是不为NULL

我经常看到这样的查询:

  1. SELECT *
  2. FROM b
  3. WHERE b.column <'something'
  4. AND b.column IS NOT NULL

实际上,这并不是一个错误:这个查询是有效的,是故意这样做的。但是,这里的IS NOT NULL是冗余的。

如果b.column是NULL,那么无法满足b.column <'something'这个条件,因为任何一个和NULL进行的比较都会被判定为布尔NULL,是不会通过过滤器的。

有趣的是,这个附加的NULL检查不能和“大于”查询(例如:b.column > 'something')一起使用。

这是因为,在MySQL中,在ORDER BY的时候,NULL会排在前面,因此,一些人错误地认为NULL比任何其他的值都要小。

这个查询可以被简化:

  1. SELECT *
  2. FROM b
  3. WHERE b.column <'something'

在b.column中,不可能返回NULL

#7. 按照NULL来进行连接

  1. SELECT *
  2. FROM a
  3. JOIN b
  4. ON a.column = b.column

在两个表中,当column是nullable的时候,这个查询不会返回两个字段都是NULL的记录,原因如上所述:两个NULL并不相等。

这个查询应该这样来写:

  1. SELECT *
  2. FROM a
  3. JOIN b
  4. ON a.column = b.column
  5. OR (a.column IS NULL AND b.column IS NULL)

MySQL的优化器会把这个查询当成一个“等值连接”,然后提供一个特殊的连接条件:ref_or_null

#6. NOT IN和NULL值

  1. SELECT a.*
  2. FROM a
  3. WHERE a.column NOT IN
  4. (
  5. SELECT column
  6. FROM b
  7. )

如果在b.column中有一个NULL值,那么这个查询是不会返回任何结果的。和其他谓词一样,IN 和 NOT IN 遇到NULL也会被判定为NULL。

你应该使用NOT EXISTS重写这个查询:

  1. SELECT a.*
  2. FROM a
  3. WHERE NOT EXISTS
  4. (
  5. SELECT NULL
  6. FROM b
  7. WHERE b.column = a.column
  8. )

不像IN,EXISTS总是被判定为true或false的。

#5. 对随机的样本进行排序

  1. SELECT *
  2. FROM a
  3. ORDER BY
  4. RAND(), column
  5. LIMIT 10

这个查询试图选出10个随机的记录,按照column来排序。

ORDER BY会按照自然顺序来对输出结果进行排序:这就是说,当第一个表达式的值相等的时候,这些记录才会按照第二个表达式来排序。

但是,RAND()的结果是随机的。要让RAND()的值相等是行不通的,所以,按照RAND()排序以后,再按照column来排序也是没有意义的。

要对随机的样本记录进行排序,可以使用这个查询:

  1. SELECT *
  2. FROM (
  3. SELECT *
  4. FROM mytable
  5. ORDER BY
  6. RAND()
  7. LIMIT 10
  8. ) q
  9. ORDER BY
  10. column

#4. 通过一个组来选取任意的记录

这个查询打算通过某个组(定义为grouper来)来选出一些记录

  1. SELECT DISTINCT(grouper), a.*
  2. FROM a

DISTINCT不是一个函数,它是SELECT子句的一部分。它会应用到SELECT列表中的所有列,实际上,这里的括号是可以省略的。所以,这个查询可能会选出grouper中的值都相同的记录(如果在其他列中,至少有一个列的值是不同的)。

有时,这个查询可以正常地使用( 这主要依赖于MySQL对GROUP BY的扩展):

  1. SELECT a.*
  2. FROM a
  3. GROUP BY
  4. grouper

在某个组中返回的非聚合的列可以被任意地使用。

首先,这似乎是一个很好的解决方案,但是,它存在着一个很严重的缺陷。它依赖于这样一个假设:虽然可以通过组来任意地获取,但是返回的所有值都要属于一条记录。

虽然当前的实现似乎就是这样的,但是它并没有文档化,无论何时,它都有可能被改变(尤其是,当MySQL学会了在GROUP BY的后面使用index_union的时候)。所以依赖于这个行为并不安全。

如果MySQL支持分析函数的话,这个查询可以很容易地用另一种更清晰的方式来重写。但是,如果这张表拥有一个PRIMARY KEY的话,即使不使用分析函数,也可以做到这一点:

  1. SELECT a.*
  2. FROM (
  3. SELECT DISTINCT grouper
  4. FROM a
  5. ) ao
  6. JOIN a
  7. ON a.id =
  8. (
  9. SELECT id
  10. FROM a ai
  11. WHERE ai.grouper = ao.grouper
  12. LIMIT 1
  13. )

#3. 通过一个组来选取第一条记录

把前面那个查询稍微变化一下:

  1. SELECT a.*
  2. FROM a
  3. GROUP BY
  4. grouper
  5. ORDER BY
  6. MIN(id) DESC

和前面那个查询不同,这个查询试图选出id值最小的记录。

同样:无法保证通过a.*返回的非聚合的值都属于id值最小的那条记录(或者任意一条记录)

这样做会更清晰一些:

  1. SELECT a.*
  2. FROM (
  3. SELECT DISTINCT grouper
  4. FROM a
  5. ) ao
  6. JOIN a
  7. ON a.id =
  8. (
  9. SELECT id
  10. FROM a ai
  11. WHERE ai.grouper = ao.grouper
  12. ORDER BY
  13. ai.grouper, ai.id
  14. LIMIT 1
  15. )

这个查询和前面那个查询类似,但是使用额外的ORDER BY可以确保按id来排序的第一条记录会被返回。

#2. IN和‘,’——值的分隔列表

这个查询试图让column的值匹配用‘,’分隔的字符串中的任意一个值:

  1. SELECT *
  2. FROM a
  3. WHERE column IN ('1, 2, 3')

这不会正常发挥作用的,因为在IN列表中,那个字符串并不会被展开。

如果列column是一个VARCHAR,那么它(作为一个字符串)会和整个列表(也作为一个字符串)进行比较,当然,这不可能匹配。如果 column是某个数值类型,那么这个列表会被强制转换为那种数值类型(在最好的情况下,只有第一项会匹配)

处理这个查询的正确方法应该是使用合适的IN列表来重写它:

  1. SELECT *
  2. FROM a
  3. WHERE column IN (1, 2, 3)

或者,也可以使用内联:

  1. SELECT *
  2. FROM (
  3. SELECT 1 AS id
  4. UNION ALL
  5. SELECT 2 AS id
  6. UNION ALL
  7. SELECT 3 AS id
  8. ) q
  9. JOIN a
  10. ON a.column = q.id

但是,有时这是不可能的。

如果不想改变那个查询的参数,可以使用FIND_IN_SET:

  1. SELECT *
  2. FROM a
  3. WHERE FIND_IN_SET(column, '1,2,3')

但是,这个函数不可以利用索引从表中检索行,会在a上执行全表扫描。

#1. LEFT JOIN和COUNT(*)

  1. SELECT a.id, COUNT(*)
  2. FROM a
  3. LEFT JOIN
  4. b
  5. ON b.a = a.id
  6. GROUP BY
  7. a.id

这个查询试图统计出对于a中的每条记录来说,在b中匹配的记录的数目。

问题是,在这样一个查询中,COUNT(*)永远不会返回一个0。对于a中某条记录来说,如果没有匹配的记录,那么那条记录还是会被返回和计数。

只有需要统计b中的记录数目的时候才应该使用COUNT。既然可以使用COUNT(*),那么我们也可以使用一个参数来调用它(忽略掉NULL),我们可以把b.a传递给它。在这个例子中,作为一个连接主键,它不可以为空,但是如果不想匹配,它也可以为空。

原文标题:10 things in MySQL (that won’t work as expected)

推荐阅读
  • 本文介绍了如何在MySQL中将零值替换为先前的非零值的方法,包括使用内联查询和更新查询。同时还提供了选择正确值的方法。 ... [详细]
  • 在数据分析工作中,我们通常会遇到这样的问题,一个业务部门由若干业务组构成,需要筛选出每个业务组里业绩前N名的业务员。这其实是一个分组排序的 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • Oracle Database 10g许可授予信息及高级功能详解
    本文介绍了Oracle Database 10g许可授予信息及其中的高级功能,包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明,指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识,包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说,本文提供了一些有价值的参考内容。 ... [详细]
  • 本文由编程笔记小编整理,介绍了PHP中的MySQL函数库及其常用函数,包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 生成对抗式网络GAN及其衍生CGAN、DCGAN、WGAN、LSGAN、BEGAN介绍
    一、GAN原理介绍学习GAN的第一篇论文当然由是IanGoodfellow于2014年发表的GenerativeAdversarialNetworks(论文下载链接arxiv:[h ... [详细]
  • 信息安全等级保护是指对国家秘密信息、法人和其他组织及公民的专有信息以及公开信息和存储、传输、处理这些信息的信息系统分等级实行安全保护,对信息系统中使用的信息安全产品实 ... [详细]
  • 无线认证设置故障排除方法及注意事项
    本文介绍了解决无线认证设置故障的方法和注意事项,包括检查无线路由器工作状态、关闭手机休眠状态下的网络设置、重启路由器、更改认证类型、恢复出厂设置和手机网络设置等。通过这些方法,可以解决无线认证设置可能出现的问题,确保无线网络正常连接和上网。同时,还提供了一些注意事项,以便用户在进行无线认证设置时能够正确操作。 ... [详细]
  • t-io 2.0.0发布-法网天眼第一版的回顾和更新说明
    本文回顾了t-io 1.x版本的工程结构和性能数据,并介绍了t-io在码云上的成绩和用户反馈。同时,还提到了@openSeLi同学发布的t-io 30W长连接并发压力测试报告。最后,详细介绍了t-io 2.0.0版本的更新内容,包括更简洁的使用方式和内置的httpsession功能。 ... [详细]
author-avatar
手机用户2502923261
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有