WHERE 与 HAVING
WHERE
与HAVING
的根本区别在于:
WHERE
子句在GROUP BY
分组和聚合函数之前对数据行进行过滤;HAVING
子句对GROUP BY
分组和聚合函数之后的数据行进行过滤。
因此,WHERE
子句中不能使用聚合函数。例如,以下语句将会返回错误:
1 | -- 查找人数大于 5 的部门 |
由于在执行WHERE
子句时,还没有计算聚合函数 count(*),所以无法使用。正确的方法是使用HAVING对聚合之后的结果进行过滤:
1 | -- 查找人数大于 5 的部门 |
另一方面,HAVING
子句中不能使用除了分组字段和聚合函数之外的其他字段。例如,以下语句将会返回错误:
1 | -- 统计每个部门月薪大于等于 30000 的员工人数 |
因为经过GROUP BY
分组和聚合函数之后,不再存在 salary 字段,HAVING
子句中只能使用分组字段或者聚合函数。
SQLite 虽然允许
HAVING
子句中出现其他字段,但是得到的结果不正确。
从性能的角度来说,HAVING
子句中如果使用了分组字段作为过滤条件,应该替换成WHERE
子句;因为WHERE
可以在执行分组操作和计算聚合函数之前过滤掉不需要的数据,性能会更好。下面示例中的语句 1 应该替换成语句 2:
1 | -- 语句 1 |
当然,WHERE
和HAVING
可以组合在一起使用。例如:
1 | select dept_id, count(*) |
该语句返回了月薪大于 10000 的员工人数大于 1 的部门;WHERE
用于过滤月薪大于 10000 的员工;HAVING
用于过滤员工数量大于 1 的部门。
WHERE 与 ON
当查询涉及多个表的关联时,我们既可以使用WHERE
子句也可以使用ON
子句指定连接条件和过滤条件。这两者之间的主要区别在于:
- 对于内连接(inner join)查询,
WHERE
和ON
中的过滤条件等效; - 对于外连接(outer join)查询,
ON
中的过滤条件在连接操作之前执行,WHERE
中的过滤条件(逻辑上)在连接操作之后执行。
对于内连接查询而言,以下三个语句的结果相同:
1 | -- 语句 1 |
语句 1 在WHERE
中指定连接条件和过滤条件;语句 2 在ON
中指定连接条件和过滤条件;语句 3 在ON
中指定连接条件,在WHERE
中指定其他过滤条件。上面语句不但结果相同,数据库的执行计划也相同。以 MySQL 为例,以上语句的执行计划如下:
1 | id|select_type|table|partitions|type |possible_keys |key |key_len|ref |rows|filtered|Extra| |
尽管如此,仍然建议将两个表的连接条件放在ON
子句中,将其他过滤条件放在WHERE
子句中;这样语义更加明确,更容易阅读和理解。对于上面的示例而言,推荐使用语句 3 的写法。
数据库在通过连接两张或多张表来返回记录时,都会生成一张中间的临时表,然后再将这张临时表返回给用户。
在使用 left join 时,on 和 where 条件的区别如下:
1、on 条件是在生成临时表时使用的条件,它不管 on 中的条件是否为真,都会返回左边表中的记录。
2、where 条件是在临时表生成好后,再对临时表进行过滤的条件。这时已经没有 left join 的含义(必须返回左边表的记录)了,条件不为真的就全部过滤掉。
假设有两张表:
表1:tab1
1 | id size |
表2:tab2
1 | size name |
两条SQL:
1 | 1、select * from tab1 left join tab2 on tab1.size = tab2.size where tab2.name='AAA' |
第一条SQL的过程:
1、中间表
on 条件:
1 | tab1.size = tab2.size |
2、再对中间表过滤
where 条件:
tab2.name=’AAA’
1 | tab1.id tab1.size tab2.size tab2.name |
第二条SQL的过程:
1、中间表
on 条件:
1 | tab1.size = tab2.size and tab2.name='AAA' |
其实以上结果的关键原因就是 left join,right join,full join 的特殊性。
不管 on 上的条件是否为真都会返回 left 或 right 表中的记录,full 则具有 left 和 right 的特性的并集。
而 inner jion 没这个特殊性,则条件放在 on 中和 where 中,返回的结果集是相同的。
补充
SQL标准要求HAVING必须仅引用GROUP BY子句中的列或聚合函数中使用的列。 但是,MySQL支持对此行为的扩展,并允许HAVING引用SELECT列表中的列和外部子查询中的列。
如果HAVING子句引用了不明确的列,则会出现警告。在下面的语句中,col2不明确,因为它同时用作别名和列名:
1
SELECT COUNT(col1) AS col2 FROM t GROUP BY col2 HAVING col2 = 2;
优先考虑标准SQL行为,因此如果HAVING使用的列名同时出现在GROUP BY和输出列列表使用的别名中,则会优先选择GROUP BY列中的列名。
不要对应该出现在WHERE子句中的项使用HAVING。例如,不要写下面的内容
1
SELECT col_name FROM tbl_name HAVING col_name > 0;
改为写这个:
1
SELECT col_name FROM tbl_name WHERE col_name > 0;
HAVING子句可以引用聚合函数,而WHERE子句不能
1
SELECT user, MAX(salary) FROM users GROUP BY user HAVING MAX(salary) > 10;
参考链接:
https://blog.csdn.net/horses/article/details/105380420
https://www.runoob.com/w3cnote/sql-different-on-and-where.html