group by 千万级数据性能调优
1. 如果GROUP BY 的列没有索引,产生临时表.
2. 如果GROUP BY时,SELECT的列不止GROUP BY列一个,并且GROUP BY的列不是主键 ,产生临时表.
3. 如果GROUP BY的列有索引,ORDER BY的列没索引.产生临时表.
4. 如果GROUP BY的列和ORDER BY的列不一样,即使都有索引也会产生临时表.
5. 如果GROUP BY或ORDER BY的列不是来自JOIN语句第一个表.会产生临时表.
6. 如果DISTINCT 和 ORDER BY的列没有索引,产生临时表.
由于一直产生临时表,所以索引方式不可取
接下来分析mysql的执行顺序:
内联表查询一般的执行过程是:
1、执行FROM语句
2、执行ON过滤
3、添加外部行
4、执行where条件过滤
5、执行group by分组语句
6、执行having
7、select列表
8、执行distinct去重复数据
9、执行order by字句
10、执行limit字句
Mysql 是先执行内联表然后再进行条件查询的最后再分组,一旦先内联之后,数据就变的异常复杂。所以可以尝试一下提前进行分组和条件查询,实现方法就是子查询联合内联查询。
下面三个图区别:千万级别数据时后两者速度是前者的1000倍。
SELECT
<,SUM(a.aa) total,
b.bb
FROM
A a
INNER JOIN
B b
GROUP
优化SQL一:
SELECT
<,b.bb
FROM
(SELECT no,SUM(aa) total FROM A GROUP BY no) a
INNER JOIN
B b
优化SQL二:
SELECT
<,b.bb
FROM
B b,
(SELECT no,SUM(aa) total FROM A GROUP BY no) A a
WHERE
<本文发布于:2024-02-02 20:34:30,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170687726846279.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |