mysql中JOIN查询的性能优化技巧与策略

5次阅读

LEFT JOIN 比 INNER JOIN 慢因需保留左表全部记录并补 NULL，无法提前剪枝，常触发嵌套循环与 join buffer；右表 ON 字段须有匹配索引，WHERE 过滤右表会转为 INNER JOIN；EXPLAIN 中 key 为空、rows 过大、type 为 ALL/index、Extra 含 Using temporary/filesort 均提示性能风险；驱动表应选 WHERE 过滤后行数更少者，非物理大小；禁用 ON 中函数、多层嵌套 JOIN 及 TEXT/BLOB 参与 JOIN。

mysql 中 JOIN 查询的性能优化技巧与策略

因为 LEFT JOIN 必须保留左表全部记录，即使右表没有匹配项也要补 NULL，导致 MySQL 无法像 INNER JOIN 那样提前剪枝。执行计划里常看到Using where; Using join buffer，说明它在用缓存做嵌套循环，数据量一大就卡。

确认是否真需要 LEFT JOIN：很多业务场景其实能改成 INNER JOIN，比如查“用户及其订单”，若只要已下单用户，就别用 LEFT
右表的 ON 字段必须有索引，且类型、字符集、排序规则要和左表完全一致，否则索引失效
避免在 LEFT JOIN 的右表条件中写 WHERE 子句过滤右表字段（如WHERE o.status = 'paid'），这会把 LEFT JOIN 逻辑转成 INNER JOIN，还可能让优化器误判执行顺序

直接看 EXPLAIN 输出里的 key 和rows列：key为空或为 NULL，基本没走索引；rows 值远大于实际匹配行数，说明扫描范围过大。

对多表 JOIN，EXPLAIN的 table 顺序就是 MySQL 实际连接顺序，优化器不一定会按 SQL 写的顺序执行，所以 STRAIGHT_JOIN 有时反而更可控
type列要是 ref 或eq_ref才健康，ALL或 index 意味着全表 / 全索引扫描
如果 Extra 里出现 Using temporary 或Using filesort，说明 JOIN 后还触发了临时表或排序，得拆查询或加覆盖索引

所谓“小表”不是指物理大小，而是 JOIN 过程中 ** 参与循环的行数更少的那张表 **。MySQL 默认用驱动表（outer table）去逐行探测被驱动表（inner table），所以驱动表越小，总探测次数越少。

用 EXPLAIN 看rows列预估行数，选预估结果更小的作为左表（INNER JOIN）或主表（LEFT JOIN）
别只看 COUNT(*)，要考虑 WHERE 条件过滤后的实际结果集大小。比如users WHERE status = 'active' 可能只有 1 万行，而 orders 有 500 万行，但 orders WHERE created_at > '2024-01-01' 只剩 2 万行——这时候后者更适合作驱动表
用 STRAIGHT_JOIN 强制顺序时，确保自己算得准，否则可能比优化器还差

这些写法看着简洁，实则极易触发全表扫描或临时表，线上务必规避：

SELECT u.name, COUNT(o.id) FROM users u LEFT JOIN orders o ON u.id = o.user_id GROUP BY u.id;

问题在于：没加 WHERE 限制用户范围，users全表被加载进内存做 GROUP BY，orders也全表关联。正确做法是先缩小驱动表范围：

SELECT u.name, IFNULL(cnt, 0) AS order_count FROM users u LEFT JOIN (SELECT user_id, COUNT(*) AS cnt   FROM orders   WHERE created_at >= '2024-01-01'   GROUP BY user_id ) o ON u.id = o.user_id WHERE u.status = 'active';

禁止在 ON 条件里用函数或表达式（如ON u.id = CAST(o.user_id AS SIGNED)），索引必然失效
避免多层嵌套 JOIN（超过 4 张表），优先考虑应用层分步查询 + 内存关联
TEXT/BLOB 字段尽量不在 JOIN 条件或 SELECT 里出现，它们会迫使 MySQL 使用磁盘临时表

实际调优时，最常被忽略的是驱动表的选择依据——它取决于过滤后的行数，而不是建表时的数据量，也不取决于表名长短或字段多少。

发表于：数据库

近两天内

# ai # count # mysql # NULL # select # sql # table # using # 为什么 # 循环 # 性能优化

复制链接

转载说明：转载本网站任何内容，请按照转载方式正确书写本站原文地址。本站提供的一切软件、教程和内容信息仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。本站信息来自网络，版权争议与本站无关。

如何使用mysql实现新手项目结构_mysql项目数据库结构示例

如何实现读写分离_mysql并发架构设计

SQL隔离级别怎么选_不同业务场景选择技巧【技巧】

mysql数据库恢复失败怎么排查_mysql数据库恢复失败后如何进行问题排查与恢复

VSCode的Auto Rename Tag：自动重命名配对的HTML标签

mysql中JOIN查询的性能优化技巧与策略

为什么LEFT JOIN 比 INNER JOIN 更慢？

如何判断 JOIN 是否走了索引？

小表驱动大表到底怎么选？

哪些 JOIN 写法会直接拖垮性能？

LinuxDevOps权限管理教程_发布权限与审计实践

Linux磁盘故障排查流程_只读与损坏场景解析【教程】

如何校验mysql配置是否生效_mysql配置验证方法

C++中的堆内存和栈内存有什么区别？(手动管理与自动分配)

javascript如何保证代码安全_有哪些常见的前端安全漏洞需要防范？

静鱼导航带后台导航引导页

如何使用Golang优化日志级别过滤_减少不必要输出开销

Python条件分支优化_复杂判断拆解说明【指导】