
为什么EXPLAIN显示Nested Loop,但实际慢得离谱
因为优化器误判了驱动表的行数,拿了一个本该返回10万行的表当驱动表,导致内层循环执行10万次——哪怕内层有索引,IO和CPU开销也撑不住。
常见错误现象:EXPLAIN里type是ALL或index,rows列显示值远低于真实扫描行数;Extra里出现Using join buffer (Block Nested Loop),说明已退化成全量缓存匹配。
立刻检查两表的统计信息是否过期:ANALYZE TABLE table_a, table_b;(MySQL)或ANALYZE table_a, table_b;(PostgreSQL)确认JOIN字段是否有有效索引:驱动表的JOIN列必须有索引,被驱动表的JOIN列**必须**有索引(否则必走全表扫描)避免在JOIN条件中对字段做函数操作,比如ON UPPER(a.name) = UPPER(b.name)会失效索引
LEFT JOIN变INNER JOIN的隐式过滤陷阱
只要在WHERE子句里对右表字段加非空条件,LEFT JOIN就等价于INNER JOIN——不仅语义错,还让优化器放弃使用左表驱动策略,可能选错执行顺序。
使用场景:想查“所有用户及其最新订单”,但又只想要有订单的用户,结果写成LEFT JOIN orders ON … WHERE orders.status = ‘paid’,这时orders表被强制要求非NULL,LEFT失效。
正确做法:把右表过滤条件挪到ON子句里,如LEFT JOIN orders ON users.id = orders.user_id AND orders.status = ‘paid’如果确实需要后过滤,且必须保留LEFT语义,用WHERE orders.status = ‘paid’ OR orders.status IS NULL(但慎用,可能干扰索引选择)PostgreSQL中可加/*+ Leading(users) */提示(需启用pg_hint_plan),MySQL 8.0+可用/*+ JOIN_PREFIX(t1, t2) */干预连接顺序
小表驱动大表不总是最优:统计偏差比大小更重要
“小表驱动大表”是经验法则,但真正决定性能的是**估算驱动表输出行数 × 被驱动表单次查找成本**。如果小表经过WHERE过滤后只剩1行,而大表有索引且查询快,那它就是好驱动表;反之,一个“小”维度表若没索引、或过滤后膨胀成几十万行,它就是灾难源头。
参数差异:EXPLAIN FORMAT=JSON里的filtered字段(百分比)乘以rows,才是优化器认为的驱动表实际输出行数。
用SELECT COUNT(*) FROM table WHERE your_where_condition;手动验证过滤后行数,对比EXPLAIN的rows × filtered/100对高基数字段(如user_id)建索引效果明显;对低基数字段(如status),单独建索引意义不大,考虑组合索引MySQL 5.7+开启optimizer_switch=’use_index_extensions=on’可提升组合索引利用率
JOIN字段类型不一致引发的隐式转换
当users.id是BIGINT,orders.user_id是VARCHAR时,MySQL会把所有users.id转成字符串比较——驱动表索引失效,被驱动表无法用索引快速定位,双重打击。
错误信息典型表现:EXPLAIN中type为ALL,key列为NULL,Extra出现Using where; Using join buffer。
用SHOW CREATE TABLE核对两边JOIN字段的类型、长度、字符集(尤其注意VARCHAR(20) vs VARCHAR(32))修复方案优先改表结构:ALTER TABLE orders MODIFY user_id BIGINT UNSIGNED;,而非在SQL里加CAST()(会阻止索引下推)PostgreSQL对类型不一致更严格,直接报错operator does not exist,反而不容易踩坑事情说清了就结束。最常被忽略的,是统计信息更新滞后和JOIN字段隐式转换——它们不会报错,但会让执行计划彻底偏离预期,而且问题在测试环境往往不暴露。

评论(0)