SQL WITH RECURSIVE 递归 CTE 的深度限制与循环检测方法

postgresql 中 with recursive 默认无硬性行数限制,但 max_recursive_depth 默认值为100(仅14+支持),实际深度受statement_timeout和内存限制,通常100–1000层即报错。

SQL WITH RECURSIVE 递归 CTE 的深度限制与循环检测方法

PostgreSQL 中 WITH RECURSIVE 默认深度限制是多少

默认没有硬性行数限制,但有 max_recursive_depth 配置项(仅 PostgreSQL 14+ 支持),且受 statement_timeout 和内存实际消耗制约。多数生产环境卡在 100–1000 层就因超时或 OOM 报错。

实操建议:

  • max_recursive_depth 默认值是 100,可通过 SET max_recursive_depth = 500 临时调高,但不推荐无节制放宽
  • 更稳妥的做法是用 UNION ALL + 显式层级计数,在递归 CTE 内加 level 列并用 WHERE level 截断
  • 注意:MySQL 8.0 的 WITH RECURSIVE 默认上限是 1000,由系统变量 cte_max_recursion_depth 控制,超出直接报错 ERROR 3636

如何让递归 CTE 自动检测并终止循环引用

递归 CTE 本身不自动检测循环,必须手动维护路径或已访问节点集合。否则遇到自关联或环状图结构(如员工-上级、组织架构、地区包含关系),会无限循环直到超时或达到深度上限。

实操建议:

  • 用数组记录路径:ARRAY[employee_id] 初始,每次递归 array_append(path, next_id),再用 next_id = ANY(path) 判断是否成环
  • PostgreSQL 可用 ARRAY_POSITION(path, next_id) IS NOT NULL 更明确地表达意图
  • 避免用字符串拼接路径(如 '/1/2/3/'),既难维护又易被注入或截断;也别依赖 DISTINCT ON 替代环检测——它只去重不防循环

UNION vs UNION ALL 在递归 CTE 中的实质区别

关键不在“去重”,而在于是否触发循环终止逻辑。只有 UNION 会隐式比较所有列并丢弃重复行,这恰好能拦住部分简单环(比如 A→B→A);UNION ALL 则完全不管,必须靠人工判断。

实操建议:

  • 不要依赖 UNION 防环——它只对“完全相同行”生效,而环常表现为不同字段组合(如 (id=1, parent=2) → (id=2, parent=1),两行并不重复)
  • UNION 带来明显性能开销:每轮递归都要做哈希或排序去重,数据量稍大就慢几个数量级
  • 绝大多数场景应选 UNION ALL + 显式环检测,控制力更强、性能更可预期

SQL Server 的 MAXRECURSION 提示怎么用才不踩坑

SQL Server 不支持标准 WITH RECURSIVE,而是用 OPTION (MAXRECURSION n) 附加在查询末尾。这个提示不是配置,也不是函数参数,写错位置或类型就会静默失效。

实操建议:

  • 必须放在语句最末,紧贴 ; 前,例如:SELECT ... OPTION (MAXRECURSION 500);
  • n 取值范围是 0–32767;0 表示无限制(危险!慎用),不是“不限制”而是“用服务器默认值(100)”
  • 如果递归结果集超过 MAXRECURSION,报错信息是 Msg 530,不是超时或语法错误,容易误判

环检测和深度控制从来不是数据库替你兜底的事,得在 CTE 的 SELECT 里写清楚路径、层级、存在性检查——不然报错时你连是数据问题还是逻辑漏洞都分不清。