SQL窗口函数性能问题_窗口分区与排序优化

窗口函数性能瓶颈主要源于分区和排序设计不合理：分区粒度过细、排序字段无索引、窗口帧过宽或未提前过滤数据均会导致性能下降；应优选低基数分区键、建立复合索引、限制帧范围并考虑物化中间结果。

窗口函数性能瓶颈，往往不在于函数本身，而在于分区（PARTITION BY）和排序（ORDER BY）的设计是否合理。没必要的分区粒度太细、排序字段无索引、或在大结果集上重复计算，都会显著拖慢查询。

分区越细，并行处理单元越多，但调度开销和内存占用也越高。例如按 user_id 分区查每个用户的最新订单，若用户量达千万级，就会生成海量分区上下文，导致 CPU 和内存压力陡增。

窗口函数中带 ORDER BY（尤其是需要 ROWS BETWEEN 或累计计算时），数据库必须对每个分区内部排序。若排序字段无索引，就会触发大量临时磁盘排序（External Sort），I/O 成为瓶颈。

复合索引应覆盖 PARTITION BY + ORDER BY 字段，顺序一致。例如 PARTITION BY dept_id ORDER BY hire_date，对应索引应为 (dept_id, hire_date)
避免在表达式上排序，如 ORDER BY UPPER(name) —— 无法利用普通索引，需函数索引且慎用
若仅需 ROW_NUMBER() OVER (PARTITION BY x) 且不指定 ORDER BY，数据库可能跳过排序；但显式写 ORDER BY x 却无索引，反而强制排序

窗口帧（frame）越宽，每行需扫描的相邻行越多。默认 RANGE UNBOUNDED PRECEDING 在累计场景中可能遍历整个分区，性能随分区大小线性恶化。

当同一窗口逻辑被多次引用（如同时要 ROW_NUMBER()、AVG() OVER()、LAG()），重复计算分区和排序会放大开销。

窗口函数不是银弹，性能优劣取决于你怎么切分、怎么排、怎么框。把分区当“组”，把排序当“队列”，把帧当“视野范围”——设计时多想一步，执行时少等十秒。