Python 请求限流核心是控制单位时间请求数,避免触发服务端限流或资源耗尽;常用令牌桶模型,可用 asyncio.Semaphore 模拟或 aiolimiter 等库实现,同步场景可用 time.sleep 配合锁,异步高吞吐推荐 aiohttp+Semaphore,生产环境需组合限流、标识、降级与监控。

Python 中实现请求并发控制和限流,核心在于限制单位时间内发起的请求数量,避免触发服务端限流、IP 封禁或自身资源耗尽。关键不是单纯“多开线程”,而是有节制地调度请求节奏。
使用令牌桶(Token Bucket)做请求限流
令牌桶是最常用也最贴近真实业务场景的限流模型:系统以固定速率向桶中添加令牌,每次请求需消耗一个令牌;桶满则丢弃新令牌,无令牌则等待或拒绝。适合应对突发流量,同时保障平均速率可控。
- 用 asyncio.Semaphore 模拟简单令牌桶:初始化时设最大并发数(即桶容量),每次请求前 acquire,完成后 release
- 更精确的实现可结合 time.time() 动态计算令牌生成时间,例如每秒补 10 个令牌,就需记录上次补充时间并按比例发放
- 推荐轻量库 aiolimiter(异步)或 ratelimit(同步),已封装好令牌桶逻辑,支持装饰器用法
基于 time.sleep 的同步请求节流
适用于 requests + threading 场景,逻辑直观、调试方便,适合 QPS 要求不高(如 ≤ 5/s)且不追求高精度的脚本任务。
- 在每次请求前调用 time.sleep(1 / target_qps),例如目标 2 QPS 就 sleep(0.5)
- 注意:sleep 不能解决并发竞争问题,需配合锁(如 threading.Lock)确保计时 / 计数原子性
- 若请求本身耗时波动大(如有的 100ms,有的 2s),单纯 sleep 会导致实际 QPS 偏低,建议改用“固定窗口”或“滑动日志”统计
用 asyncio + aiohttp 实现异步限流
高吞吐场景首选方案。aiohttp 天然支持异步 HTTP 请求,配合信号量与任务队列,可轻松控制并发数与总频次。
立即学习 “Python 免费学习笔记(深入)”;
- 创建 asyncio.Semaphore(n) 控制最大并发连接数(如 n=10)
- 对每个请求 task 加上 async with semaphore:,自动排队阻塞
- 如还需全局 QPS 限制(比如每分钟最多 600 次),可搭配 asyncio.Queue 做请求缓冲,或用 asyncio.create_task() 启动独立限流协程定时清空计数器
生产环境建议:组合策略 + 监控兜底
单一限流机制难以覆盖所有异常,应分层设计:
- 客户端本地限流(如令牌桶)作为第一道防线
- 请求头中带上 X-RateLimit-Client-ID 等标识,便于服务端识别和差异化限流
- 捕获 429(Too Many Requests)、403、连接超时等响应,自动降级(如延长 sleep 时间、切换代理、暂停任务)
- 记录实际请求时间戳与状态,用 Prometheus + Grafana 可视化 QPS、失败率、等待延迟等指标
限流不是为了压测服务端,而是让自己的程序稳定、可预期、易维护。选对模型、配好参数、留出弹性,比盲目堆并发更有价值。