Go 并发下载需用 goroutine 处理任务、channel 协调状态,并通过带缓冲 channel(如 sem := make(chan struct{}, 5))实现并发控制,配合 WaitGroup 确保 worker 启动完成后再关闭输入 channel。

在 Go 中实现并发文件下载,核心是用 goroutine 处理多个下载任务,用 channel 协调状态、传递结果或控制并发数。不加限制地启动成百上千个 goroutine 可能压垮网络或目标服务器,所以需结合 semaphore(信号量)或带缓冲的 channel 实现并发控制。
用 goroutine + channel 管理下载任务
把待下载的 URL 列表发到一个输入 channel,启动固定数量的工作 goroutine 从该 channel 消费 URL 并执行下载。每个 goroutine 下载完成后,将结果(如文件名、错误)发到输出 channel。主 goroutine 从输出 channel 收集结果,统一处理成功或失败情况。
- 输入 channel 类型建议为
chan string(URL)或自定义结构体(含 URL、保存路径等) - 输出 channel 推荐用
chan DownloadResult,其中DownloadResult包含URL、Filename、Err error - 用
sync.WaitGroup确保所有 worker 启动完成后再关闭输入 channel
限制并发数:用带缓冲 channel 模拟信号量
最轻量的方式是创建一个容量为 N 的 channel(比如 sem := make(chan struct{}, 5)),每个 goroutine 在开始下载前先向它发送一个占位符(sem),下载结束后再取出(<code>)。这样最多只有 5 个 goroutine 同时运行。
- 无需引入额外包,语义清晰,适合中低并发场景(如 3–20)
- 注意避免死锁:确保每个
都有对应 <code>sem,且 recover 或 defer 中也要释放 - 可封装成函数,例如
acquire(sem)和release(sem)
下载逻辑要支持超时和重试
HTTP 下载必须设超时,否则单个卡住会拖慢整个流程。推荐用 http.Client 配合 context.WithTimeout;失败时可简单重试 1–2 次,避免因临时网络抖动导致整体失败。
立即学习 “go 语言免费学习笔记(深入)”;
- 不要用全局默认 client,为每个请求新建带 timeout 的 client 或复用配置好的实例
- 写文件时检查目标目录是否存在,必要时
os.MkdirAll - 用
io.Copy流式写入,避免把整个响应体读进内存
完整流程示例(精简版)
启动 5 个 worker,从 urls 切片生成输入 channel,收集结果并打印统计:
sem := make(chan struct{}, 5) results := make(chan DownloadResult, len(urls)) <p>for _, url := range urls {go func(u string) {sem <- struct{}{} defer func() {<-sem}()</p><pre class="brush:php;toolbar:false;"> filename, err := downloadFile(u) results <- DownloadResult{URL: u, Filename: filename, Err: err} }(url)
}
// 启动收集 goroutine 或在主协程中 range results for i := 0; i ail %s: %v”, res.URL, res.Err) } else {log.Printf(“done %s → %s”, res.URL, res.Filename) } }