
本文详解如何使用 flask 接收用户输入、调用 matplotlib 的 pdfpages 生成多页 pdf,并通过 send_from_directory 安全响应下载请求,避免线程阻塞与路径错误。
本文详解如何使用 flask 接收用户输入、调用 matplotlib 的 pdfpages 生成多页 pdf,并通过 send_from_directory 安全响应下载请求,避免线程阻塞与路径错误。
在 Flask 中动态生成并提供 PDF 文件(如由 matplotlib.backends.backend_pdf.PdfPages 创建的报告),关键在于分离用户交互、文件生成与静态资源分发。原始代码中直接使用 input() 会导致主线程阻塞(尤其在 macOS 上触发 NSWindow drag regions 异常),且硬编码路径、未处理 POST 请求、依赖本地终端输入,完全违背 Web 应用无状态、异步响应的设计原则。
以下是推荐的生产就绪型实现方案:
✅ 正确架构:表单提交 → 后端生成 → 临时存储 → 安全下载
from flask import Flask, request, render_template_string, send_from_directory from matplotlib.figure import Figure from matplotlib.backends.backend_pdf import PdfPages import os import tempfile import datetime app = Flask(__name__) # 配置 PDF 存储目录(使用 instance_path 更符合 Flask 最佳实践) PLOTS_DIR = os.path.join(app.instance_path, 'plots') os.makedirs(PLOTS_DIR, exist_ok=True) def plotting_function(output_path: str, param1: str, param2: str): """模拟你的绘图逻辑:生成多页 PDF 并写入 metadata""" with PdfPages(output_path) as pdf: # 示例:生成 3 个子图页 for i in range(1, 4): fig = Figure(figsize=(8, 6)) ax = fig.subplots() ax.plot([0, 1, 2, 3], [i, i+1, i-1, i*2], label=f'Plot {i}') ax.set_title(f'Parameter: {param1}, Variant: {param2} — Page {i}') ax.legend() pdf.savefig(fig) fig.clear() # 释放内存 # 设置 PDF 元数据(可选但推荐) info = pdf.infodict() info['Title'] = f'Report for {param1}' info['Author'] = 'Flask-PDF Generator' info['Subject'] = 'Automated Plot Report' info['Keywords'] = f'{param1} {param2} matplotlib pdf' info['CreationDate'] = datetime.datetime.now() info['ModDate'] = datetime.datetime.now() @app.route('/', methods=['GET', 'POST']) def index(): if request.method == 'POST': # ✅ 安全获取表单字段(非 input()!) param1 = request.form.get('param1', '').strip() param2 = request.form.get('param2', '').strip() if not (param1 and param2): return "⚠️ 参数不能为空,请返回重试", 400 # ✅ 使用临时目录确保线程安全 & 自动清理 with tempfile.TemporaryDirectory(dir=PLOTS_DIR) as tmpdir: filename = f"plots_for_{param1.lower()}.pdf" filepath = os.path.join(tmpdir, filename) try: plotting_function(filepath, param1, param2) # ✅ 直接发送临时文件(Flask 自动处理流式响应) return send_from_directory( tmpdir, filename, as_attachment=True, download_name=filename # Flask 2.1+ 推荐用 download_name 替代 deprecated as_attachment=True 的歧义 ) except Exception as e: app.logger.error(f"PDF generation failed: {e}") return f"❌ 生成 PDF 失败:{e}", 500 # GET 请求:渲染 HTML 表单 return render_template_string(''' <!DOCTYPE html> <html> <head><title>PDF 报告生成器</title></head> <body> <h2>配置参数并生成 PDF 报告</h2> <form method="post"> <div style="margin: 1em 0;"> <label for="param1">参数 1(例如:实验组名):</label> <input type="text" id="param1" name="param1" required /> </div> <div style="margin: 1em 0;"> <label for="param2">参数 2(例如:时间范围):</label> <input type="text" id="param2" name="param2" required /> </div> <button type="submit" style="padding: 0.5em 1em;">生成 PDF</button> </form> </body> </html> ''') # 可选:添加健康检查或静态文件服务路由 @app.route('/health') def health(): return {"status": "ok", "plots_dir": PLOTS_DIR}
? 关键要点说明
- 禁止 input():Web 应用无法访问终端 stdin,input() 会挂起主线程并引发平台级异常(如 macOS 的 NSInternalInconsistencyException)。必须改用 HTML 表单 + HTTP POST。
- 路径安全:send_from_directory 是唯一安全的文件响应方式,它自动校验路径防止目录遍历攻击(如 ../../../etc/passwd)。绝不可用 send_file(open(…)) 或拼接字符串路径。
- 临时文件管理:tempfile.TemporaryDirectory() 确保每次请求独立隔离,退出 with 块后自动删除,避免磁盘泄漏和并发冲突。
- 错误处理:捕获 plotting_function 异常并返回 HTTP 错误码,便于前端调试;日志记录便于运维排查。
- 元数据增强:为 PDF 添加 Title/Author 等信息,提升专业性与可追溯性。
? 运行前准备
- 创建 Flask 实例目录结构:
mkdir -p instance/plots
- 安装依赖:
pip install flask matplotlib
- 启动应用(开发环境):
export FLASK_APP=app.py export FLASK_ENV=development flask run --host=127.0.0.1 --port=5000
访问 http://127.0.0.1:5000 即可测试。
此方案兼顾安全性、可维护性与用户体验,是 Flask 动态 PDF 生成的标准实践。如需支持大文件流式传输或异步生成(Celery),可在本基础之上扩展。