innodb如何保证持久性_mysql redo日志说明

InnoDB 通过 redo 日志保证事务持久性：事务提交后，修改先写入 redo 日志（物理逻辑日志，顺序写、高效紧凑），崩溃时从 checkpoint 开始重放已提交事务的变更；关键参数 innodb_flush_log_at_trx_commit=1 可确保强持久性。

InnoDB 通过 redo 日志（重做日志）来保证事务的持久性。持久性是指：一旦事务提交（COMMIT），即使数据库发生崩溃，该事务对数据的修改也必须永久保存、不可丢失。InnoDB 不直接将数据页刷盘，而是先写 redo 日志，再异步刷数据页；崩溃恢复时，用已落盘的 redo 日志重放（replay）未写入磁盘的数据变更，从而确保已提交事务不丢失。

redo 日志的核心作用：记录物理变更

redo 日志记录的是“物理逻辑日志”——不是 SQL 语句，也不是完整的数据页，而是针对某个表空间中某一页的某个偏移量上的字节修改（如“把第 5 号页 offset=100 处的 4 字节从 0x1234 改为 0x5678”）。这种细粒度记录方式高效、紧凑，且与恢复强绑定。

写入速度快：顺序写磁盘（通常在 ib_logfile* 文件中），避免随机 I/O
无需加锁：每个事务写自己的 redo log buffer，由后台线程统一刷盘
只记录已提交或可能提交的变更：未提交事务的日志也会写入，但崩溃恢复时会结合 undo 日志回滚未提交部分

redo 日志的生命周期：从内存到磁盘再到应用

事务执行过程中，InnoDB 将修改操作先写入内存中的 redo log buffer；随后按策略刷入磁盘上的 redo log file（默认两个文件轮转使用）；最后在 checkpoint 机制推动下，脏页被刷新到数据文件（ibd）中。

log buffer 刷盘时机：事务提交时（innodb_flush_log_at_trx_commit = 1）、buffer 占满约 1/2、主线程每秒刷一次、或脏页刷新前强制刷
log file 循环写入：日志空间固定（由 innodb_log_file_size × innodb_log_files_in_group 决定），写满后从头覆盖，前提是对应位置的变更已刷入数据文件（即 checkpoint 已推进）
checkpoint 推进：表示“该位置之前的日志所对应的脏页，已全部刷盘”，是日志复用和崩溃恢复起点的关键标记

崩溃恢复：靠 redo 日志重放保障持久性

MySQL 启动时若检测到异常关闭，会自动进入恢复流程：读取 redo 日志，从最近一个 checkpoint 开始扫描，对其中所有已提交事务的修改进行重放（apply），将变更重新写入 Buffer Pool，并最终刷入磁盘数据文件。

只重放 已提交事务 的日志（未提交的会被后续 undo 回滚）
重放过程不依赖 binlog，完全由 InnoDB 自主完成
即使数据页损坏或未写入，只要 redo 日志完整，就能重建出正确状态

关键参数影响持久性行为

实际部署中，innodb_flush_log_at_trx_commit 是控制持久性强度的核心参数：

=1（默认）：每次事务提交都触发一次 fsync 到磁盘，最安全，满足 ACID 持久性要求
=0：每秒一次 fsync，事务提交仅写入 log buffer，崩溃可能丢失 1 秒内提交的事务
=2：每次提交写入 OS cache，但不 fsync；操作系统崩溃可能丢日志，但 MySQL 崩溃不丢

生产环境强烈建议保持为 1，尤其涉及资金、订单等关键业务。