PostgreSQL — 基于 Recovery 流复制的数据备份
Recovery 流复制
早在 PostgreSQL 9.1 推出的 pg_basebackup 工具,用来搭建流复制的备库。
- PG SQL 版本:9.3
- 主库 IP:
- 备库 IP:
- 创建复制用户。
ENCRYPTED PASSWORD 'rep123us345er';
- 1
- 2
- 3
- 4
- 5
- 设置 pg_hba.conf,添加以下:
host replication repuser md5
- 1
- 设置主库 postgresql.conf
checkpoint_segments = 16
archive_mode = on
archive_command = '/bin/date'
max_wal_senders = 3
wal_keep_segments = 16
max_wal_senders = 3
- 1
- 2
- 3
- 4
- 5
- 6
- 重载配置文件
$ pg_ctl reload -D $PGDATA
- 1
- 查看表空间目录
postgres=# \db List of tablespaces
Name | Owner | Location ---------------+----------+-------------------------------------
pg_default | postgres |
pg_global | postgres |
tbs_francs | postgres | /database/pg93/pg_tbs/tbs_francs
tbs_source_db | postgres | /database/pg93/pg_tbs/tbs_source_db
(4 rows)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 查看数据目录
$ echo $PGDATA
- 1
- 2
- 创建表空间目录和数据目录并赋权
$ mkdir -p /database/pg93/pg_tbs/tbs_francs
$ mkdir -p /database/pg93/pg_tbs/tbs_source_db
[root@redhat6 pgsql9.3beta1]# mkdir -p /database/pg93/pg_root $ chown -R pg93:pg93 /database/pg93/pg_tbs/tbs_francs
$ chown -R pg93:pg93 /database/pg93/pg_tbs/tbs_source_db
$ chown -R pg93:pg93 /database/pg93/pg_root
$ chmod 0700 /database/pg93/pg_root
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 创建 .pgpass
$ cat .pgpass
$ chmod 0600 .pgpass
- 1
- 2
- 3
- 4
- 使用 pg_basebackup 生成备库
$ pg_basebackup -D /database/pg93/pg_root -Fp -Xs -v -P -h -p 1925 -U repuser transaction log start point: 1/1B000024 on timeline 1
pg_basebackup: starting background WAL receiver
651493/651493 kB (100%), 3/3 tablespaces transaction log end point: 1/1B0000DC
pg_basebackup: waiting for background process to finish streaming ...
pg_basebackup: base backup completed
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
这时表空间目录,数据($PGDATA)目录都复制过来了,这里使用了 -X 参数,在备份完成之后,会到主库上收集 pg_basebackup 执行期间产生的 WAL 日志,在 9.2 版本之后支持 -Xs 即 stream(流)形式,这种模式不需要收集主库的 WAL 文件,而能以 stream 复制方式直接同步主库。
- 设置备库 postgresql.conf
hot_standby = on
- 1
- 设置从库 recovery.conf
$ cp /opt/pgsql9.3beta1/share/recovery.conf.sample recovery.conf
# vi recovery.conf
standby_mode = on
primary_conninfo = 'host= port=1925 user=repuser'
trigger_file = '/database/pg93/pg_root/postgresql.trigger.1925'
- 1
- 2
- 3
- 4
- 5
- 6
- 启动服务
$ pg_ctl start -D $PGDATA
server starting
- 1
- 2
- 查看备库进程
$ ps -ef | grep pg93
pg93 31398 1 0 21:09 pts/0 00:00:00 /opt/pgsql9.3beta1/bin/postgres -D /database/pg93/pg_root
pg93 31399 31398 0 21:09 ? 00:00:00 postgres: logger process pg93 31400 31398 0 21:09 ? 00:00:00 postgres: startup process waiting for 00000001000000010000001A
pg93 31401 31398 0 21:09 ? 00:00:00 postgres: checkpointer process pg93 31402 31398 0 21:09 ? 00:00:00 postgres: writer process pg93 31403 31398 0 21:09 ? 00:00:00 postgres: stats collector process pg93 31404 31398 0 21:09 ? 00:00:00 postgres: wal receiver process
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 查看主库进程
$ ps -ef | grep pg93
pg93 2504 1 0 Jun28 ? 00:00:26 /opt/pgsql9.3beta1/bin/postgres -D /database/pg93/pg_root
pg93 2505 2504 0 Jun28 ? 00:00:00 postgres: logger process pg93 2507 2504 0 Jun28 ? 00:00:08 postgres: checkpointer process pg93 2508 2504 0 Jun28 ? 00:00:28 postgres: writer process pg93 2509 2504 0 Jun28 ? 00:00:08 postgres: wal writer process pg93 2510 2504 0 Jun28 ? 00:00:19 postgres: autovacuum launcher process pg93 2511 2504 0 Jun28 ? 00:00:00 postgres: archiver process last was 000000010000000100000019.00000024.backup
pg93 2512 2504 0 Jun28 ? 00:00:44 postgres: stats collector process pg93 31898 2504 0 21:09 ? 00:00:00 postgres: wal sender process repuser idle
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 主库
$ psql
psql (9.3beta1)
Type "help" for help. postgres=# create table test_1 (id int4,create_time timestamp(0) without time zone);
CREATE TABLE postgres=# insert into test_1 values (1,now());
INSERT 0 1 postgres=# select * from test_1;
id | create_time
1 | 2013-07-01 21:15:34
(1 row)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 备库
$ psql
psql (9.3beta1)
Type "help" for help. postgres=# select * from test_1 ;
id | create_time
1 | 2013-07-01 21:15:34
(1 row)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- restore_command (string):获取 WAL 文件的一个已归档段的 Shell 指令。这个参数是归档恢复所必需的,但是对于流复制是可选的。
restore_command = 'cp /mnt/server/archivedir/%f "%p"'
- 1
- archive_cleanup_command (string):清除不再被备份服务器需要的旧的已归档 WAL 文件。%r 会被替换为包含最后一个可用重启点的文件的名称。因此比 %r 更早的所有文件可以被安全地移除。
archive_cleanup_command = 'pg_archivecleanup /mnt/server/archivedir %r'
- 1
- recovery_end_command (string):归档恢复结束后执行的指令。目的是为复制或恢复之后的清除提供一种机制。与 archive_cleanup_command 相似,任何 %r 会被替换为包含最后一个可用重启点的文件的名称。
默认情况下,恢复会一直恢复到 WAL 日志的末尾。在 recovery_target、recovery_target_lsn、recovery_target_name、recovery_target_time 和 recovery_target_xid 中,最多只能使用一个,如果在配置文件中使用了多个,将使用最后一个。
- recovery_target = ‘immediate’:指定恢复应该在达到一致状态后尽快结束。在从一个在线备份中恢复时,这意味着备份结束的那个点。
- recovery_target_name (string):指定 pg_create_restore_point() 所创建的已命名的恢复点,进行恢复。
- recovery_target_time (timestamp):指定按时间戳恢复。
- recovery_target_xid (string):指定按事务 ID 进行恢复。
- recovery_target_lsn (pg_lsn):指定按继续进行的预写日志位置的 LSN 进行恢复。
- recovery_target_inclusive (boolean):指定是否仅在指定的恢复目标之后停止(true), 或者仅在恢复目标之前停止(false)。 适用于 recovery_target_lsn、recovery_target_time 或者 recovery_target_xid被 指定的情况。这个设置分别控制事务是否有准确的目标 WAL 位置(LAN)、提交时间或事务 ID 将被包括在该恢复中。 默认值为 true。
- recovery_target_timeline (string):指定恢复到一个特定的时间线中。默认值是沿着基础备份建立时的当前时间线恢复。将这个参数设置为 latest 会恢复到该归档中能找到的最新的时间线。
- recovery_target_action (enum):指定在达到恢复目标时服务器应该立刻采取的动作,包括 pause(暂停)、promote(接受连接)、shutdown(停止服务器),其中 pause 为默认动作。
- standby_mode (boolean):on 表示作为一个备库,否则作为主库。为 on 时,当到达已归档 WAL 末尾时该服务器将不会停止恢复,但是将通过使用r estore_command 获得新的 WAL 段以及/或者通过使用 primary_conninfo 设置连接到主服务器来尝试继续恢复。
- primary_conninfo (string):指定备库用来连接主库的连接字符串。
- primary_slot_name (string):有选择地指定通过流复制连接到主库时,使用一个现有的复制槽来控制上游节点上的资源移除。如果没有设置 primary_conninfo 则这个设置无效。
- promote_trigger_file (string):指定一个触发器文件,如果该文件存在,则会结束备库中的恢复,即升级备库为一个独立的主库。即使这个值没有被设置,你也可以通过 pg_ctl promote 来提升备库。如果 standby_mode 为 off,那么这个设置没有效果。
- recovery_min_apply_delay (integer):允许你将恢复延迟一段固定的时间,如果没有指定单位则以毫秒为单位。例如,如果你设置这个参数为 5min,对于一个事务提交,只有当备库上的系统时钟超过主库报告的提交时间至少 5 分钟时,备库才会重放该事务。
注意:当 synchronous_commit 被设置为 remote_apply 时,同步复制会受到这个设置的影响,每一个 COMMIT 都需要等待被应用。
PostgreSQL 12 的 Recovery
PostgreSQL 12 的一个重要变化就是将 Recovery.conf 文件参数合并到了 postgresql.conf。之前版本 PostgreSQL 的流复制备库是通过在 $PGDATA 目录中创建 recovery.conf 文件来标识的,这是流复制部署的重要文件,若 $PGDATA 目录下不存在此文件,数据库无法以流复制备库角色启动。PostgreSQL 12 之后 recovery.conf 不再使用,若 recovery.conf 文件存在,数据库将无法启动。
- 新增 recovery.signal 标识文件,表示数据库处于 recovery 模式。
- 新增加 standby.signal 标识文件,表示数据库处于 standby 模式。
- trigger_file 参数更名为 promote_trigger_file。
- standby_mode 参数不再支持。
pg_basebackup 命令差异
12 版本pg_basebackup 命令的 -R 参数的效果和之前不同,主要体现在:
- 命令执行后在 $PGDATA 目录创建 standby.signal 标识文件,文件内容为空。
- 命令执行后在 $PGDATA 目录的 文件中添加 primary_conninfo 参数信息。
- 点赞
- 收藏
- 关注作者