可依赖性:安全可靠的基础设施
稳如泰山,坚若磐石,在极端场景下也能保持安全可靠的运行
极致可用:HA PostgreSQL
Pigsty 利用 PostgreSQL 主从物理复制,实现业界领先的高可用方案。
RTO 与 RPO 核心指标可根据需求调整,针对具体场景进行利弊权衡。
- 主库故障切换指标:RTO ≈ 30 秒 (可根据网络条件权衡调整)
- 异步提交高性能模式:RPO ≤ 1MB(可根据业务偏好权衡调整)
- 从库故障闪断:RTO ≈ 0 秒,同步模式数据零丢失:RPO = 0
- 主动切换(Switchover)仅有闪断,极大降低了维护窗口需求
pg-pitr # 恢复到WAL存档终点
pg-pitr -i # 恢复到最近备份时刻
pg-pitr --time=2022-12-30 14:44:44+08 # 恢复到指定的时间点
pg-pitr --name=my-restore-point # 恢复到使用命名位点
pg-pitr --lsn=0/7C82CB8 -X # 在LSN之前立即恢复
pg-pitr --xid=1234567 -X -P # 恢复到指定XID前
pg-pitr --backup=latest # 恢复到最新的备份集
pg-pitr --backup=20221108-105325 # 恢复到特定备份集
删库兜底:预置时间点恢复
Pigsty 默认预置基础备份并启用 WAL 归档,能够迅速回退到任意历史时间点。
无论是本地备份盘还是异地冷备均有成熟方案,提供容灾兜底能力,丰俭由人。
- 业界备份最佳实践深度整合:pgBackRest + MinIO / 本地盘 / S3
- 为软件缺陷与人为失误造成的删集群/删库/删表/删数据提供兜底
- 一键备份还原,免配置开箱即用,可用定时任务灵活制定备份策略
- 原地并发增量 PITR,恢复迅速,可快速重试,便于确定恢复时间点
自给自足:没有外部依赖
Pigsty 整合了 PostgreSQL RDS 的完整基础设施闭包,不需要任何外部依赖。
本地软件源确保运维自主可控,纵使互联网湮灭,亦足以在本地跑到地老天荒。
- 可观测性基础设施:Prometheus / Grafana
- 负载均衡与反向代理:Nginx / HAProxy
- 配置存储与对象存储:Etcd / MinIO
- 关键服务 DNS NTP:DNSMasq / Chronyd
角色名称 | 描述 |
---|---|
dbrole_readonly | 角色:全局只读访问 |
dbrole_readwrite | 角色:全局读写访问 |
dbrole_admin | 角色:管理员/对象创建 |
dbrole_offline | 角色:受限的只读访问 |
postgres | 系统超级用户 |
replicator | 系统复制用户 |
dbuser_dba | pgsql 管理用户 |
dbuser_monitor | pgsql 监控用户 |
访问控制:模型开箱即用
足够安全的默认访问控制模型,读/写/管理/分析/监控/DBA 各司其职。
遵循最小权限原则而精心设计,杜绝未授权访问,开箱即用,便于定制。
- 默认角色:只读 / 读写 / 管理 / 分析
- 默认用户:DBSU / DBA / 复制 / 监控
- 默认 HBA 规则集,简单易用的配置方式
- 连接池用户凭据同步管理,无需单独维护
坚如磐石:机密性保障
自签名CA,全链路SSL加密,密码保护备份与敏感端点,黑白名单严控访问区间。
每个环节均遵循业界最佳实践,为数据安全打造多重防线,密码不丢则数据安全。
- 本地 CA 签发证书,SSL / TLS 默认全局开启
- SCRAM-SHA-256校验,备份数据 AES 加密
- 精密的黑白名单默认策略,避免未授权访问
- 对外暴露的网页服务统一由 Nginx 收口管理
精益求精:完整性校验
通过数据校验和、多副本及延迟从库,防治静默腐坏与数据坏块。
结合审计插件与集中日志,让合规审查与故障排查更加高效透明。
- CRIT配置模板:针对数据完整性优化
- 开启数据校验和,避免静默数据腐坏
- WatchDog:STONITH 避免集群脑裂
- 审计插件日志:集中收集防篡改备查

生产标杆案例
PG集群数量
100+
CPU核数
25,000
除重数据量
200TB
总体可用性
> 99.999%
生产环境稳定运行6年,综合可用性 > 99.999%
实战检验:可用性标杆
Pigsty 已在众多大型组织稳健运行,助力数据库服务保持 99.999%+ 可用性。
滚动式升级,闪断式切换,软硬件维护无需停机,助力实现极致业务连续性。
- 拒绝单点:所有关键组件均有冗余设计,全员高可用
- 在线升级:基于逻辑复制蓝绿部署的不停机迁移方案
- 应急预案:针对各种故障场景提供标准应急预案SOP
- 标杆案例:25,000 vCPU x 六年 x 99.999% 可用性