2025 年度数据库世界总结:石破天 vs Andy Pavlo 对谈录
图灵奖得主 + CMU 教授:2025 数据库圈最犀利的一场对话。关于数据库,LLM,Agent,AI 落地的实际效果,程序员的职业生涯……
图灵奖得主 + CMU 教授:2025 数据库圈最犀利的一场对话。关于数据库,LLM,Agent,AI 落地的实际效果,程序员的职业生涯……
上下文窗口经济学,多元持久化的问题,以及零胶水架构的胜利,让 PG 成为 AI 时代的数据库之王。
如何打造一个立足中国,面向全球的 PostgreSQL 数据库发行版?在第八届中国PG生态大会上的主题演讲。
开源免费免翻墙,一键安装PG与431个扩展插件 14个Linux发行版 x 6大PG主版本原生 RPM/DEB。
PostgreSQL官方仓库切断全球镜像站同步通道,开源制成品断供,很好的试出了各家数据库厂商和云厂商的成色。
关于 PostgreSQL 的开发,管理,原理,生态,工具,架构设计,性能优化,故障排查等方面的文章导航。
那些曾经让 MongoDB,MySQL 走向封闭的力量,如今也同样在 PostgreSQL 的生态中发挥作用,PG世界需要一个代表"软件自由"价值观的发行版。
2025 年的 SO 全球开发者调研结果新鲜出炉,PostgreSQL 连续第三年成为全球最流行,最受喜爱,需求量最高的数据库。
PGDG 切断 FTP rsync 同步通道,全球镜像站普遍断连,这次还真是卡了一把全球用户的脖子。
一年一度的 PostgreSQL 开发者大会即将在五月于蒙特利尔举办。同上次第一届 PG Con.Dev 一样,这次也有一天的额外的专场活动 —— Postgres Extensions Day。
Supabase收购的一个PG内核分支,号称解决了PG XID回卷的问题,没有表膨胀问题,性能提升4倍,还支持云原生存储。
PostgreSQL现在可以使用MySQL客户端访问了!愚人节刚开源的openHalo提供了这样的能力,现已加入Pigsty内核全家桶。
利用 JuiceFS,将 PostgreSQL 变为一个带 PITR 的文件系统!
和大家分享一下最近 PG 生态有趣的一些进展:Omnigres、PG Mooncake、Citus 13、FerretDB 2.0、ParadeDB等。
PostgreSQL 与 Pigsty 中长期缺失的一个包管理器 —— PIG。
虽然有趣,但是很鸡贼的题目,用 SQL 计算扑克24点。PostgreSQL 的正解。
Supabase 非常棒,拥有你自己的 Supabase 那就是棒上加棒!本文介绍了如何在本地/云端物理机/裸金属/虚拟机上自建企业级 Supabase。
不要在星期五发布代码,否则你会多忙一整周!PG小版本发布当天,紧急回滚新发布的小版本。
PG17使用PG16一半的时间实现扩展生态适配,300个可用扩展就绪,达到生产可用状态。PG12正式脱离支持生命周期。
PG扩展很多很强大,但如何安装并使用起来一直都是社区的难题。现在有了Pigsty扩展仓库,390个强力插件开箱即用。
没有规矩,不成方圆。本文是22-24年针对PostgreSQL 15-17大版本的更新,希望可以减少大家在使用与管理PostgreSQL数据库过程中遇到的困惑。
现在PG是世界上最先进的开源数据库,已经是各种规模组织的首选开源数据库,与顶尖商业数据库旗鼓相当,甚至更胜一筹。
PostgreSQL可以直接从内核层面替换掉Oracle、SQL Server与MongoDB,最彻底的是SQL Server,AWS出品的Babelfish直接做到了线缆协议级兼容。
正如两年前开展的向量数据库扩展插件赛马一样,当下PG生态进行的扩展竞赛已经开始围绕DuckDB进行,MotherDuck官方亲自下场标志着竞争进入白热化。
2024年的SO全球开发者调研结果新鲜出炉,PostgreSQL连续第二年成为全球最流行、最受喜爱、需求量最高的数据库。
Dify 是一个生成式 AI 应用创新引擎,开源的 LLM 应用开发平台,本文介绍了如何使用 Pigsty 自建 Dify。
大会议程与主题分享,酒吧社交,自组织会议,PG仓库是如何维护的,社区参与度,一些中国特色问题。
PostgreSQL 全球开发组宣布,PostgreSQL 17 的首个 Beta 版本现已开放,这次 PG 真的是把牙膏管给挤爆啦!
如今软件开发中最大的趋势之一,是PostgreSQL正在成为事实上的数据库标准。直到现在还没有多少文章能解释这一现象背后的原因。
PostgreSQL 不会改变其许可证。本文是 PostgreSQL 核心组成员对此问题的回答。
PostgreSQL并不是一个简单的关系型数据库,而是一个数据管理的抽象框架,具有吞噬整个数据库世界的力量。“一切皆用Postgres"已经成为主流视野的最佳实践。
使用 Postgres 替代 Kafka、RabbitMQ、ElasticSearch、Mongo 和 Redis 是切实可行的方式,可以极大降低系统复杂度。
ParadeDB 旨在成为 Elasticsearch 的替代:用于搜索和分析的 PostgreSQL。
本文讲述了Cloudflare是如何利用15个PostgreSQL集群,伸缩到支持每秒5500万个请求,以及PostgreSQL的可伸缩性表现。
DB-Engines今日正式宣布PostgreSQL再度加冕为"年度数据库",最近七年里这已经是PG第五次获得此荣誉头衔。
本文是 PostgreSQL 核心组成员 Jonathan Katz 对 2024 年 PostgreSQL 项目的未来展望,并回顾过去几年 PostgreSQL 所取得的进展。
查询优化是 DBA 的核心工作内容之一,本文介绍了如何使用 pg_stat_statements 提供的指标,针对 PostgreSQL 进行宏观查询优化。
FerretDB旨在提供一个基于 PostgreSQL 的,真正开源的 MongoDB 替代。
备份是DBA的生命线,但如果你的PostgreSQL数据库已经爆炸了又没有备份,该怎么办?也许pg_filedump可以帮到你!
以向量为代表的功能将成为构建应用时的关键要素,正如历史上的JSON一样。而PostgreSQL再一次站在时代风口浪尖引领数据库潮流,在向量扩展的加持下稳拿AI时代的高速增长。
数据库终局已现,PostgreSQL称王。PG在SF2023开发者调研中拿下大满贯,占住了Linux之于服务器操作系统的生态位。
本文聚焦被 AI 炒火了的向量数据库,介绍了AI嵌入与向量存储检索的基本原理,并用一个具体的知识库检索案例来介绍向量数据库插件 PGVECTOR 的功能与应用。
关于 PostgreSQL 的开发,管理,原理,生态,工具,架构设计,性能优化,故障排查等方面的文章导航。
用性能数据说话,为什么PostgreSQL是世界上最先进的开源关系型数据库。MySQL和PgSQL性能谁好?分布式数据库到底怎么样?
总览StackOverflow过去六年的调研结果,在2022年PostgreSQL已经同时在流行度、喜爱度、需求度三项上登顶夺冠,成了字面意义上最成功的数据库。
昨天在PostgreSQL中文社区做了一个直播分享,介绍了开源的PostgreSQL全家桶解决方案 —— Pigsty。
数据库是信息系统的核心组件,关系型数据库是数据库中的绝对主力,而PostgreSQL是世界上最先进的开源关系型数据库。占据天时地利,何愁大业不成?
什么?不知道COLLATTION是什么,那记住一件事,用C COLLATE准没错!
如何在PostgreSQL中实现比较复杂的模糊查询逻辑?
复制标识很重要,它关系到逻辑复制的成败。
本文介绍PostgreSQL中逻辑复制的相关原理,以及最佳实践。
慢查询是在线业务数据库的大敌,本文介绍了使用监控系统定位诊断慢查询的一般方法论。
机器因为故障重启,NTP服务在PG启动后修复了PG的时间,导致Patroni无法启动。
如何在线修改表中列的类型,例如从INT升级为BIGINT?
了解PostgreSQL中的黄金监控指标:错误、延迟、吞吐和饱和度。
概念及其命名是非常重要的东西,命名风格体现了工程师对系统架构的认知。定义不清的概念将导致沟通困惑,随意设定的名称将产生意想不到的额外负担。
管数据库和管人差不多,都需要定KPI。本文介绍了一种衡量PostgreSQL负载的方式:使用一种单一横向可比的指标,名曰PG Load(PG负载)。
如何在线修改PostgreSQL中的字段类型?一种通用方法。
了解PostgreSQL服务器与客户端通信使用的TCP协议,并使用Go语言打印消息。
PostgreSQL实际上只有两种事务隔离等级:读已提交(Read Commited)与可序列化(Serializable)。
今天遇到一个比较有趣的Case,客户报告说数据库连不上了,发现是扩展导致的。
数据变更捕获是一种很有趣的ETL替代方案,以流式的方式持续收集状态变化事件。
详细介绍PostgreSQL中的各种锁:表级锁、行级锁、页级锁、咨询锁等。
GIN索引如果使用很长的关键词列表进行搜索,会导致性能显著下降。本文解释了为什么GIN索引关键词搜索的时间复杂度为O(n²)。
复制是系统架构中的核心问题之一。
备份有各种各样的策略,物理备份通常可以分为四种。
有时候,组件之间的相互作用会以微妙的形式表现出来。例如使用pg_dump从连接池中导出数据,就可能产生连接池污染的问题。
采用二进制编辑的方式修复PostgreSQL数据页,以及如何让一条主键查询出现两条记录来。
PostgreSQL使用了MVCC作为主要并发控制技术,它有很多好处,但也会带来一些其他的影响,例如关系膨胀。
PipelineDB是PostgreSQL的一个扩展插件,提供流式数据处理的相关功能。
TimescaleDB是PostgreSQL的一个扩展插件,提供时序数据库的一些功能。
XID WrapAround也许是PostgreSQL特有的一种故障。
如果您在表上用了Interger的序列号,最好还是考虑一下可能溢出的情况。
在应用开发中,一个很常见的需求就是GeoIP转换:将请求的来源IP转换为相应的地理坐标,或者行政区划。
详细了解PostgreSQL中触发器的管理与使用。
没有规矩,不成方圆。本文针对PostgreSQL数据库原理与特性,整理了一份开发规范,可以减少大家在使用PostgreSQL数据库过程中遇到的困惑。
PostgreSQL的Slogan是"世界上最先进的开源关系型数据库",要我说最能生动体现PG特色的口号应该是:一专多长的全栈数据库,一招鲜吃遍天。
KNN问题极致优化,从传统关系型设计到PostGIS,实现GIS圈选场景下三万倍的性能提升。
如何高效解决典型地理逆编码问题:根据用户的经纬度坐标,定位用户的行政区划。
PostgreSQL中的表对应着许多物理文件,本文介绍如何统计一张表在PostgreSQL的实际大小。
PgAdmin是一个管理PostgreSQL的GUI程序,用python写成,但实在是过于古早,需要一些额外配置。
最近发生了一起匪夷所思的故障,某数据库切走了一半的数据量和负载,结果却因为负载变大被打挂了。
一些PostgreSQL与Bash交互的技巧。
使用Distinct On扩展字句快速找出分组内具有最大最小值的记录。
PgSQL中的函数默认有三种易变性等级,合理使用可以显著改善性能。
Exclude约束是一个PostgreSQL扩展,它可以实现一些更高级,更巧妙的的数据库约束。
汽车需要上油,数据库也需要维护保养。对Pg而言,有三项比较重要的维护工作:备份、重整、清理。
备份是DBA的安身立命之本,有备份,就不用慌。
PgBackRest是用perl写的一组PostgreSQL备份工具。
Pgbouncer是一个轻量级的数据库连接池,这里简单介绍Pgbouncer的配置、管理与使用。
建议配置PostgreSQL的日志格式为CSV,方便分析,而且可以直接导入PostgreSQL数据表中。
通常涉及到数据迁移,常规操作都是停服务更新。不停机迁移数据是相对比较高级的操作。
FIO可以很方便地测试磁盘IO性能。
尽管PostgreSQL提供了pgbench,但有时候为了吊打一下MySQL,还是需要用到sysbench的。
索引很有用,但不是免费的。没用到的索引是一种浪费,使用这里的方法找出未使用的索引。
快速配置所有机器的免密登陆。
Wireshark是一个很有用的工具,特别适合用来分析网络协议,这里简单介绍使用Wireshark抓包分析PostgreSQL协议的方法。
通过file_fdw,轻松查看操作系统信息,拉取网络数据,把各种各样的数据源轻松喂进数据库里统一查看管理。
top, free, vmstat, iostat:四大常用 CLI 工具命令速查。
PostGIS是PG的杀手锏插件,但编译安装可不容易。
同JDBC类似,Go也有标准的数据库访问接口。本文详细介绍了Go语言中database/sql的使用方法和注意事项。
巧妙运用Pg的Notify功能,可以方便地通知应用元数据变更,实现基于触发器的逻辑复制。
有时候,我们希望记录一些重要的元数据变更,以便事后审计之用。PostgreSQL的触发器就可以很方便地自动解决这一需求。
用PostgreSQL 5分钟实现一个最简单ItemCF推荐系统。
UUID性质原理与应用,以及如何利用PostgreSQL的存储过程操作UUID。
最近有业务要求通过PostgreSQL FDW去访问MongoDB,但是MongoDB FDW编译起来真是要人命啊。