re2

使用 RE2 的 ClickHouse 兼容正则函数

概览

扩展包名版本分类许可证语言
re20.3.0UTILPostgreSQLC++
ID扩展名BinLibLoadCreateTrustReloc模式
4235re2-

release 0.3.0; SQL v0.3

版本

类型仓库版本PG 大版本包名依赖
EXTPIGSTY0.3.01817161514re2-
RPMPIGSTY0.3.01817161514re2_$v-
DEBPIGSTY0.3.01817161514postgresql-$v-re2-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64PIGSTY MISSPIGSTY MISS
el8.aarch64PIGSTY MISSPIGSTY MISS
el9.x86_64PIGSTY MISSPIGSTY MISS
el9.aarch64PIGSTY MISSPIGSTY MISS
el10.x86_64PIGSTY MISSPIGSTY MISS
el10.aarch64PIGSTY MISSPIGSTY MISS
d12.x86_64PIGSTY MISSPIGSTY MISS
d12.aarch64PIGSTY MISSPIGSTY MISS
d13.x86_64PIGSTY MISSPIGSTY MISS
d13.aarch64PIGSTY MISSPIGSTY MISS
u22.x86_64PIGSTY MISSPIGSTY MISS
u22.aarch64PIGSTY MISSPIGSTY MISS
u24.x86_64PIGSTY MISSPIGSTY MISS
u24.aarch64PIGSTY MISSPIGSTY MISS
u26.x86_64PIGSTY MISSPIGSTY MISS
u26.aarch64PIGSTY MISSPIGSTY MISS

构建

您可以使用 pig build 命令构建 re2 扩展的 RPM / DEB 包:

pig build pkg re2         # 构建 RPM / DEB 包

安装

您可以直接安装 re2 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install re2;          # 当前活跃 PG 版本安装
pig ext install -y re2 -v 18  # PG 18
pig ext install -y re2 -v 17  # PG 17
pig ext install -y re2 -v 16  # PG 16
dnf install -y re2_18       # PG 18
dnf install -y re2_17       # PG 17
dnf install -y re2_16       # PG 16
apt install -y postgresql-18-re2   # PG 18
apt install -y postgresql-17-re2   # PG 17
apt install -y postgresql-16-re2   # PG 16

创建扩展

CREATE EXTENSION re2;

用法

来源:official READMEofficial reference docv0.3.0 release

re2 提供由 Google RE2 引擎驱动、与 ClickHouse 兼容的正则表达式函数。它同时暴露 textbytea 重载,因此也可以搜索包含 \\0 字节的二进制数据。Pigsty 为 PostgreSQL 16-18 打包版本 0.3.0,而上游文档说明支持 PostgreSQL 13+。

CREATE EXTENSION re2;

SELECT re2match('hello world', 'h.*o');
SELECT re2extract('Order #123', '(\\d+)');
SELECT re2countmatches('a1 b2 c3', '\\d');

核心函数

  • re2match(haystack, pattern) -> boolean
  • re2extract(haystack, pattern) -> text|bytea
  • re2extractall(haystack, pattern) -> text[]|bytea[]
  • re2regexpextract(haystack, pattern, index default 1) -> text|bytea
  • re2extractgroups(haystack, pattern) -> text[]|bytea[]
  • re2extractallgroupsvertical(haystack, pattern) -> text[]|bytea[]
  • re2extractallgroupshorizontal(haystack, pattern) -> text[]|bytea[]
  • re2regexpquotemeta(haystack) -> text|bytea
  • re2splitbyregexp(pattern, haystack, max_substrings default 0) -> text[]|bytea[]
  • re2replaceregexpone(haystack, pattern, replacement) -> text|bytea
  • re2replaceregexpall(haystack, pattern, replacement) -> text|bytea
  • re2countmatches(...)re2countmatchescaseinsensitive(...)
SELECT re2extractallgroupsvertical('a=1 b=2', '(\\w)=(\\d)');
SELECT re2regexpquotemeta('a+b?');
SELECT re2splitbyregexp('\\s+', 'one two three', 2);

多模式匹配

re2multimatch* 系列既接受多个 pattern 参数,也接受 VARIADIC 数组:

SELECT re2multimatchany('error: timeout', 'timeout', 'denied');
SELECT re2multimatchanyindex('error: timeout', VARIADIC ARRAY['timeout', 'denied']);
SELECT re2multimatchallindices('error: timeout', 'error', 'timeout', 'panic');

匹配语义

  • 为了匹配 ClickHouse 行为,. 默认会匹配换行。
  • 如果希望 . 不跨越换行,请在 pattern 前加上 (?-s)
  • 替换字符串支持 \\0\\9 反向引用。

注意事项

  • 上游要求构建/安装时系统中有 re2 库。
  • Release v0.3.0 使用 SQL version 0.3;从更早 minor release 替换扩展二进制后,执行 ALTER EXTENSION re2 UPDATE TO '0.3'
  • re2splitbyregexpv0.3.0 中将参数顺序改为 pattern, haystack[, max_substrings],与 ClickHouse 一致。早期 0.2.0 build 使用的是 haystack, pattern
  • 上游将 patch releases 视为 binary-only,但 minor releases 可能需要 SQL upgrade scripts。

最后修改 2026-06-18: extension data update (63e2bd9)