re2

使用 RE2 的 ClickHouse 兼容正则函数

概览

扩展包名版本分类许可证语言
re20.1.1UTILPostgreSQLC++
ID扩展名BinLibLoadCreateTrustReloc模式
4235re2-

release 0.1.1; SQL v0.1

版本

类型仓库版本PG 大版本包名依赖
EXTPIGSTY0.1.11817161514re2-
RPMPIGSTY0.1.11817161514re2_$v-
DEBPIGSTY0.1.11817161514postgresql-$v-re2-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64PIGSTY MISSPIGSTY MISS
el8.aarch64PIGSTY MISSPIGSTY MISS
el9.x86_64PIGSTY MISSPIGSTY MISS
el9.aarch64PIGSTY MISSPIGSTY MISS
el10.x86_64PIGSTY MISSPIGSTY MISS
el10.aarch64PIGSTY MISSPIGSTY MISS
d12.x86_64PIGSTY MISSPIGSTY MISS
d12.aarch64PIGSTY MISSPIGSTY MISS
d13.x86_64PIGSTY MISSPIGSTY MISS
d13.aarch64PIGSTY MISSPIGSTY MISS
u22.x86_64PIGSTY MISSPIGSTY MISS
u22.aarch64PIGSTY MISSPIGSTY MISS
u24.x86_64PIGSTY MISSPIGSTY MISS
u24.aarch64PIGSTY MISSPIGSTY MISS

构建

您可以使用 pig build 命令构建 re2 扩展的 RPM / DEB 包:

pig build pkg re2         # 构建 RPM / DEB 包

安装

您可以直接安装 re2 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install re2;          # 当前活跃 PG 版本安装
pig ext install -y re2 -v 18  # PG 18
pig ext install -y re2 -v 17  # PG 17
pig ext install -y re2 -v 16  # PG 16
pig ext install -y re2 -v 15  # PG 15
pig ext install -y re2 -v 14  # PG 14
dnf install -y re2_18       # PG 18
dnf install -y re2_17       # PG 17
dnf install -y re2_16       # PG 16
dnf install -y re2_15       # PG 15
dnf install -y re2_14       # PG 14
apt install -y postgresql-18-re2   # PG 18
apt install -y postgresql-17-re2   # PG 17
apt install -y postgresql-16-re2   # PG 16
apt install -y postgresql-15-re2   # PG 15
apt install -y postgresql-14-re2   # PG 14

创建扩展

CREATE EXTENSION re2;

用法

来源: official README, official reference doc, v0.1.1 release

re2 提供由 Google RE2 引擎驱动、与 ClickHouse 兼容的正则表达式函数。它同时暴露 textbytea 重载,因此也可以搜索包含 \\0 字节的二进制数据。

CREATE EXTENSION re2;

SELECT re2match('hello world', 'h.*o');
SELECT re2extract('Order #123', '(\\d+)');
SELECT re2countmatches('a1 b2 c3', '\\d');

核心函数

  • re2match(haystack, pattern) -> boolean
  • re2extract(haystack, pattern) -> text|bytea
  • re2extractall(haystack, pattern) -> text[]|bytea[]
  • re2regexpextract(haystack, pattern, index default 1) -> text|bytea
  • re2extractgroups(haystack, pattern) -> text[]|bytea[]
  • re2replaceregexpone(haystack, pattern, replacement) -> text|bytea
  • re2replaceregexpall(haystack, pattern, replacement) -> text|bytea
  • re2countmatches(...)re2countmatchescaseinsensitive(...)

多模式匹配

re2multimatch* 系列既接受多个 pattern 参数,也接受 VARIADIC 数组:

SELECT re2multimatchany('error: timeout', 'timeout', 'denied');
SELECT re2multimatchanyindex('error: timeout', VARIADIC ARRAY['timeout', 'denied']);
SELECT re2multimatchallindices('error: timeout', 'error', 'timeout', 'panic');

匹配语义

  • 为了匹配 ClickHouse 的行为,. 默认会匹配换行。
  • 如果希望 . 不跨越换行,请在 pattern 前加上 (?-s)
  • 替换字符串支持 \\0\\9 反向引用。

注意事项

  • 构建或安装时需要系统 re2 库。
  • v0.1.1 是仅涉及二进制构建的版本:它增加了 PostgreSQL 13+ 支持,并记录了多模式函数对 VARIADIC 的用法,但已有 v0.1 SQL 安装不需要执行 ALTER EXTENSION UPDATE

最后修改 2026-04-19: update extension stub docs (aa5941a)