pg_rrf

混合检索的倒数排序融合函数

概览

扩展包名版本分类许可证语言
pg_rrf0.0.3RAGMITRust
ID扩展名BinLibLoadCreateTrustReloc模式
1845pg_rrf-

manually upgraded PGRX from 0.16.1 to 0.17.0 by Vonng

版本

类型仓库版本PG 大版本包名依赖
EXTPIGSTY0.0.31817161514pg_rrf-
RPMPIGSTY0.0.31817161514pg_rrf_$v-
DEBPIGSTY0.0.31817161514postgresql-$v-pg-rrf-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64PIGSTY MISS
el8.aarch64PIGSTY MISS
el9.x86_64PIGSTY MISS
el9.aarch64PIGSTY MISS
el10.x86_64PIGSTY MISS
el10.aarch64PIGSTY MISS
d12.x86_64PIGSTY MISS
d12.aarch64PIGSTY MISS
d13.x86_64PIGSTY MISS
d13.aarch64PIGSTY MISS
u22.x86_64PIGSTY MISS
u22.aarch64PIGSTY MISS
PIGSTY 0.0.3
PIGSTY 0.0.3
PIGSTY 0.0.3
PIGSTY 0.0.3
u24.x86_64PIGSTY MISS
u24.aarch64PIGSTY MISS
PIGSTY 0.0.3
PIGSTY 0.0.3
PIGSTY 0.0.3
PIGSTY 0.0.3
u26.x86_64PIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISS
u26.aarch64PIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISS

构建

您可以使用 pig build 命令构建 pg_rrf 扩展的 RPM / DEB 包:

pig build pkg pg_rrf         # 构建 RPM / DEB 包

安装

您可以直接安装 pg_rrf 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install pg_rrf;          # 当前活跃 PG 版本安装
pig ext install -y pg_rrf -v 17  # PG 17
pig ext install -y pg_rrf -v 16  # PG 16
pig ext install -y pg_rrf -v 15  # PG 15
pig ext install -y pg_rrf -v 14  # PG 14
dnf install -y pg_rrf_17       # PG 17
dnf install -y pg_rrf_16       # PG 16
dnf install -y pg_rrf_15       # PG 15
dnf install -y pg_rrf_14       # PG 14
apt install -y postgresql-17-pg-rrf   # PG 17
apt install -y postgresql-16-pg-rrf   # PG 16
apt install -y postgresql-15-pg-rrf   # PG 15
apt install -y postgresql-14-pg-rrf   # PG 14

创建扩展

CREATE EXTENSION pg_rrf;

用法

来源:README, v0.0.3 release

pg_rrf 提供用于混合检索分数融合的 Reciprocal Rank Fusion 函数。它的目标是把多个有序候选列表合并起来,而不需要手写 FULL OUTER JOIN / COALESCE 这类拼接逻辑。

核心函数

  • rrf(rank_a, rank_b, k)
  • rrf3(rank_a, rank_b, rank_c, k)
  • rrf_fuse(ids_a bigint[], ids_b bigint[], k int default 60)
  • rrfn(ranks bigint[], k int)

v0.0.3 release 明确新增了 rrfn,同时保留 rrfrrf3 作为兼容包装器。README 记录的分数行为也很直接:

  • 缺失排名会被忽略
  • <= 0 的排名会被忽略
  • k <= 0 会报错

示例

CREATE EXTENSION pg_rrf;

SELECT rrf(1, 2, 60) AS rrf_12;
SELECT rrf3(1, 2, 3, 60) AS rrf_123;
SELECT rrfn(ARRAY[1, 2, 3], 60) AS rrfn_123;
SELECT *
FROM rrf_fuse(ARRAY[10, 20, 30], ARRAY[20, 40], 60)
ORDER BY score DESC;

混合检索模式

上游 README 把 rrf_fuse 作为手工融合查询的替代方案:

WITH fused AS (
  SELECT *
  FROM rrf_fuse(
    ARRAY(SELECT id FROM docs ORDER BY bm25_score DESC LIMIT 100),
    ARRAY(SELECT id FROM docs ORDER BY embedding <=> :qvec LIMIT 100),
    60
  )
)
SELECT d.*, fused.score
FROM fused
JOIN docs d USING (id)
ORDER BY fused.score DESC
LIMIT 20;

说明

README 目标版本是 PostgreSQL 14-17,并记录了基于 Docker 的构建与测试流程。扩展接口刻意保持很小:核心是分数辅助函数,以及覆盖常见双列表混合检索场景的 rrf_fuse