rum

RUM 索引访问方法

概览

扩展包名版本分类许可证语言
rum1.3.15FEATPostgreSQLC
ID扩展名BinLibLoadCreateTrustReloc模式
2720rum-
相关扩展pg_trgm btree_gist btree_gin pg_search pgroonga pg_bigm zhparser pgroonga_database
下游依赖documentdb

1.3.15 build pass on pg 16,17,18

版本

类型仓库版本PG 大版本包名依赖
EXTMIXED1.3.151817161514rum-
RPMPIGSTY1.3.151817161514rum_$v-
DEBPGDG1.3.151817161514postgresql-$v-rum-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64
el8.aarch64
el9.x86_64
el9.aarch64
el10.x86_64
el10.aarch64
d12.x86_64
d12.aarch64
PGDG 1.3.15
PGDG 1.3.15
PGDG 1.3.15
PGDG 1.3.15
PGDG 1.3.15
d13.x86_64
d13.aarch64
PGDG 1.3.15
PGDG 1.3.15
PGDG 1.3.15
PGDG 1.3.15
PGDG 1.3.15
u22.x86_64
u22.aarch64
u24.x86_64
u24.aarch64

构建

您可以使用 pig build 命令构建 rum 扩展的 RPM 包:

pig build pkg rum         # 构建 RPM 包

安装

您可以直接安装 rum 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install rum;          # 当前活跃 PG 版本安装
pig ext install -y rum -v 18  # PG 18
pig ext install -y rum -v 17  # PG 17
pig ext install -y rum -v 16  # PG 16
pig ext install -y rum -v 15  # PG 15
pig ext install -y rum -v 14  # PG 14
dnf install -y rum_18       # PG 18
dnf install -y rum_17       # PG 17
dnf install -y rum_16       # PG 16
dnf install -y rum_15       # PG 15
dnf install -y rum_14       # PG 14
apt install -y postgresql-18-rum   # PG 18
apt install -y postgresql-17-rum   # PG 17
apt install -y postgresql-16-rum   # PG 16
apt install -y postgresql-15-rum   # PG 15
apt install -y postgresql-14-rum   # PG 14

创建扩展

CREATE EXTENSION rum;

用法

rum: RUM 索引访问方法

RUM 是一种索引访问方法,通过在 posting tree 中存储附加信息来扩展 GIN。这使得可以直接访问位置数据,避免在排序、短语搜索和时间戳排序时进行额外的堆扫描。

创建索引

CREATE INDEX idx ON table_name USING rum (column operator_class);

带附加运算符(例如,在全文搜索的同时按时间戳排序):

CREATE INDEX tsts_idx ON tsts USING rum (t rum_tsvector_addon_ops, d)
    WITH (attach = 'd', to = 't');

运算符类

运算符类描述
rum_tsvector_ops存储 tsvector 词素及位置。支持 <=> 排序和前缀搜索。
rum_tsvector_hash_ops存储哈希化的 tsvector 词素及位置。支持 <=> 排序,不支持前缀搜索。
rum_tsvector_addon_ops将 tsvector 与附加字段(时间戳、整数等)组合,用于过滤和排序。
rum_tsvector_hash_addon_ops支持附加字段的哈希变体,不支持前缀搜索。
rum_tsquery_ops存储 tsquery 分支,用于快速查询匹配已索引的文档。
rum_anyarray_ops索引数组类型。支持 &&@><@=%<=> 排序。
rum_anyarray_addon_ops将数组元素与附加字段组合。
rum_TYPE_ops通用运算符类,适用于 int2、int4、int8、float4、float8、money、oid、time、timetz、date、interval、macaddr、inet、cidr、text、varchar、char、bytea、bit、varbit、numeric、timestamp、timestamptz。

排序运算符

运算符描述
<=>距离运算符,适用于 tsvector、timestamp、数值类型、数组
<=|左侧距离,适用于 timestamp、int、float、money、oid
|=>右侧距离,适用于 timestamp、int、float、money、oid

示例

带排序的全文搜索:

SELECT t, a <=> to_tsquery('english', 'beautiful | place') AS rank
FROM test_rum
WHERE a @@ to_tsquery('english', 'beautiful | place')
ORDER BY a <=> to_tsquery('english', 'beautiful | place');

按时间戳排序的全文搜索:

SELECT id, d, d <=> '2016-05-16 14:21:25' FROM tsts
WHERE t @@ 'wr&qh'
ORDER BY d <=> '2016-05-16 14:21:25'
LIMIT 5;

带距离排序的数组匹配:

SELECT * FROM test_array
WHERE i && '{1}'
ORDER BY i <=> '{1}' ASC;

最后修改 2026-03-14: update extension metadata (953cbd0)