smlar

高效的相似度搜索函数

概览

扩展包名	版本	分类	许可证	语言
`smlar`	`1.0`	RAG	PostgreSQL	C

ID	扩展名	Bin	Lib	Load	Create	Trust	Reloc	模式
1850	`smlar`	否	是	否	是	否	是	-

相关扩展	`pg_similarity` `fuzzystrmatch` `pg_trgm` `intarray` `vector` `pg_bigm` `unaccent` `vchord`

fix pg18 break issue by https://github.com/Vonng/smlar

版本

类型	仓库	版本	PG 大版本	包名	依赖
EXT	PIGSTY	`1.0`	1817161514	`smlar`	-
RPM	PIGSTY	`1.0`	1817161514	`smlar_$v`	-
DEB	PIGSTY	`1.0`	1817161514	`postgresql-$v-smlar`	-

OS / PG	PG18	PG17	PG16	PG15	PG14
el8.x86_64	PIGSTY 1.0 el8.x86_64.pg18 : smlar_18 smlar_18-1.0-1PIGSTY.el8.x86_64.rpm PIGSTY · 1.0 · 34.8KiB	PIGSTY 1.0 el8.x86_64.pg17 : smlar_17 smlar_17-1.0-1PIGSTY.el8.x86_64.rpm PIGSTY · 1.0 · 34.7KiB	PIGSTY 1.0 el8.x86_64.pg16 : smlar_16 smlar_16-1.0-1PIGSTY.el8.x86_64.rpm PIGSTY · 1.0 · 34.7KiB	PIGSTY 1.0 el8.x86_64.pg15 : smlar_15 smlar_15-1.0-1PIGSTY.el8.x86_64.rpm PIGSTY · 1.0 · 35.2KiB	PIGSTY 1.0 el8.x86_64.pg14 : smlar_14 smlar_14-1.0-1PIGSTY.el8.x86_64.rpm PIGSTY · 1.0 · 35.1KiB
el8.aarch64	PIGSTY 1.0 el8.aarch64.pg18 : smlar_18 smlar_18-1.0-1PIGSTY.el8.aarch64.rpm PIGSTY · 1.0 · 33.0KiB	PIGSTY 1.0 el8.aarch64.pg17 : smlar_17 smlar_17-1.0-1PIGSTY.el8.aarch64.rpm PIGSTY · 1.0 · 33.0KiB	PIGSTY 1.0 el8.aarch64.pg16 : smlar_16 smlar_16-1.0-1PIGSTY.el8.aarch64.rpm PIGSTY · 1.0 · 33.0KiB	PIGSTY 1.0 el8.aarch64.pg15 : smlar_15 smlar_15-1.0-1PIGSTY.el8.aarch64.rpm PIGSTY · 1.0 · 33.3KiB	PIGSTY 1.0 el8.aarch64.pg14 : smlar_14 smlar_14-1.0-1PIGSTY.el8.aarch64.rpm PIGSTY · 1.0 · 33.3KiB
el9.x86_64	PIGSTY 1.0 el9.x86_64.pg18 : smlar_18 smlar_18-1.0-1PIGSTY.el9.x86_64.rpm PIGSTY · 1.0 · 33.6KiB	PIGSTY 1.0 el9.x86_64.pg17 : smlar_17 smlar_17-1.0-1PIGSTY.el9.x86_64.rpm PIGSTY · 1.0 · 33.6KiB	PIGSTY 1.0 el9.x86_64.pg16 : smlar_16 smlar_16-1.0-1PIGSTY.el9.x86_64.rpm PIGSTY · 1.0 · 33.6KiB	PIGSTY 1.0 el9.x86_64.pg15 : smlar_15 smlar_15-1.0-1PIGSTY.el9.x86_64.rpm PIGSTY · 1.0 · 34.1KiB	PIGSTY 1.0 el9.x86_64.pg14 : smlar_14 smlar_14-1.0-1PIGSTY.el9.x86_64.rpm PIGSTY · 1.0 · 34.1KiB
el9.aarch64	PIGSTY 1.0 el9.aarch64.pg18 : smlar_18 smlar_18-1.0-1PIGSTY.el9.aarch64.rpm PIGSTY · 1.0 · 32.6KiB	PIGSTY 1.0 el9.aarch64.pg17 : smlar_17 smlar_17-1.0-1PIGSTY.el9.aarch64.rpm PIGSTY · 1.0 · 32.6KiB	PIGSTY 1.0 el9.aarch64.pg16 : smlar_16 smlar_16-1.0-1PIGSTY.el9.aarch64.rpm PIGSTY · 1.0 · 32.6KiB	PIGSTY 1.0 el9.aarch64.pg15 : smlar_15 smlar_15-1.0-1PIGSTY.el9.aarch64.rpm PIGSTY · 1.0 · 32.8KiB	PIGSTY 1.0 el9.aarch64.pg14 : smlar_14 smlar_14-1.0-1PIGSTY.el9.aarch64.rpm PIGSTY · 1.0 · 32.8KiB
el10.x86_64	PIGSTY 1.0 el10.x86_64.pg18 : smlar_18 smlar_18-1.0-1PIGSTY.el10.x86_64.rpm PIGSTY · 1.0 · 33.9KiB	PIGSTY 1.0 el10.x86_64.pg17 : smlar_17 smlar_17-1.0-1PIGSTY.el10.x86_64.rpm PIGSTY · 1.0 · 33.9KiB	PIGSTY 1.0 el10.x86_64.pg16 : smlar_16 smlar_16-1.0-1PIGSTY.el10.x86_64.rpm PIGSTY · 1.0 · 33.9KiB	PIGSTY 1.0 el10.x86_64.pg15 : smlar_15 smlar_15-1.0-1PIGSTY.el10.x86_64.rpm PIGSTY · 1.0 · 33.9KiB	PIGSTY 1.0 el10.x86_64.pg14 : smlar_14 smlar_14-1.0-1PIGSTY.el10.x86_64.rpm PIGSTY · 1.0 · 33.9KiB
el10.aarch64	PIGSTY 1.0 el10.aarch64.pg18 : smlar_18 smlar_18-1.0-1PIGSTY.el10.aarch64.rpm PIGSTY · 1.0 · 33.3KiB	PIGSTY 1.0 el10.aarch64.pg17 : smlar_17 smlar_17-1.0-1PIGSTY.el10.aarch64.rpm PIGSTY · 1.0 · 33.3KiB	PIGSTY 1.0 el10.aarch64.pg16 : smlar_16 smlar_16-1.0-1PIGSTY.el10.aarch64.rpm PIGSTY · 1.0 · 33.3KiB	PIGSTY 1.0 el10.aarch64.pg15 : smlar_15 smlar_15-1.0-1PIGSTY.el10.aarch64.rpm PIGSTY · 1.0 · 33.2KiB	PIGSTY 1.0 el10.aarch64.pg14 : smlar_14 smlar_14-1.0-1PIGSTY.el10.aarch64.rpm PIGSTY · 1.0 · 33.2KiB
d12.x86_64	PIGSTY 1.0 d12.x86_64.pg18 : postgresql-18-smlar postgresql-18-smlar_1.0-1PIGSTY~bookworm_amd64.deb PIGSTY · 1.0 · 71.7KiB	PIGSTY 1.0 d12.x86_64.pg17 : postgresql-17-smlar postgresql-17-smlar_1.0-1PIGSTY~bookworm_amd64.deb PIGSTY · 1.0 · 71.7KiB	PIGSTY 1.0 d12.x86_64.pg16 : postgresql-16-smlar postgresql-16-smlar_1.0-1PIGSTY~bookworm_amd64.deb PIGSTY · 1.0 · 71.6KiB	PIGSTY 1.0 d12.x86_64.pg15 : postgresql-15-smlar postgresql-15-smlar_1.0-1PIGSTY~bookworm_amd64.deb PIGSTY · 1.0 · 72.1KiB	PIGSTY 1.0 d12.x86_64.pg14 : postgresql-14-smlar postgresql-14-smlar_1.0-1PIGSTY~bookworm_amd64.deb PIGSTY · 1.0 · 72.1KiB
d12.aarch64	PIGSTY 1.0 d12.aarch64.pg18 : postgresql-18-smlar postgresql-18-smlar_1.0-1PIGSTY~bookworm_arm64.deb PIGSTY · 1.0 · 70.1KiB	PIGSTY 1.0 d12.aarch64.pg17 : postgresql-17-smlar postgresql-17-smlar_1.0-1PIGSTY~bookworm_arm64.deb PIGSTY · 1.0 · 70.0KiB	PIGSTY 1.0 d12.aarch64.pg16 : postgresql-16-smlar postgresql-16-smlar_1.0-1PIGSTY~bookworm_arm64.deb PIGSTY · 1.0 · 70.0KiB	PIGSTY 1.0 d12.aarch64.pg15 : postgresql-15-smlar postgresql-15-smlar_1.0-1PIGSTY~bookworm_arm64.deb PIGSTY · 1.0 · 70.3KiB	PIGSTY 1.0 d12.aarch64.pg14 : postgresql-14-smlar postgresql-14-smlar_1.0-1PIGSTY~bookworm_arm64.deb PIGSTY · 1.0 · 70.4KiB
d13.x86_64	PIGSTY 1.0 d13.x86_64.pg18 : postgresql-18-smlar postgresql-18-smlar_1.0-1PIGSTY~trixie_amd64.deb PIGSTY · 1.0 · 71.7KiB	PIGSTY 1.0 d13.x86_64.pg17 : postgresql-17-smlar postgresql-17-smlar_1.0-1PIGSTY~trixie_amd64.deb PIGSTY · 1.0 · 71.6KiB	PIGSTY 1.0 d13.x86_64.pg16 : postgresql-16-smlar postgresql-16-smlar_1.0-1PIGSTY~trixie_amd64.deb PIGSTY · 1.0 · 71.6KiB	PIGSTY 1.0 d13.x86_64.pg15 : postgresql-15-smlar postgresql-15-smlar_1.0-1PIGSTY~trixie_amd64.deb PIGSTY · 1.0 · 71.9KiB	PIGSTY 1.0 d13.x86_64.pg14 : postgresql-14-smlar postgresql-14-smlar_1.0-1PIGSTY~trixie_amd64.deb PIGSTY · 1.0 · 71.9KiB
d13.aarch64	PIGSTY 1.0 d13.aarch64.pg18 : postgresql-18-smlar postgresql-18-smlar_1.0-1PIGSTY~trixie_arm64.deb PIGSTY · 1.0 · 70.5KiB	PIGSTY 1.0 d13.aarch64.pg17 : postgresql-17-smlar postgresql-17-smlar_1.0-1PIGSTY~trixie_arm64.deb PIGSTY · 1.0 · 70.3KiB	PIGSTY 1.0 d13.aarch64.pg16 : postgresql-16-smlar postgresql-16-smlar_1.0-1PIGSTY~trixie_arm64.deb PIGSTY · 1.0 · 70.3KiB	PIGSTY 1.0 d13.aarch64.pg15 : postgresql-15-smlar postgresql-15-smlar_1.0-1PIGSTY~trixie_arm64.deb PIGSTY · 1.0 · 70.5KiB	PIGSTY 1.0 d13.aarch64.pg14 : postgresql-14-smlar postgresql-14-smlar_1.0-1PIGSTY~trixie_arm64.deb PIGSTY · 1.0 · 70.5KiB
u22.x86_64	PIGSTY 1.0 u22.x86_64.pg18 : postgresql-18-smlar postgresql-18-smlar_1.0-1PIGSTY~jammy_amd64.deb PIGSTY · 1.0 · 77.4KiB	PIGSTY 1.0 u22.x86_64.pg17 : postgresql-17-smlar postgresql-17-smlar_1.0-1PIGSTY~jammy_amd64.deb PIGSTY · 1.0 · 85.8KiB	PIGSTY 1.0 u22.x86_64.pg16 : postgresql-16-smlar postgresql-16-smlar_1.0-1PIGSTY~jammy_amd64.deb PIGSTY · 1.0 · 85.6KiB	PIGSTY 1.0 u22.x86_64.pg15 : postgresql-15-smlar postgresql-15-smlar_1.0-1PIGSTY~jammy_amd64.deb PIGSTY · 1.0 · 86.2KiB	PIGSTY 1.0 u22.x86_64.pg14 : postgresql-14-smlar postgresql-14-smlar_1.0-1PIGSTY~jammy_amd64.deb PIGSTY · 1.0 · 86.1KiB
u22.aarch64	PIGSTY 1.0 u22.aarch64.pg18 : postgresql-18-smlar postgresql-18-smlar_1.0-1PIGSTY~jammy_arm64.deb PIGSTY · 1.0 · 76.1KiB	PIGSTY 1.0 u22.aarch64.pg17 : postgresql-17-smlar postgresql-17-smlar_1.0-1PIGSTY~jammy_arm64.deb PIGSTY · 1.0 · 84.4KiB	PIGSTY 1.0 u22.aarch64.pg16 : postgresql-16-smlar postgresql-16-smlar_1.0-1PIGSTY~jammy_arm64.deb PIGSTY · 1.0 · 84.2KiB	PIGSTY 1.0 u22.aarch64.pg15 : postgresql-15-smlar postgresql-15-smlar_1.0-1PIGSTY~jammy_arm64.deb PIGSTY · 1.0 · 84.6KiB	PIGSTY 1.0 u22.aarch64.pg14 : postgresql-14-smlar postgresql-14-smlar_1.0-1PIGSTY~jammy_arm64.deb PIGSTY · 1.0 · 84.5KiB
u24.x86_64	PIGSTY 1.0 u24.x86_64.pg18 : postgresql-18-smlar postgresql-18-smlar_1.0-1PIGSTY~noble_amd64.deb PIGSTY · 1.0 · 75.4KiB	PIGSTY 1.0 u24.x86_64.pg17 : postgresql-17-smlar postgresql-17-smlar_1.0-1PIGSTY~noble_amd64.deb PIGSTY · 1.0 · 75.4KiB	PIGSTY 1.0 u24.x86_64.pg16 : postgresql-16-smlar postgresql-16-smlar_1.0-1PIGSTY~noble_amd64.deb PIGSTY · 1.0 · 75.3KiB	PIGSTY 1.0 u24.x86_64.pg15 : postgresql-15-smlar postgresql-15-smlar_1.0-1PIGSTY~noble_amd64.deb PIGSTY · 1.0 · 75.0KiB	PIGSTY 1.0 u24.x86_64.pg14 : postgresql-14-smlar postgresql-14-smlar_1.0-1PIGSTY~noble_amd64.deb PIGSTY · 1.0 · 75.0KiB
u24.aarch64	PIGSTY 1.0 u24.aarch64.pg18 : postgresql-18-smlar postgresql-18-smlar_1.0-1PIGSTY~noble_arm64.deb PIGSTY · 1.0 · 74.9KiB	PIGSTY 1.0 u24.aarch64.pg17 : postgresql-17-smlar postgresql-17-smlar_1.0-1PIGSTY~noble_arm64.deb PIGSTY · 1.0 · 74.9KiB	PIGSTY 1.0 u24.aarch64.pg16 : postgresql-16-smlar postgresql-16-smlar_1.0-1PIGSTY~noble_arm64.deb PIGSTY · 1.0 · 74.9KiB	PIGSTY 1.0 u24.aarch64.pg15 : postgresql-15-smlar postgresql-15-smlar_1.0-1PIGSTY~noble_arm64.deb PIGSTY · 1.0 · 74.4KiB	PIGSTY 1.0 u24.aarch64.pg14 : postgresql-14-smlar postgresql-14-smlar_1.0-1PIGSTY~noble_arm64.deb PIGSTY · 1.0 · 74.4KiB

构建

您可以使用 pig build 命令构建 smlar 扩展的 RPM / DEB 包：

pig build pkg smlar         # 构建 RPM / DEB 包

安装

您可以直接安装 smlar 扩展包的预置二进制包，首先确保 PGDG 和 PIGSTY 仓库已经添加并启用：

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展：

pig install smlar;          # 当前活跃 PG 版本安装

pig ext install -y smlar -v 18  # PG 18
pig ext install -y smlar -v 17  # PG 17
pig ext install -y smlar -v 16  # PG 16
pig ext install -y smlar -v 15  # PG 15
pig ext install -y smlar -v 14  # PG 14

dnf install -y smlar_18       # PG 18
dnf install -y smlar_17       # PG 17
dnf install -y smlar_16       # PG 16
dnf install -y smlar_15       # PG 15
dnf install -y smlar_14       # PG 14

apt install -y postgresql-18-smlar   # PG 18
apt install -y postgresql-17-smlar   # PG 17
apt install -y postgresql-16-smlar   # PG 16
apt install -y postgresql-15-smlar   # PG 15
apt install -y postgresql-14-smlar   # PG 14

创建扩展：

CREATE EXTENSION smlar;

用法

smlar：PostgreSQL 数组的高效相似度搜索。来源：README

smlar 扩展提供 PostgreSQL 数组上的高效相似度搜索，支持可配置的相似度公式、GiST 和 GIN 索引，以及 TF/IDF 加权。

函数

float4 smlar(anyarray, anyarray)

计算两个数组的相似度。数组应为相同类型。

float4 smlar(anyarray, anyarray, bool useIntersect)

计算两个复合类型数组的相似度。复合类型格式如下：

CREATE TYPE type_name AS (element_name anytype, weight_name FLOAT4);

useIntersect 选项指定分母中仅使用交集元素。

float4 smlar(anyarray a, anyarray b, text formula)

通过给定公式计算两个数组的相似度。公式中的预定义变量：

N.i – 两个数组中的公共元素数量（交集）
N.a – 第一个数组中的唯一元素数量
N.b – 第二个数组中的唯一元素数量

示例：

SELECT smlar('{1,4,6}'::int[], '{5,4,6}');
SELECT smlar('{1,4,6}'::int[], '{5,4,6}', 'N.i / sqrt(N.a * N.b)');
-- 这两个调用是等价的。

anyarray % anyarray

如果数组的相似度大于阈值限制则返回 true。

text[] tsvector2textarray(tsvector)

将 tsvector 类型转换为文本数组。

anyarray array_unique(anyarray)

排序并去重数组。

float4 inarray(anyarray, anyelement)

如果第二个参数不存在于第一个参数中返回零，否则返回 1.0。

float4 inarray(anyarray, anyelement, float4, float4)

如果第二个参数不存在于第一个参数中返回第四个参数，否则返回第三个参数。

GUC 配置变量

smlar.threshold  FLOAT

相似度低于阈值的数组不被 % 运算视为相似。

smlar.persistent_cache  BOOL

全局统计缓存存储在事务无关的内存中。

smlar.type  STRING

相似度公式类型：cosine（默认）、tfidf、overlap。

smlar.stattable  STRING

存储集合级统计数据的表名。表应定义为：

CREATE TABLE table_name (
    value   data_type UNIQUE,
    ndoc    int4 (or bigint)  NOT NULL CHECK (ndoc > 0)
);

值为 null 的行表示文档总数。仅用于 smlar.type = 'tfidf'。

smlar.tf_method  STRING

词频计算方法。取值：

"n" – 简单计数（默认）
"log" – 1 + log(n)
"const" – TF 等于 1

仅用于 smlar.type = 'tfidf'。

smlar.idf_plus_one  BOOL

如果为 false（默认），idf 计算为 log(d/df)。如果为 true，计算为 log(1+d/df)。仅用于 smlar.type = 'tfidf'。

强烈建议在 postgresql.conf 中添加：

smlar.threshold = 0.6  # 或其他 > 0 且 < 1 的值

GiST/GIN 索引支持

% 和 && 操作支持多种数组类型的 GiST 和 GIN 索引：

数组类型	GIN 操作符类	GiST 操作符类
`bit[]`	`_bit_sml_ops`
`bytea[]`	`_bytea_sml_ops`	`_bytea_sml_ops`
`char[]`	`_char_sml_ops`	`_char_sml_ops`
`cidr[]`	`_cidr_sml_ops`	`_cidr_sml_ops`
`date[]`	`_date_sml_ops`	`_date_sml_ops`
`float4[]`	`_float4_sml_ops`	`_float4_sml_ops`
`float8[]`	`_float8_sml_ops`	`_float8_sml_ops`
`inet[]`	`_inet_sml_ops`	`_inet_sml_ops`
`int2[]`	`_int2_sml_ops`	`_int2_sml_ops`
`int4[]`	`_int4_sml_ops`	`_int4_sml_ops`
`int8[]`	`_int8_sml_ops`	`_int8_sml_ops`
`interval[]`	`_interval_sml_ops`	`_interval_sml_ops`
`macaddr[]`	`_macaddr_sml_ops`	`_macaddr_sml_ops`
`money[]`	`_money_sml_ops`
`numeric[]`	`_numeric_sml_ops`	`_numeric_sml_ops`
`oid[]`	`_oid_sml_ops`	`_oid_sml_ops`
`text[]`	`_text_sml_ops`	`_text_sml_ops`
`time[]`	`_time_sml_ops`	`_time_sml_ops`
`timestamp[]`	`_timestamp_sml_ops`	`_timestamp_sml_ops`
`timestamptz[]`	`_timestamptz_sml_ops`	`_timestamptz_sml_ops`
`timetz[]`	`_timetz_sml_ops`	`_timetz_sml_ops`
`varbit[]`	`_varbit_sml_ops`
`varchar[]`	`_varchar_sml_ops`	`_varchar_sml_ops`

意见反馈

这个页面对您有帮助吗？

感谢反馈！请告诉我们如何改进。

抱歉给您带来不便。请告诉我们如何改进。

最后修改 2026-03-14: update extension metadata (953cbd0)