imgsmlr

使用Haar小波分析计算图片相似度

概览

扩展包名版本分类许可证语言
imgsmlr1.0FEATPostgreSQLC
ID扩展名BinLibLoadCreateTrustReloc模式
2830imgsmlr-
相关扩展age hll rum pg_graphql pg_jsonschema jsquery pg_hint_plan hypopg

breaks on el10

版本

类型仓库版本PG 大版本包名依赖
EXTPIGSTY1.01817161514imgsmlr-
RPMPIGSTY1.01817161514imgsmlr_$v-
DEBPIGSTY1.01817161514postgresql-$v-imgsmlr-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64
el8.aarch64
el9.x86_64
el9.aarch64
el10.x86_64PIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISS
el10.aarch64PIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISS
d12.x86_64
d12.aarch64
d13.x86_64PIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISS
d13.aarch64PIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISS
u22.x86_64
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
u22.aarch64
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
u24.x86_64
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
u24.aarch64
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0
PIGSTY 1.0

构建

您可以使用 pig build 命令构建 imgsmlr 扩展的 RPM / DEB 包:

pig build pkg imgsmlr         # 构建 RPM / DEB 包

安装

您可以直接安装 imgsmlr 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install imgsmlr;          # 当前活跃 PG 版本安装
pig ext install -y imgsmlr -v 18  # PG 18
pig ext install -y imgsmlr -v 17  # PG 17
pig ext install -y imgsmlr -v 16  # PG 16
pig ext install -y imgsmlr -v 15  # PG 15
pig ext install -y imgsmlr -v 14  # PG 14
dnf install -y imgsmlr_18       # PG 18
dnf install -y imgsmlr_17       # PG 17
dnf install -y imgsmlr_16       # PG 16
dnf install -y imgsmlr_15       # PG 15
dnf install -y imgsmlr_14       # PG 14
apt install -y postgresql-18-imgsmlr   # PG 18
apt install -y postgresql-17-imgsmlr   # PG 17
apt install -y postgresql-16-imgsmlr   # PG 16
apt install -y postgresql-15-imgsmlr   # PG 15
apt install -y postgresql-14-imgsmlr   # PG 14

创建扩展

CREATE EXTENSION imgsmlr;

用法

imgsmlr: 使用 Haar 小波变换实现 PostgreSQL 相似图片搜索

imgsmlr 扩展基于 Haar 小波变换实现了相似图片搜索功能。它提供了两种数据类型和用于将图片转换为可搜索签名的函数。

CREATE EXTENSION imgsmlr;

数据类型

数据类型存储长度描述
pattern16388 字节图片的 Haar 小波变换结果
signature64 字节pattern 的短表示,用于快速 GiST 索引搜索

函数

函数返回类型描述
jpeg2pattern(bytea)pattern将 JPEG 图片数据转换为 pattern
png2pattern(bytea)pattern将 PNG 图片数据转换为 pattern
gif2pattern(bytea)pattern将 GIF 图片数据转换为 pattern
pattern2signature(pattern)signature从 pattern 创建 signature
shuffle_pattern(pattern)pattern打乱 pattern 以降低对图片位移的敏感度

运算符

运算符左操作数右操作数返回类型描述
<->patternpatternfloat8两个 pattern 之间的欧氏距离
<->signaturesignaturefloat8两个 signature 之间的欧氏距离

signature 类型支持基于 <-> 运算符的 GiST KNN 索引。

示例

从 JPEG 图片创建 pattern 和 signature 表:

CREATE TABLE pat AS (
    SELECT
        id,
        shuffle_pattern(pattern) AS pattern,
        pattern2signature(pattern) AS signature
    FROM (
        SELECT id, jpeg2pattern(data) AS pattern
        FROM image
    ) x
);

ALTER TABLE pat ADD PRIMARY KEY (id);
CREATE INDEX pat_signature_idx ON pat USING gist (signature);

搜索与给定图片最相似的前 10 张图片:

SELECT id, smlr
FROM (
    SELECT
        id,
        pattern <-> (SELECT pattern FROM pat WHERE id = :id) AS smlr
    FROM pat
    WHERE id <> :id
    ORDER BY signature <-> (SELECT signature FROM pat WHERE id = :id)
    LIMIT 100
) x
ORDER BY x.smlr ASC
LIMIT 10;

内层查询利用 GiST 索引按 signature 选出前 100 个候选项,外层查询按 pattern 距离精炼到前 10 个。


最后修改 2026-03-14: update extension metadata (953cbd0)