pg_kazsearch

PostgreSQL 哈萨克语全文检索扩展

概览

扩展包名版本分类许可证语言
pg_kazsearch0.1.0FTSLGPL-3.0Rust
ID扩展名BinLibLoadCreateTrustReloc模式
2200pg_kazsearch-

Upstream release/package version is 2.0.0; extension control version is 0.1.0.

版本

类型仓库版本PG 大版本包名依赖
EXTPIGSTY0.1.01817161514pg_kazsearch-
RPMPIGSTY2.0.01817161514pg_kazsearch_$v-
DEBPIGSTY2.0.01817161514postgresql-$v-pg-kazsearch-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64PIGSTY MISSPIGSTY MISS
el8.aarch64PIGSTY MISSPIGSTY MISS
el9.x86_64PIGSTY MISSPIGSTY MISS
el9.aarch64PIGSTY MISSPIGSTY MISS
el10.x86_64PIGSTY MISSPIGSTY MISS
el10.aarch64PIGSTY MISSPIGSTY MISS
d12.x86_64PIGSTY MISSPIGSTY MISS
d12.aarch64
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY MISSPIGSTY MISS
d13.x86_64
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY MISSPIGSTY MISS
d13.aarch64
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY MISSPIGSTY MISS
u22.x86_64
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY MISSPIGSTY MISS
u22.aarch64
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY MISSPIGSTY MISS
u24.x86_64
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY MISSPIGSTY MISS
u24.aarch64
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY 2.0.0
PIGSTY MISSPIGSTY MISS
u26.x86_64PIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISS
u26.aarch64PIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISSPIGSTY MISS

构建

您可以使用 pig build 命令构建 pg_kazsearch 扩展的 RPM / DEB 包:

pig build pkg pg_kazsearch         # 构建 RPM / DEB 包

安装

您可以直接安装 pg_kazsearch 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install pg_kazsearch;          # 当前活跃 PG 版本安装
pig ext install -y pg_kazsearch -v 18  # PG 18
pig ext install -y pg_kazsearch -v 17  # PG 17
pig ext install -y pg_kazsearch -v 16  # PG 16
dnf install -y pg_kazsearch_18       # PG 18
dnf install -y pg_kazsearch_17       # PG 17
dnf install -y pg_kazsearch_16       # PG 16
apt install -y postgresql-18-pg-kazsearch   # PG 18
apt install -y postgresql-17-pg-kazsearch   # PG 17
apt install -y postgresql-16-pg-kazsearch   # PG 16

创建扩展

CREATE EXTENSION pg_kazsearch;

用法

来源:READMEreleases

pg_kazsearch 是一个面向哈萨克语的 PostgreSQL 全文检索扩展。README 说明它会创建可直接使用的文本搜索配置 kazakh_cfg 和词典 pg_kazsearch_dict

快速开始

CREATE EXTENSION pg_kazsearch;

SELECT ts_lexize('pg_kazsearch_dict', 'алмаларымыздағы');
-- {алма}

SELECT to_tsvector('kazakh_cfg', 'президенттің жарлығы');
-- 'жарлық':2 'президент':1

为表添加哈萨克语 FTS

ALTER TABLE articles ADD COLUMN fts tsvector
    GENERATED ALWAYS AS (
        setweight(to_tsvector('kazakh_cfg', title), 'A') ||
        setweight(to_tsvector('kazakh_cfg', body), 'B')
    ) STORED;

CREATE INDEX idx_fts ON articles USING GIN (fts);

SELECT title
FROM articles
WHERE fts @@ websearch_to_tsquery('kazakh_cfg', 'президенттің жарлығы')
ORDER BY ts_rank_cd(fts, websearch_to_tsquery('kazakh_cfg', 'президенттің жарлығы')) DESC
LIMIT 10;

调优

README 说明词典参数可以在运行时调整,无需重启:

ALTER TEXT SEARCH DICTIONARY pg_kazsearch_dict
  (w_deriv = 3.5, w_short_char = 100.0);

发布与打包说明

  • 上游 v2.0.0 引入了当前基于 Rust / pgrx 的架构。
  • 上游 v2.1.0 在 PostgreSQL 扩展之外新增了 Elasticsearch 插件,但 README 中的 PostgreSQL SQL 用法没有变化。
  • 仓库 README 发布 Debian 2.x 软件包,而本项目的 CSV 说明会单独跟踪 extension control version。

注意事项

面向 PostgreSQL 的文档目前较简洁,重点只覆盖词干提取与全文检索用法。这里不要推断 README 未明确列出的额外 SQL 对象,保守限定在 kazakh_cfgpg_kazsearch_dict 和上面给出的示例。