pg_summarize

使用LLM对文本字段进行总结

概览

扩展包名版本分类许可证语言
pg_summarize0.0.1RAGPostgreSQLRust
ID扩展名BinLibLoadCreateTrustReloc模式
1860pg_summarize-
相关扩展vectorize pg_tiktoken pg4ml pgml vector vchord vectorscale pg_net

PG18 fix by https://github.com/Vonng/pg_summarize

版本

类型仓库版本PG 大版本包名依赖
EXTPIGSTY0.0.11817161514pg_summarize-
RPMPIGSTY0.0.11817161514pg_summarize_$v-
DEBPIGSTY0.0.11817161514postgresql-$v-pg-summarize-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64
el8.aarch64
el9.x86_64
el9.aarch64
el10.x86_64
el10.aarch64
d12.x86_64
d12.aarch64
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
d13.x86_64
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
d13.aarch64
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
u22.x86_64
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
u22.aarch64
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
u24.x86_64
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
u24.aarch64
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1
PIGSTY 0.0.1

构建

您可以使用 pig build 命令构建 pg_summarize 扩展的 RPM / DEB 包:

pig build pkg pg_summarize         # 构建 RPM / DEB 包

安装

您可以直接安装 pg_summarize 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install pg_summarize;          # 当前活跃 PG 版本安装
pig ext install -y pg_summarize -v 18  # PG 18
pig ext install -y pg_summarize -v 17  # PG 17
pig ext install -y pg_summarize -v 16  # PG 16
pig ext install -y pg_summarize -v 15  # PG 15
pig ext install -y pg_summarize -v 14  # PG 14
dnf install -y pg_summarize_18       # PG 18
dnf install -y pg_summarize_17       # PG 17
dnf install -y pg_summarize_16       # PG 16
dnf install -y pg_summarize_15       # PG 15
dnf install -y pg_summarize_14       # PG 14
apt install -y postgresql-18-pg-summarize   # PG 18
apt install -y postgresql-17-pg-summarize   # PG 17
apt install -y postgresql-16-pg-summarize   # PG 16
apt install -y postgresql-15-pg-summarize   # PG 15
apt install -y postgresql-14-pg-summarize   # PG 14

创建扩展

CREATE EXTENSION pg_summarize;

用法

pg_summarize:使用 LLM 进行文本摘要,基于 pgrx 构建。 来源:README.md

pg_summarize 是一个用 Rust(使用 pgrx)编写的 PostgreSQL 扩展,集成了 OpenAI API。它包含一个基础的 “Hello, pg_summarize!” 函数和一个使用 OpenAI 模型进行文本摘要的 summarize 函数。


快速开始

CREATE EXTENSION pg_summarize;

-- 测试 hello 函数
SELECT hello_pg_summarize();
--  hello_pg_summarize
-- ----------------------
--  Hello, pg_summarize

配置

该扩展从 PostgreSQL 设置中获取配置。使用 summarize 函数前需设置以下参数:

-- 设置 OpenAI API 密钥(必需)
ALTER SYSTEM SET pg_summarizer.api_key = 'your_openai_api_key';

-- 可选设置模型(默认:gpt-3.5-turbo)
ALTER SYSTEM SET pg_summarizer.model = 'gpt-3.5-turbo';

-- 或在会话级别设置提示词
SET pg_summarizer.prompt = 'Your custom prompt here';

-- 如果在 SYSTEM 级别设置,需重新加载配置
SELECT pg_reload_conf();

Summarize 函数

summarize 函数接受文本输入,发送到 OpenAI API,并返回摘要:

-- 摘要文本输入
SELECT summarize('<This is the text to be summarized.>');

-- 从现有数据创建摘要表
CREATE TABLE blogs_summary AS
  SELECT blog_url, summarize(blogs_text)
  FROM hexacluster_blogs;

-- 使用不同模型
SET pg_summarizer.model = 'gpt-4o';
CREATE TABLE blogs_summary_4o AS
  SELECT blog_url, summarize(blogs_text)
  FROM hexacluster_blogs;

工作原理

  • 配置获取summarize 函数通过 current_setting() 从 PostgreSQL 获取设置(API 密钥、模型、提示词)。未找到设置时使用默认值。
  • 默认提示词:内置提示词指示 AI 从 <text> 标签中摘要文本,重点简洁地捕获最重要的信息。
  • API 调用:该函数向 OpenAI 聊天补全端点发送 POST 请求,包含配置的模型和提示词,返回摘要内容。

最后修改 2026-03-14: update extension metadata (953cbd0)