pg_summarize
使用LLM对文本字段进行总结
仓库
HexaCluster/pg_summarize
https://github.com/HexaCluster/pg_summarize
源码
pg_summarize-0.0.1.tar.gz
pg_summarize-0.0.1.tar.gz
概览
| 扩展包名 | 版本 | 分类 | 许可证 | 语言 |
|---|---|---|---|---|
pg_summarize | 0.0.1 | RAG | PostgreSQL | Rust |
| ID | 扩展名 | Bin | Lib | Load | Create | Trust | Reloc | 模式 |
|---|---|---|---|---|---|---|---|---|
| 1860 | pg_summarize | 否 | 是 | 否 | 是 | 否 | 否 | - |
| 相关扩展 | vectorize pg_tiktoken pg4ml pgml vector vchord vectorscale pg_net |
|---|
PG18 fix by https://github.com/Vonng/pg_summarize
版本
| 类型 | 仓库 | 版本 | PG 大版本 | 包名 | 依赖 |
|---|---|---|---|---|---|
| EXT | PIGSTY | 0.0.1 | 1817161514 | pg_summarize | - |
| RPM | PIGSTY | 0.0.1 | 1817161514 | pg_summarize_$v | - |
| DEB | PIGSTY | 0.0.1 | 1817161514 | postgresql-$v-pg-summarize | - |
构建
您可以使用 pig build 命令构建 pg_summarize 扩展的 RPM / DEB 包:
pig build pkg pg_summarize # 构建 RPM / DEB 包
安装
您可以直接安装 pg_summarize 扩展包的预置二进制包,首先确保 PGDG 和 PIGSTY 仓库已经添加并启用:
pig repo add pgsql -u # 添加仓库并更新缓存
使用 pig 或者是 apt/yum/dnf 安装扩展:
pig install pg_summarize; # 当前活跃 PG 版本安装
pig ext install -y pg_summarize -v 18 # PG 18
pig ext install -y pg_summarize -v 17 # PG 17
pig ext install -y pg_summarize -v 16 # PG 16
pig ext install -y pg_summarize -v 15 # PG 15
pig ext install -y pg_summarize -v 14 # PG 14
dnf install -y pg_summarize_18 # PG 18
dnf install -y pg_summarize_17 # PG 17
dnf install -y pg_summarize_16 # PG 16
dnf install -y pg_summarize_15 # PG 15
dnf install -y pg_summarize_14 # PG 14
apt install -y postgresql-18-pg-summarize # PG 18
apt install -y postgresql-17-pg-summarize # PG 17
apt install -y postgresql-16-pg-summarize # PG 16
apt install -y postgresql-15-pg-summarize # PG 15
apt install -y postgresql-14-pg-summarize # PG 14
创建扩展:
CREATE EXTENSION pg_summarize;
用法
pg_summarize:使用 LLM 进行文本摘要,基于 pgrx 构建。 来源:README.md
pg_summarize 是一个用 Rust(使用 pgrx)编写的 PostgreSQL 扩展,集成了 OpenAI API。它包含一个基础的 “Hello, pg_summarize!” 函数和一个使用 OpenAI 模型进行文本摘要的 summarize 函数。
快速开始
CREATE EXTENSION pg_summarize;
-- 测试 hello 函数
SELECT hello_pg_summarize();
-- hello_pg_summarize
-- ----------------------
-- Hello, pg_summarize
配置
该扩展从 PostgreSQL 设置中获取配置。使用 summarize 函数前需设置以下参数:
-- 设置 OpenAI API 密钥(必需)
ALTER SYSTEM SET pg_summarizer.api_key = 'your_openai_api_key';
-- 可选设置模型(默认:gpt-3.5-turbo)
ALTER SYSTEM SET pg_summarizer.model = 'gpt-3.5-turbo';
-- 或在会话级别设置提示词
SET pg_summarizer.prompt = 'Your custom prompt here';
-- 如果在 SYSTEM 级别设置,需重新加载配置
SELECT pg_reload_conf();
Summarize 函数
summarize 函数接受文本输入,发送到 OpenAI API,并返回摘要:
-- 摘要文本输入
SELECT summarize('<This is the text to be summarized.>');
-- 从现有数据创建摘要表
CREATE TABLE blogs_summary AS
SELECT blog_url, summarize(blogs_text)
FROM hexacluster_blogs;
-- 使用不同模型
SET pg_summarizer.model = 'gpt-4o';
CREATE TABLE blogs_summary_4o AS
SELECT blog_url, summarize(blogs_text)
FROM hexacluster_blogs;
工作原理
- 配置获取:
summarize函数通过current_setting()从 PostgreSQL 获取设置(API 密钥、模型、提示词)。未找到设置时使用默认值。 - 默认提示词:内置提示词指示 AI 从
<text>标签中摘要文本,重点简洁地捕获最重要的信息。 - API 调用:该函数向 OpenAI 聊天补全端点发送 POST 请求,包含配置的模型和提示词,返回摘要内容。