provsql

PostgreSQL 半环溯源与不确定性管理扩展

概览

扩展包名版本分类许可证语言
provsql1.4.0FEATMITC++
ID扩展名BinLibLoadCreateTrustReloc模式
2900provsql-
相关扩展uuid-ossp

版本

类型仓库版本PG 大版本包名依赖
EXTPIGSTY1.4.01817161514provsqluuid-ossp
RPMPIGSTY1.4.01817161514provsql_$v-
DEBPIGSTY1.4.01817161514postgresql-$v-provsql-
OS / PGPG18PG17PG16PG15PG14
el8.x86_64
el8.aarch64
el9.x86_64
el9.aarch64
el10.x86_64
el10.aarch64
d12.x86_64
d12.aarch64
d13.x86_64
d13.aarch64
u22.x86_64
u22.aarch64
PIGSTY 1.4.0
PIGSTY 1.4.0
PIGSTY 1.4.0
PIGSTY 1.4.0
PIGSTY 1.4.0
u24.x86_64
u24.aarch64
PIGSTY 1.4.0
PIGSTY 1.4.0
PIGSTY 1.4.0
PIGSTY 1.4.0
PIGSTY 1.4.0
u26.x86_64
u26.aarch64

构建

您可以使用 pig build 命令构建 provsql 扩展的 RPM / DEB 包:

pig build pkg provsql         # 构建 RPM / DEB 包

安装

您可以直接安装 provsql 扩展包的预置二进制包,首先确保 PGDGPIGSTY 仓库已经添加并启用:

pig repo add pgsql -u          # 添加仓库并更新缓存

使用 pig 或者是 apt/yum/dnf 安装扩展:

pig install provsql;          # 当前活跃 PG 版本安装
pig ext install -y provsql -v 18  # PG 18
pig ext install -y provsql -v 17  # PG 17
pig ext install -y provsql -v 16  # PG 16
pig ext install -y provsql -v 15  # PG 15
pig ext install -y provsql -v 14  # PG 14
dnf install -y provsql_18       # PG 18
dnf install -y provsql_17       # PG 17
dnf install -y provsql_16       # PG 16
dnf install -y provsql_15       # PG 15
dnf install -y provsql_14       # PG 14
apt install -y postgresql-18-provsql   # PG 18
apt install -y postgresql-17-provsql   # PG 17
apt install -y postgresql-16-provsql   # PG 16
apt install -y postgresql-15-provsql   # PG 15
apt install -y postgresql-14-provsql   # PG 14

预加载配置

shared_preload_libraries = 'provsql';

创建扩展

CREATE EXTENSION provsql CASCADE;  -- 依赖: uuid-ossp

用法

来源:README, v1.4.0 release, latest release, v1.4.0 control, getting started, configuration, semirings, v1.4.0 upgrade

provsql 为 PostgreSQL 添加 semiring provenance 和 uncertainty management。上游文档覆盖 provenance tracking、semiring evaluation、probabilities、Shapley 和 Banzhaf values、where-provenance、update provenance,以及 temporal features。

加载并跟踪 Provenance

shared_preload_libraries = 'provsql'
CREATE EXTENSION provsql CASCADE;

CASCADE 形式会在需要时自动安装 uuid-ossp。getting-started guide 说明 preload 步骤是强制的,因为 ProvSQL 安装了 planner hook。

SELECT provsql.add_provenance('mytable');

SELECT name, provenance()
FROM mytable;

SELECT provsql.remove_provenance('mytable');

用户文档还描述了 provenance mappings:

SELECT create_provenance_mapping('my_mapping', 'mytable', 'column_name');
SELECT create_provenance_mapping_view('my_mapping_view', 'mytable', 'column_name');

概率与影响力

为 tuple tokens 分配概率:

SELECT set_prob(provenance(), 0.8)
FROM mytable
WHERE id = 1;

SELECT name, probability_evaluate(provenance()) AS prob
FROM mytable;

计算 influence scores:

SELECT shapley(provenance(), m.token)
FROM mytable, my_mapping AS m;

SELECT banzhaf(provenance(), m.token)
FROM mytable, my_mapping AS m;

文档还描述了 shapley_all_varsbanzhaf_all_vars,用于一次性为所有输入变量计算分数。

内置 Semirings

内置 semiring 函数使用 provenance token 和 provenance mapping table:

SELECT name, sr_boolean(provenance(), 'my_mapping')
FROM mytable;

SELECT name, sr_formula(provenance(), 'my_mapping')
FROM mytable;

SELECT name, sr_how(provenance(), 'my_mapping')
FROM mytable;

provsql 1.4.0 为 sr_howsr_whichsr_tropicalsr_viterbisr_lukasiewiczsr_minmaxsr_maxmin 增加 compiled wrappers。对于 PostgreSQL 14 及之后版本,它还增加了基于 multirange values 的 sr_temporalsr_interval_numsr_interval_int

SELECT city,
       sr_minmax(provenance(), 'personnel_level',
                 'unclassified'::classification_level) AS clearance
FROM (SELECT DISTINCT city FROM personnel) AS t;

SELECT entity_id, sr_temporal(provenance(), 'validity_mapping')
FROM mytable;

高级用户仍可定义 custom semirings,并使用 provenance_evaluateaggregation_evaluate 进行求值;当所需代数已有对应 compiled semiring 时,上游推荐使用 compiled semirings。

额外模式与辅助函数

上游文档化的 session GUC 包括:

SET provsql.active = on;
SET provsql.where_provenance = on;
SET provsql.update_provenance = on;
SET provsql.tool_search_path = '/opt/d4:/home/postgres/bin';
SET provsql.aggtoken_text_as_uuid = on;

provsql.tool_search_path 用于 d4c2ddsharpminic2dweightmcgraph-easy 等外部概率与可视化工具。provsql.aggtoken_text_as_uuid 会让 aggregate-token cells 显示为 provenance UUID;agg_token_value_text(token) 可恢复这些 aggregate tokens 的显示文本。

用户指南还单独记录了 where-provenance helpers、update provenance,以及 get_valid_timetimetraveltimeslicehistoryundo 等 temporal helpers。版本 1.4.0 还增加了 circuit inspection helpers circuit_subgraph(root, max_depth)resolve_input(uuid),它们供 ProvSQL Studio 使用,也可用于浏览 circuit fragments。

说明

  • db/extension.csv 中的包行列出版本 1.4.0、package provsql、依赖 uuid-ossp,并支持 PostgreSQL 14 到 18。
  • 上游文档说明 ProvSQL 已在 PostgreSQL 10 到 18 上测试。即使上游 GitHub 现在已有 v1.6.0,Pigsty row 仍跟踪 1.4.0,因此对 Pigsty 构建应以 package metadata 作为安装版本。
  • provsql.update_provenance 和 multirange semirings 要求 PostgreSQL 14 或之后版本。

最后修改 2026-05-18: routine extension update (ac43610)