provsql
概览
| 扩展包名 | 版本 | 分类 | 许可证 | 语言 |
|---|---|---|---|---|
provsql | 1.4.0 | FEAT | MIT | C++ |
| ID | 扩展名 | Bin | Lib | Load | Create | Trust | Reloc | 模式 |
|---|---|---|---|---|---|---|---|---|
| 2900 | provsql | 否 | 是 | 是 | 是 | 是 | 否 | - |
| 相关扩展 | uuid-ossp |
|---|
版本
| 类型 | 仓库 | 版本 | PG 大版本 | 包名 | 依赖 |
|---|---|---|---|---|---|
| EXT | PIGSTY | 1.4.0 | 1817161514 | provsql | uuid-ossp |
| RPM | PIGSTY | 1.4.0 | 1817161514 | provsql_$v | - |
| DEB | PIGSTY | 1.4.0 | 1817161514 | postgresql-$v-provsql | - |
构建
您可以使用 pig build 命令构建 provsql 扩展的 RPM / DEB 包:
pig build pkg provsql # 构建 RPM / DEB 包
安装
您可以直接安装 provsql 扩展包的预置二进制包,首先确保 PGDG 和 PIGSTY 仓库已经添加并启用:
pig repo add pgsql -u # 添加仓库并更新缓存
使用 pig 或者是 apt/yum/dnf 安装扩展:
pig install provsql; # 当前活跃 PG 版本安装
pig ext install -y provsql -v 18 # PG 18
pig ext install -y provsql -v 17 # PG 17
pig ext install -y provsql -v 16 # PG 16
pig ext install -y provsql -v 15 # PG 15
pig ext install -y provsql -v 14 # PG 14
dnf install -y provsql_18 # PG 18
dnf install -y provsql_17 # PG 17
dnf install -y provsql_16 # PG 16
dnf install -y provsql_15 # PG 15
dnf install -y provsql_14 # PG 14
apt install -y postgresql-18-provsql # PG 18
apt install -y postgresql-17-provsql # PG 17
apt install -y postgresql-16-provsql # PG 16
apt install -y postgresql-15-provsql # PG 15
apt install -y postgresql-14-provsql # PG 14
预加载配置:
shared_preload_libraries = 'provsql';
创建扩展:
CREATE EXTENSION provsql CASCADE; -- 依赖: uuid-ossp
用法
来源:README, v1.4.0 release, latest release, v1.4.0 control, getting started, configuration, semirings, v1.4.0 upgrade
provsql 为 PostgreSQL 添加 semiring provenance 和 uncertainty management。上游文档覆盖 provenance tracking、semiring evaluation、probabilities、Shapley 和 Banzhaf values、where-provenance、update provenance,以及 temporal features。
加载并跟踪 Provenance
shared_preload_libraries = 'provsql'
CREATE EXTENSION provsql CASCADE;
CASCADE 形式会在需要时自动安装 uuid-ossp。getting-started guide 说明 preload 步骤是强制的,因为 ProvSQL 安装了 planner hook。
SELECT provsql.add_provenance('mytable');
SELECT name, provenance()
FROM mytable;
SELECT provsql.remove_provenance('mytable');
用户文档还描述了 provenance mappings:
SELECT create_provenance_mapping('my_mapping', 'mytable', 'column_name');
SELECT create_provenance_mapping_view('my_mapping_view', 'mytable', 'column_name');
概率与影响力
为 tuple tokens 分配概率:
SELECT set_prob(provenance(), 0.8)
FROM mytable
WHERE id = 1;
SELECT name, probability_evaluate(provenance()) AS prob
FROM mytable;
计算 influence scores:
SELECT shapley(provenance(), m.token)
FROM mytable, my_mapping AS m;
SELECT banzhaf(provenance(), m.token)
FROM mytable, my_mapping AS m;
文档还描述了 shapley_all_vars 和 banzhaf_all_vars,用于一次性为所有输入变量计算分数。
内置 Semirings
内置 semiring 函数使用 provenance token 和 provenance mapping table:
SELECT name, sr_boolean(provenance(), 'my_mapping')
FROM mytable;
SELECT name, sr_formula(provenance(), 'my_mapping')
FROM mytable;
SELECT name, sr_how(provenance(), 'my_mapping')
FROM mytable;
provsql 1.4.0 为 sr_how、sr_which、sr_tropical、sr_viterbi、sr_lukasiewicz、sr_minmax 和 sr_maxmin 增加 compiled wrappers。对于 PostgreSQL 14 及之后版本,它还增加了基于 multirange values 的 sr_temporal、sr_interval_num 和 sr_interval_int。
SELECT city,
sr_minmax(provenance(), 'personnel_level',
'unclassified'::classification_level) AS clearance
FROM (SELECT DISTINCT city FROM personnel) AS t;
SELECT entity_id, sr_temporal(provenance(), 'validity_mapping')
FROM mytable;
高级用户仍可定义 custom semirings,并使用 provenance_evaluate 或 aggregation_evaluate 进行求值;当所需代数已有对应 compiled semiring 时,上游推荐使用 compiled semirings。
额外模式与辅助函数
上游文档化的 session GUC 包括:
SET provsql.active = on;
SET provsql.where_provenance = on;
SET provsql.update_provenance = on;
SET provsql.tool_search_path = '/opt/d4:/home/postgres/bin';
SET provsql.aggtoken_text_as_uuid = on;
provsql.tool_search_path 用于 d4、c2d、dsharp、minic2d、weightmc 和 graph-easy 等外部概率与可视化工具。provsql.aggtoken_text_as_uuid 会让 aggregate-token cells 显示为 provenance UUID;agg_token_value_text(token) 可恢复这些 aggregate tokens 的显示文本。
用户指南还单独记录了 where-provenance helpers、update provenance,以及 get_valid_time、timetravel、timeslice、history、undo 等 temporal helpers。版本 1.4.0 还增加了 circuit inspection helpers circuit_subgraph(root, max_depth) 和 resolve_input(uuid),它们供 ProvSQL Studio 使用,也可用于浏览 circuit fragments。
说明
db/extension.csv中的包行列出版本1.4.0、packageprovsql、依赖uuid-ossp,并支持 PostgreSQL 14 到 18。- 上游文档说明 ProvSQL 已在 PostgreSQL 10 到 18 上测试。即使上游 GitHub 现在已有
v1.6.0,Pigsty row 仍跟踪1.4.0,因此对 Pigsty 构建应以 package metadata 作为安装版本。 provsql.update_provenance和 multirange semirings 要求 PostgreSQL 14 或之后版本。