tdigest
tdigest 聚合函数
概览
| 扩展包名 | 版本 | 分类 | 许可证 | 语言 |
|---|---|---|---|---|
tdigest | 1.4.3 | FUNC | Apache-2.0 | C |
| ID | 扩展名 | Bin | Lib | Load | Create | Trust | Reloc | 模式 |
|---|---|---|---|---|---|---|---|---|
| 4700 | tdigest | 否 | 是 | 否 | 是 | 否 | 是 | - |
| 相关扩展 | pg_idkit pgx_ulid pg_uuidv7 pg_hashids sequential_uuids topn quantile lower_quantile |
|---|
版本
| 类型 | 仓库 | 版本 | PG 大版本 | 包名 | 依赖 |
|---|---|---|---|---|---|
| EXT | PGDG | 1.4.3 | 1817161514 | tdigest | - |
| RPM | PGDG | 1.4.2 | 1817161514 | tdigest_$v | - |
| DEB | PGDG | 1.4.3 | 1817161514 | postgresql-$v-tdigest | - |
安装
您可以直接安装 tdigest 扩展包的预置二进制包,首先确保 PGDG 仓库已经添加并启用:
pig repo add pgdg -u # 添加 PGDG 仓库并更新缓存
使用 pig 或者是 apt/yum/dnf 安装扩展:
pig install tdigest; # 当前活跃 PG 版本安装
pig ext install -y tdigest -v 18 # PG 18
pig ext install -y tdigest -v 17 # PG 17
pig ext install -y tdigest -v 16 # PG 16
pig ext install -y tdigest -v 15 # PG 15
pig ext install -y tdigest -v 14 # PG 14
dnf install -y tdigest_18 # PG 18
dnf install -y tdigest_17 # PG 17
dnf install -y tdigest_16 # PG 16
dnf install -y tdigest_15 # PG 15
dnf install -y tdigest_14 # PG 14
apt install -y postgresql-18-tdigest # PG 18
apt install -y postgresql-17-tdigest # PG 17
apt install -y postgresql-16-tdigest # PG 16
apt install -y postgresql-15-tdigest # PG 15
apt install -y postgresql-14-tdigest # PG 14
创建扩展:
CREATE EXTENSION tdigest;
用法
实现 t-digest 算法,用于在线累积基于排名的统计量,如分位数和截尾均值。比 percentile_cont 快得多,支持并行处理,并允许预聚合。
CREATE EXTENSION tdigest;
直接聚合函数
| 函数 | 说明 |
|---|---|
tdigest_percentile(value, compression, quantile) | 估算单个百分位数 |
tdigest_percentile(value, compression, quantiles[]) | 估算多个百分位数 |
tdigest_percentile_of(value, compression, value) | 估算某个值的百分位排名 |
tdigest_percentile_of(value, compression, values[]) | 估算多个值的百分位排名 |
预聚合函数
| 函数 | 说明 |
|---|---|
tdigest(value, compression) | 从数据值构建 t-digest |
tdigest_percentile(digest, quantile) | 从预构建的摘要中估算百分位数 |
tdigest_percentile(digest, quantiles[]) | 从预构建的摘要中估算多个百分位数 |
增量更新函数
| 函数 | 说明 |
|---|---|
tdigest_add(digest, value) | 向现有摘要中添加单个值 |
tdigest_add(digest, values[]) | 向现有摘要中添加一组值 |
tdigest_union(digest, digest) | 合并两个摘要 |
工具函数
| 函数 | 说明 |
|---|---|
tdigest_count(digest) | 返回摘要中的元素数量 |
tdigest_sum(digest, low, high) | 指定值范围内的截尾求和 |
tdigest_avg(digest, low, high) | 指定值范围内的截尾均值 |
参数
compression– 控制精度(值越大越精确,摘要越大)。误差大约为1/compression。
示例
-- 替代: SELECT percentile_cont(0.95) WITHIN GROUP (ORDER BY a) FROM t;
SELECT tdigest_percentile(a, 100, 0.95) FROM t;
-- 多个百分位数
SELECT tdigest_percentile(a, 100, ARRAY[0.5, 0.95, 0.99]) FROM t;
-- 预聚合以实现快速重复查询
CREATE TABLE p AS SELECT a, b, tdigest(c, 100) AS d FROM t GROUP BY a, b;
-- 查询预聚合数据(约 1.5ms vs 精确计算约 7s)
SELECT a, tdigest_percentile(d, 0.95) FROM p GROUP BY a ORDER BY a;