1. 部分索引(Partial Indexes)

1.1 什么是部分索引?

部分索引是建立在表子集上的索引,子集由一个**条件表达式(谓词)**定义。只有满足谓词的表行才会被写入索引。相比全表索引,它的优势是:

  • 更小的体积:减少磁盘占用,加快索引查询速度;
  • 更低的维护成本:表更新时,只有满足谓词的行需要同步更新索引;
  • 更精准的查询匹配:只针对特定场景生效。

1.2 部分索引的典型应用场景

1.2.1 排除常见值,减小索引 size

如果某列的常见值占比极高(比如90%以上),且查询很少涉及这些常见值,部分索引可以过滤掉它们,节省空间。

示例:Web访问日志的外部IP查询
假设你存储了Web服务器的访问日志,大部分访问来自公司内部子网(192.168.100.0/24),而你只关心外部IP的访问记录。

-- 创建访问日志表
CREATE TABLE access_log (
    url varchar(255),       -- 访问的URL
    client_ip inet,         -- 客户端IP
    access_time timestamp   -- 访问时间
);

-- 创建部分索引:排除内部IP(192.168.100.0-192.168.100.255)
CREATE INDEX access_log_client_ip_ix 
ON access_log (client_ip)
WHERE NOT (client_ip >= inet '192.168.100.0' AND client_ip <= inet '192.168.100.255');

-- 可使用索引的查询(外部IP)
SELECT * FROM access_log 
WHERE url = '/index.html' AND client_ip = inet '212.78.10.32';

-- 无法使用索引的查询(内部IP,索引中无数据)
SELECT * FROM access_log 
WHERE url = '/index.html' AND client_ip = inet '192.168.100.23';

原理:索引只包含外部IP的记录,查询外部IP时直接扫描小索引;查询内部IP时,PostgreSQL自动选择全表扫描(本来就是更高效的方式)。

1.2.2 排除不感兴趣的值,优化高频查询

如果你的查询只关注表中的小部分行(比如“未结算的订单”),部分索引可以只保留这些行,加快查询速度。

示例:未结算订单的快速查询
假设订单表orders中,90%的订单是“已结算”(billed = true),而你经常查询“未结算订单”(billed = false)。

-- 创建订单表
CREATE TABLE orders (
    order_nr serial PRIMARY KEY,  -- 订单号
    amount numeric(10,2),         -- 订单金额
    billed boolean DEFAULT false  -- 是否结算
);

-- 创建部分索引:只包含未结算的订单
CREATE INDEX orders_unbilled_idx 
ON orders (order_nr)
WHERE NOT billed;

-- 可使用索引的查询(未结算且金额>5000)
SELECT * FROM orders 
WHERE NOT billed AND amount > 5000.00;

-- 无法使用索引的查询(不确定订单是否未结算)
SELECT * FROM orders 
WHERE order_nr = 3501;
1.2.3 实现“部分唯一约束”

部分唯一索引可以仅约束满足条件的记录,比全表唯一约束更灵活。

示例:测试结果的成功记录唯一
假设你需要确保“每个受试者+测试目标的成功记录唯一”,但失败记录可以任意添加。

-- 创建测试结果表
CREATE TABLE tests (
    subject text,       -- 受试者
    target text,        -- 测试目标
    success boolean,    -- 是否成功
    score int           -- 分数
);

-- 创建部分唯一索引:success为true时,subject+target组合唯一
CREATE UNIQUE INDEX tests_success_unique 
ON tests (subject, target)
WHERE success;

-- 允许:同一个subject+target的失败记录
INSERT INTO tests VALUES ('Alice', 'Math', false, 60);
INSERT INTO tests VALUES ('Alice', 'Math', false, 70);

-- 禁止:同一个subject+target的成功记录(会报错)
INSERT INTO tests VALUES ('Alice', 'Math', true, 90);
INSERT INTO tests VALUES ('Alice', 'Math', true, 85);
1.2.4 修正错误的查询计划

如果PostgreSQL的查询 planner 错误地选择了索引扫描(比如数据分布异常),部分索引可以“屏蔽”不适合的查询,强制选择更优的方式(此场景很少见,仅作为最后的优化手段)。

1.3 部分索引的“红线”:不要替代分区!

不要用大量非重叠的部分索引替代分区(Partitioning)。比如对category字段的每个值创建部分索引:

-- 错误示例:用部分索引替代分区
CREATE INDEX mytable_cat_1 ON mytable (data) WHERE category = 1;
CREATE INDEX mytable_cat_2 ON mytable (data) WHERE category = 2;
-- ... 直到 category = N

这种做法会让查询 planner 花费大量时间选择索引,反而降低性能。正确的做法是创建复合索引(将category作为前缀):

-- 正确示例:复合索引替代多个部分索引
CREATE INDEX mytable_cat_data ON mytable (category, data);

如果表数据量极大,复合索引仍不够用,应该使用分区表(参考 官方分区文档)。

2. 表达式索引(Indexes on Expressions)

2.1 什么是表达式索引?

普通索引的列是表的原始列,而表达式索引的列是函数或标量表达式的结果。比如对lower(email)(小写转换)或first_name || ' ' || last_name(字符串拼接)创建索引。

它的核心价值是:将常用计算逻辑预存到索引中,避免查询时重复计算,从而加快查询速度。

2.2 表达式索引的实用示例

2.2.1 大小写不敏感的快速查询

如果经常需要执行大小写不敏感的字符串查询(比如WHERE lower(email) = '[email protected]'),表达式索引可以将小写转换的结果预存,避免全表扫描。

示例:用户表的邮箱查询

-- 创建用户表
CREATE TABLE users (
    id serial PRIMARY KEY,
    email varchar(255) NOT NULL  -- 邮箱(大小写混合)
);

-- 创建表达式索引:存储email的小写形式
CREATE INDEX users_lower_email_idx ON users (lower(email));

-- 可使用索引的查询(大小写不敏感)
SELECT * FROM users 
WHERE lower(email) = '[email protected]';

-- 注意:ILIKE无法使用该索引(表达式不同)
SELECT * FROM users 
WHERE email ILIKE '[email protected]';  -- 效率更低
2.2.2 组合字段的精确匹配

如果经常需要查询多个字段的组合结果(比如first_name || ' ' || last_name = 'John Smith'),表达式索引可以预存组合后的字符串,加快查询速度。

示例:联系人表的全称查询

-- 创建联系人表
CREATE TABLE people (
    first_name varchar(50),  -- 名
    last_name varchar(50)    -- 姓
);

-- 创建表达式索引:存储姓名全称(注意括号!)
CREATE INDEX people_fullname_idx 
ON people ((first_name || ' ' || last_name));

-- 可使用索引的查询(全称匹配)
SELECT * FROM people 
WHERE (first_name || ' ' || last_name) = 'John Smith';

2.3 表达式索引的维护成本

表达式索引的插入/更新代价更高:每次插入或修改表行时,PostgreSQL需要重新计算表达式的值,并同步更新索引。因此,它适合查询频率远高于更新频率的场景(比如用户表的邮箱查询,更新频率低,但查询频繁)。

课后 Quiz:巩固你的理解

问题1:如何用部分索引优化“在售商品的价格查询”?

假设你有一张products表,status字段表示商品状态(in_stock:在售,out_of_stock:缺货,discontinued:停产)。你经常查询“在售商品的价格<100”,但很少查询缺货/停产商品。如何用部分索引优化?

答案解析
创建部分索引,只包含在售商品的price字段:

CREATE INDEX products_in_stock_price_idx 
ON products (price)
WHERE status = 'in_stock';

这样查询在售商品时会扫描小索引,加快速度;更新缺货/停产商品时,不需要修改索引。

问题2:为什么下面的表达式索引会报错?如何修正?

CREATE INDEX people_fullname_idx 
ON people (first_name || ' ' || last_name);

答案解析
报错原因是复杂表达式缺少括号。PostgreSQL要求:非单一函数调用的表达式必须用括号包裹。修正后的语句:

CREATE INDEX people_fullname_idx 
ON people ((first_name || ' ' || last_name));

常见报错解决方案

报错1:部分索引的WHERE条件引用不存在的列

-- 错误示例:WHERE条件用了非表字段`ip`
CREATE INDEX access_log_client_ip_ix 
ON access_log (client_ip)
WHERE NOT (client_ip > inet '192.168.100.0' AND ip < inet '192.168.100.255');

报错信息ERROR: column "ip" does not exist
解决办法:检查WHERE条件中的字段是否属于当前表,修正为client_ip

CREATE INDEX access_log_client_ip_ix 
ON access_log (client_ip)
WHERE NOT (client_ip > inet '192.168.100.0' AND client_ip < inet '192.168.100.255');

报错2:表达式索引缺少括号

-- 错误示例:复杂表达式未用括号
CREATE INDEX people_fullname_idx 
ON people (first_name || ' ' || last_name);

报错信息ERROR: syntax error at or near "||"
解决办法:给表达式添加括号:

CREATE INDEX people_fullname_idx 
ON people ((first_name || ' ' || last_name));

报错3:部分唯一索引的重复插入

-- 示例:部分唯一索引`tests_success_unique`(success=true时subject+target唯一)
INSERT INTO tests VALUES ('Alice', 'Math', true, 90);
INSERT INTO tests VALUES ('Alice', 'Math', true, 85);  -- 重复插入

报错信息ERROR: duplicate key value violates unique constraint "tests_success_unique"
解决办法:检查插入的数据是否符合业务规则,或调整索引谓词(比如允许特定情况的重复)。

参考链接

  • 部分索引官方文档:www.postgresql.org/docs/17/ind…
  • 表达式索引官方文档:www.postgresql.org/docs/17/ind…
  • 分区表官方文档:www.postgresql.org/docs/17/ddl…
往期文章归档
  • B-tree索引像字典查词一样工作?那哪些数据库查询它能加速,哪些不能? - cmdragon's Blog
  • 想抓PostgreSQL里的慢SQL?pg_stat_statements基础黑匣子和pg_stat_monitor时间窗,谁能帮你更准揪出性能小偷? - cmdragon's Blog
  • PostgreSQL的“时光机”MVCC和锁机制是怎么搞定高并发的? - cmdragon's Blog
  • PostgreSQL性能暴涨的关键?内存IO并发参数居然要这么设置? - cmdragon's Blog
  • 大表查询慢到翻遍整个书架?PostgreSQL分区表教你怎么“分类”才高效
  • PostgreSQL 查询慢?是不是忘了优化 GROUP BY、ORDER BY 和窗口函数? - cmdragon's Blog
  • PostgreSQL里的子查询和CTE居然在性能上“掐架”?到底该站哪边? - cmdragon's Blog
  • PostgreSQL选Join策略有啥小九九?Nested Loop/Merge/Hash谁是它的菜? - cmdragon's Blog
  • PostgreSQL新手SQL总翻车?这7个性能陷阱你踩过没? - cmdragon's Blog
  • PostgreSQL索引选B-Tree还是GiST?“瑞士军刀”和“多面手”的差别你居然还不知道? - cmdragon's Blog
  • 想知道数据库怎么给查询“算成本选路线”?EXPLAIN能帮你看明白? - cmdragon's Blog
  • PostgreSQL处理SQL居然像做蛋糕?解析到执行的4步里藏着多少查询优化的小心机? - cmdragon's Blog
  • PostgreSQL备份不是复制文件?物理vs逻辑咋选?误删还能精准恢复到1分钟前? - cmdragon's Blog
  • 转账不翻车、并发不干扰,PostgreSQL的ACID特性到底有啥魔法? - cmdragon's Blog
  • 银行转账不白扣钱、电商下单不超卖,PostgreSQL事务的诀窍是啥? - cmdragon's Blog
  • PostgreSQL里的PL/pgSQL到底是啥?能让SQL从“说目标”变“讲步骤”? - cmdragon's Blog
  • PostgreSQL视图不存数据?那它怎么简化查询还能递归生成序列和控制权限? - cmdragon's Blog
  • PostgreSQL索引这么玩,才能让你的查询真的“飞”起来? - cmdragon's Blog
  • PostgreSQL的表关系和约束,咋帮你搞定用户订单不混乱、学生选课不重复? - cmdragon's Blog
  • PostgreSQL查询的筛子、排序、聚合、分组?你会用它们搞定数据吗? - cmdragon's Blog
  • PostgreSQL数据类型怎么选才高效不踩坑? - cmdragon's Blog
  • 想解锁PostgreSQL查询从基础到进阶的核心知识点?你都get了吗? - cmdragon's Blog
  • PostgreSQL DELETE居然有这些操作?返回数据、连表删你试过没? - cmdragon's Blog
  • PostgreSQL UPDATE语句怎么玩?从改邮箱到批量更新的避坑技巧你都会吗? - cmdragon's Blog
  • PostgreSQL插入数据还在逐条敲?批量、冲突处理、返回自增ID的技巧你会吗? - cmdragon's Blog
  • PostgreSQL的“仓库-房间-货架”游戏,你能建出电商数据库和表吗? - cmdragon's Blog
  • PostgreSQL 17安装总翻车?Windows/macOS/Linux避坑指南帮你搞定? - cmdragon's Blog
  • 能当关系型数据库还能玩对象特性,能拆复杂查询还能自动管库存,PostgreSQL凭什么这么香? - cmdragon's Blog
  • 给接口加新字段又不搞崩老客户端?FastAPI的多版本API靠哪三招实现? - cmdragon's Blog
  • 流量突增要搞崩FastAPI?熔断测试是怎么防系统雪崩的? - cmdragon's Blog
  • FastAPI秒杀库存总变负数?Redis分布式锁能帮你守住底线吗 - cmdragon's Blog
  • FastAPI的CI流水线怎么自动测端点,还能让Allure报告美到犯规? - cmdragon's Blog
  • 如何用GitHub Actions为FastAPI项目打造自动化测试流水线? - cmdragon's Blog
  • 如何用Git Hook和CI流水线为FastAPI项目保驾护航? - cmdragon's Blog
  • FastAPI如何用契约测试确保API的「菜单」与「菜品」一致?
  • 为什么TDD能让你的FastAPI开发飞起来? - cmdragon's Blog
  • 如何用FastAPI玩转多模块测试与异步任务,让代码不再“闹脾气”? - cmdragon's Blog
  • 如何在FastAPI中玩转“时光倒流”的数据库事务回滚测试?
  • 如何在FastAPI中优雅地模拟多模块集成测试? - cmdragon's Blog
  • 多环境配置切换机制能否让开发与生产无缝衔接? - cmdragon's Blog
  • 如何在 FastAPI 中巧妙覆盖依赖注入并拦截第三方服务调用? - cmdragon's Blog
  • 为什么你的单元测试需要Mock数据库才能飞起来? - cmdragon's Blog
  • 如何在FastAPI中巧妙隔离依赖项,让单元测试不再头疼? - cmdragon's Blog
  • 如何在FastAPI中巧妙隔离依赖项,让单元测试不再头疼? - cmdragon's Blog
  • 测试覆盖率不够高?这些技巧让你的FastAPI测试无懈可击! - cmdragon's Blog
  • 为什么你的FastAPI测试覆盖率总是低得让人想哭? - cmdragon's Blog
  • 如何让FastAPI测试不再成为你的噩梦? - cmdragon's Blog
  • FastAPI测试环境配置的秘诀,你真的掌握了吗? - cmdragon's Blog
  • 全链路追踪如何让FastAPI微服务架构的每个请求都无所遁形? - cmdragon's Blog
免费好用的热门在线工具
  • Mermaid 在线编辑器 - 应用商店 | By cmdragon
  • 数学求解计算器 - 应用商店 | By cmdragon
  • 智能提词器 - 应用商店 | By cmdragon
  • 魔法简历 - 应用商店 | By cmdragon
  • Image Puzzle Tool - 图片拼图工具 | By cmdragon
  • 字幕下载工具 - 应用商店 | By cmdragon
  • 歌词生成工具 - 应用商店 | By cmdragon
  • 网盘资源聚合搜索 - 应用商店 | By cmdragon
  • ASCII字符画生成器 - 应用商店 | By cmdragon
  • JSON Web Tokens 工具 - 应用商店 | By cmdragon
  • Bcrypt 密码工具 - 应用商店 | By cmdragon
  • GIF 合成器 - 应用商店 | By cmdragon
  • GIF 分解器 - 应用商店 | By cmdragon
  • 文本隐写术 - 应用商店 | By cmdragon
  • CMDragon 在线工具 - 高级AI工具箱与开发者套件 | 免费好用的在线工具
  • 应用商店 - 发现1000+提升效率与开发的AI工具和实用程序 | 免费好用的在线工具
  • CMDragon 更新日志 - 最新更新、功能与改进 | 免费好用的在线工具
  • 支持我们 - 成为赞助者 | 免费好用的在线工具
  • AI文本生成图像 - 应用商店 | 免费好用的在线工具
  • 临时邮箱 - 应用商店 | 免费好用的在线工具
  • 二维码解析器 - 应用商店 | 免费好用的在线工具
  • 文本转思维导图 - 应用商店 | 免费好用的在线工具
  • 正则表达式可视化工具 - 应用商店 | 免费好用的在线工具
  • 文件隐写工具 - 应用商店 | 免费好用的在线工具
  • IPTV 频道探索器 - 应用商店 | 免费好用的在线工具
  • 快传 - 应用商店 | 免费好用的在线工具
  • 随机抽奖工具 - 应用商店 | 免费好用的在线工具
  • 动漫场景查找器 - 应用商店 | 免费好用的在线工具
  • 时间工具箱 - 应用商店 | 免费好用的在线工具
  • 网速测试 - 应用商店 | 免费好用的在线工具
  • AI 智能抠图工具 - 应用商店 | 免费好用的在线工具
  • 背景替换工具 - 应用商店 | 免费好用的在线工具
  • 艺术二维码生成器 - 应用商店 | 免费好用的在线工具
  • Open Graph 元标签生成器 - 应用商店 | 免费好用的在线工具
  • 图像对比工具 - 应用商店 | 免费好用的在线工具
  • 图片压缩专业版 - 应用商店 | 免费好用的在线工具
  • 密码生成器 - 应用商店 | 免费好用的在线工具
  • SVG优化器 - 应用商店 | 免费好用的在线工具
  • 调色板生成器 - 应用商店 | 免费好用的在线工具
  • 在线节拍器 - 应用商店 | 免费好用的在线工具
  • IP归属地查询 - 应用商店 | 免费好用的在线工具
  • CSS网格布局生成器 - 应用商店 | 免费好用的在线工具
  • 邮箱验证工具 - 应用商店 | 免费好用的在线工具
  • 书法练习字帖 - 应用商店 | 免费好用的在线工具
  • 金融计算器套件 - 应用商店 | 免费好用的在线工具
  • 中国亲戚关系计算器 - 应用商店 | 免费好用的在线工具
  • Protocol Buffer 工具箱 - 应用商店 | 免费好用的在线工具
  • IP归属地查询 - 应用商店 | 免费好用的在线工具
  • 图片无损放大 - 应用商店 | 免费好用的在线工具
  • 文本比较工具 - 应用商店 | 免费好用的在线工具
  • IP批量查询工具 - 应用商店 | 免费好用的在线工具
  • 域名查询工具 - 应用商店 | 免费好用的在线工具
  • DNS工具箱 - 应用商店 | 免费好用的在线工具
  • 网站图标生成器 - 应用商店 | 免费好用的在线工具
  • XML Sitemap
本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:[email protected]