一、为什么要避免全表扫描?

全表扫描(Sequential Scan)是PostgreSQL最“直白”的查询方式——它会像翻书一样逐行读取表中所有数据,不管你要的内容在开头还是结尾。比如你有一本1000页的字典,要找“PostgreSQL”这个词,如果没有目录(索引),你得从第一页翻到最后一页,这就是全表扫描。
当表的数据量很小(比如几百行),全表扫描的代价可以忽略;但如果表有100万行甚至1亿行,全表扫描会吃掉大量磁盘I/O和内存资源,导致查询卡半天,还会影响其他业务的正常运行。

二、PostgreSQL是怎么选择执行计划的?

要避免全表扫描,得先理解PostgreSQL的“大脑”——查询规划器(Query Planner)。它的工作流程像“导航软件”:

  1. 接收查询:比如你写了SELECT * FROM users WHERE age > 30;
  2. 生成候选计划:规划器会想出几种执行方式——比如全表扫描、用age列的索引扫描、甚至哈希扫描。
  3. 计算代价:规划器根据统计信息(比如表的大小、age列有多少不同值)给每个计划打分,代价最低的胜出。
  4. 执行计划:PostgreSQL按照最优计划执行查询。

你可以用EXPLAIN ANALYZE命令“看”规划器的选择,比如:

-- 查看执行计划(带实际执行统计)
EXPLAIN ANALYZE SELECT * FROM users WHERE age > 30;

如果输出里有Seq Scan on users,说明用了全表扫描;如果有Index Scan using idx_users_age on users,说明用了索引扫描。

三、避免全表扫描的核心:给“关键列”建索引

索引是PostgreSQL的“目录”,能快速定位到你要的数据。最常用的索引类型是B-tree(适用于等值查询、范围查询),就像字典的拼音目录——按顺序排列,找起来很快。

1. 哪些列需要建索引?

  • WHERE子句里的列:比如ageWHERE age > 30)、emailWHERE email = '[email protected]')。
  • JOIN条件里的列:比如订单表ordersuser_idJOIN users ON orders.user_id = users.id)。
  • 排序/分组的列:比如ORDER BY create_timeGROUP BY category_id

2. 建索引的正确姿势

users表的age列为例,创建B-tree索引:

-- 为users表的age列创建B-tree索引
CREATE INDEX idx_users_age ON users(age);
  • idx_users_age:索引名称(建议用“idx_表名_列名”的格式,容易识别)。
  • ON users(age):指定要建索引的表和列。

3. 哪些情况不适合建索引?

  • 低基数列:比如gender(只有“男”“女”两个值),建索引反而会增加维护成本(插入/更新时要同步更新索引)。
  • 经常更新的列:比如last_login_time(每次登录都要更新),频繁更新会导致索引频繁重构,影响性能。
  • 小表:比如只有100行的config表,全表扫描比索引扫描更快(索引本身也需要读取磁盘)。

四、查询语句改写:让规划器“愿意”用索引

有时候不是没有索引,而是你的SQL写法让规划器“放弃”了索引。以下是常见的“坑”和改写技巧:

1. 避免前缀通配符

坏例子(会全表扫描):

-- 查找邮箱以@example.com结尾的用户(前缀通配符%导致索引失效)
SELECT * FROM users WHERE email LIKE '%@example.com';

好例子(会用索引):

-- 查找邮箱以user开头的用户(后缀通配符%不影响索引)
SELECT * FROM users WHERE email LIKE 'user%@example.com';

原理:B-tree索引是按字符串顺序存储的,比如“[email protected]”“[email protected]”会排在一起。前缀通配符(%在开头)会破坏顺序,规划器无法快速定位;后缀通配符(%在结尾)不影响顺序,可以用索引。

2. 避免对列用函数

坏例子(会全表扫描):

-- 查找邮箱前4个字符是user的用户(SUBSTRING函数导致索引失效)
SELECT * FROM users WHERE SUBSTRING(email, 1, 4) = 'user';

好例子(会用索引):

-- 等价于上面的查询,但能用email列的索引
SELECT * FROM users WHERE email LIKE 'user%';

原理:规划器无法“提前计算”函数的结果——它不能把SUBSTRING(email,1,4)和索引里的email值直接对比,所以只能全表扫描。

3. 避免隐式类型转换

坏例子(会全表扫描):

-- id是整数类型,但查询用了字符串(隐式类型转换导致索引失效)
SELECT * FROM users WHERE id = '123';

好例子(会用索引):

-- 使用正确的整数类型
SELECT * FROM users WHERE id = 123;

原理:PostgreSQL会把id列的每一行都转换成字符串再和'123'对比,这个过程无法用索引。

4. 用显式JOIN代替隐式JOIN

坏例子(隐式JOIN,规划器可能选差的执行计划):

-- 隐式JOIN(用逗号连接表,WHERE写连接条件)
SELECT u.name, o.order_id 
FROM users u, orders o 
WHERE u.id = o.user_id;

好例子(显式INNER JOIN,规划器更易优化):

-- 显式INNER JOIN(用JOIN关键字,ON写连接条件)
SELECT u.name, o.order_id 
FROM users u 
INNER JOIN orders o ON u.id = o.user_id;

原理:显式JOIN让规划器更清楚表之间的关系,能更智能地选择连接顺序(比如先查小表再关联大表)和连接方式(比如Nested Loop Join适合小结果集,Hash Join适合大结果集)。

五、统计信息:规划器的“眼睛”

PostgreSQL的规划器不是“猜”执行计划的,它靠统计信息(比如表的行数、列的不同值数量、数据分布)来计算代价。如果统计信息过时,规划器会做出错误的选择——比如明明age>30的行只有10%,却因为统计信息没更新,继续用全表扫描。

1. 手动更新统计信息

ANALYZE命令更新表的统计信息:

-- 更新users表的统计信息
ANALYZE users;

2. 自动更新统计信息

PostgreSQL有个autovacuum进程(默认开启),会定期自动运行ANALYZE,保持统计信息新鲜。你可以通过以下参数调整:

  • autovacuum_analyze_threshold:触发自动ANALYZE的行数阈值(默认50行)。
  • autovacuum_analyze_scale_factor:触发自动ANALYZE的比例阈值(默认0.1,即10%)。

六、课后Quiz

1. 问题1(基础题)

以下查询为什么会全表扫描?如何优化?

SELECT * FROM orders WHERE order_date BETWEEN '2023-01-01' AND '2023-12-31';

答案解析
如果order_date列没有索引,PostgreSQL会全表扫描所有订单,过滤出2023年的订单。优化方法是为order_date列创建索引:

CREATE INDEX idx_orders_order_date ON orders(order_date);

2. 问题2(原理题)

为什么WHERE LOWER(email) = '[email protected]'不会使用email列的索引?如何优化? 答案解析
因为对email列用了LOWER函数,规划器无法将函数结果与索引中的email值直接匹配,所以不会用索引。优化方法是:

  • 方法1:将email列存储为小写(插入时转小写),查询时不用函数:WHERE email = '[email protected]'
  • 方法2:创建函数索引(针对函数结果建索引):
    CREATE INDEX idx_users_email_lower ON users(LOWER(email));
    

七、常见报错解决方案

1. 报错:ERROR: syntax error at or near "INDEX"

产生原因:创建索引的语法错误(比如漏写ON关键字、拼写错误)。
错误例子

-- 漏写ON关键字,导致语法错误
CREATE INDEX idx_users_age users(age);

解决办法:检查语法,正确写法是CREATE INDEX 索引名 ON 表名(列名);

2. 报错:ERROR: duplicate key value violates unique constraint "idx_users_email"

产生原因:尝试插入重复值到有唯一索引的列(比如email列建了唯一索引,却插入了相同的邮箱)。
解决办法

  • 检查插入的数据,确保email列的值唯一。
  • 如果是误操作,删除重复值后重新插入。

3. 报错:ERROR: index "idx_users_age" does not exist

产生原因:试图删除或使用不存在的索引(比如索引名称拼写错误)。
解决办法

  • d 表名查看表的索引(比如d users查看users表的索引)。
  • 确认索引名称正确后再操作。

参考链接

  1. www.postgresql.org/docs/17/sql…
  2. www.postgresql.org/docs/17/per…
  3. www.postgresql.org/docs/17/sql…
往期文章归档
  • 复杂查询总拖后腿?PostgreSQL多列索引+覆盖索引的神仙技巧你get没? - cmdragon's Blog
  • 只给表子集建索引?用函数结果建索引?PostgreSQL这俩操作凭啥能省空间又加速? - cmdragon's Blog
  • B-tree索引像字典查词一样工作?那哪些数据库查询它能加速,哪些不能? - cmdragon's Blog
  • 想抓PostgreSQL里的慢SQL?pg_stat_statements基础黑匣子和pg_stat_monitor时间窗,谁能帮你更准揪出性能小偷? - cmdragon's Blog
  • PostgreSQL的“时光机”MVCC和锁机制是怎么搞定高并发的? - cmdragon's Blog
  • PostgreSQL性能暴涨的关键?内存IO并发参数居然要这么设置? - cmdragon's Blog
  • 大表查询慢到翻遍整个书架?PostgreSQL分区表教你怎么“分类”才高效
  • PostgreSQL 查询慢?是不是忘了优化 GROUP BY、ORDER BY 和窗口函数? - cmdragon's Blog
  • PostgreSQL里的子查询和CTE居然在性能上“掐架”?到底该站哪边? - cmdragon's Blog
  • PostgreSQL选Join策略有啥小九九?Nested Loop/Merge/Hash谁是它的菜? - cmdragon's Blog
  • PostgreSQL新手SQL总翻车?这7个性能陷阱你踩过没? - cmdragon's Blog
  • PostgreSQL索引选B-Tree还是GiST?“瑞士军刀”和“多面手”的差别你居然还不知道? - cmdragon's Blog
  • 想知道数据库怎么给查询“算成本选路线”?EXPLAIN能帮你看明白? - cmdragon's Blog
  • PostgreSQL处理SQL居然像做蛋糕?解析到执行的4步里藏着多少查询优化的小心机? - cmdragon's Blog
  • PostgreSQL备份不是复制文件?物理vs逻辑咋选?误删还能精准恢复到1分钟前? - cmdragon's Blog
  • 转账不翻车、并发不干扰,PostgreSQL的ACID特性到底有啥魔法? - cmdragon's Blog
  • 银行转账不白扣钱、电商下单不超卖,PostgreSQL事务的诀窍是啥? - cmdragon's Blog
  • PostgreSQL里的PL/pgSQL到底是啥?能让SQL从“说目标”变“讲步骤”? - cmdragon's Blog
  • PostgreSQL视图不存数据?那它怎么简化查询还能递归生成序列和控制权限? - cmdragon's Blog
  • PostgreSQL索引这么玩,才能让你的查询真的“飞”起来? - cmdragon's Blog
  • PostgreSQL的表关系和约束,咋帮你搞定用户订单不混乱、学生选课不重复? - cmdragon's Blog
  • PostgreSQL查询的筛子、排序、聚合、分组?你会用它们搞定数据吗? - cmdragon's Blog
  • PostgreSQL数据类型怎么选才高效不踩坑? - cmdragon's Blog
  • 想解锁PostgreSQL查询从基础到进阶的核心知识点?你都get了吗? - cmdragon's Blog
  • PostgreSQL DELETE居然有这些操作?返回数据、连表删你试过没? - cmdragon's Blog
  • PostgreSQL UPDATE语句怎么玩?从改邮箱到批量更新的避坑技巧你都会吗? - cmdragon's Blog
  • PostgreSQL插入数据还在逐条敲?批量、冲突处理、返回自增ID的技巧你会吗? - cmdragon's Blog
  • PostgreSQL的“仓库-房间-货架”游戏,你能建出电商数据库和表吗? - cmdragon's Blog
  • PostgreSQL 17安装总翻车?Windows/macOS/Linux避坑指南帮你搞定? - cmdragon's Blog
  • 能当关系型数据库还能玩对象特性,能拆复杂查询还能自动管库存,PostgreSQL凭什么这么香? - cmdragon's Blog
  • 给接口加新字段又不搞崩老客户端?FastAPI的多版本API靠哪三招实现? - cmdragon's Blog
  • 流量突增要搞崩FastAPI?熔断测试是怎么防系统雪崩的? - cmdragon's Blog
  • FastAPI秒杀库存总变负数?Redis分布式锁能帮你守住底线吗 - cmdragon's Blog
  • FastAPI的CI流水线怎么自动测端点,还能让Allure报告美到犯规? - cmdragon's Blog
  • 如何用GitHub Actions为FastAPI项目打造自动化测试流水线? - cmdragon's Blog
  • 如何用Git Hook和CI流水线为FastAPI项目保驾护航? - cmdragon's Blog
  • FastAPI如何用契约测试确保API的「菜单」与「菜品」一致?
  • 为什么TDD能让你的FastAPI开发飞起来? - cmdragon's Blog
  • 如何用FastAPI玩转多模块测试与异步任务,让代码不再“闹脾气”? - cmdragon's Blog
  • 如何在FastAPI中玩转“时光倒流”的数据库事务回滚测试?
  • 如何在FastAPI中优雅地模拟多模块集成测试? - cmdragon's Blog
  • 多环境配置切换机制能否让开发与生产无缝衔接? - cmdragon's Blog
  • 如何在 FastAPI 中巧妙覆盖依赖注入并拦截第三方服务调用? - cmdragon's Blog
  • 为什么你的单元测试需要Mock数据库才能飞起来? - cmdragon's Blog
  • 如何在FastAPI中巧妙隔离依赖项,让单元测试不再头疼? - cmdragon's Blog
  • 如何在FastAPI中巧妙隔离依赖项,让单元测试不再头疼? - cmdragon's Blog
  • 测试覆盖率不够高?这些技巧让你的FastAPI测试无懈可击! - cmdragon's Blog
  • 为什么你的FastAPI测试覆盖率总是低得让人想哭? - cmdragon's Blog
  • 如何让FastAPI测试不再成为你的噩梦? - cmdragon's Blog
  • FastAPI测试环境配置的秘诀,你真的掌握了吗? - cmdragon's Blog
免费好用的热门在线工具
  • Mermaid 在线编辑器 - 应用商店 | By cmdragon
  • 数学求解计算器 - 应用商店 | By cmdragon
  • 智能提词器 - 应用商店 | By cmdragon
  • 魔法简历 - 应用商店 | By cmdragon
  • Image Puzzle Tool - 图片拼图工具 | By cmdragon
  • 字幕下载工具 - 应用商店 | By cmdragon
  • 歌词生成工具 - 应用商店 | By cmdragon
  • 网盘资源聚合搜索 - 应用商店 | By cmdragon
  • ASCII字符画生成器 - 应用商店 | By cmdragon
  • JSON Web Tokens 工具 - 应用商店 | By cmdragon
  • Bcrypt 密码工具 - 应用商店 | By cmdragon
  • GIF 合成器 - 应用商店 | By cmdragon
  • GIF 分解器 - 应用商店 | By cmdragon
  • 文本隐写术 - 应用商店 | By cmdragon
  • CMDragon 在线工具 - 高级AI工具箱与开发者套件 | 免费好用的在线工具
  • 应用商店 - 发现1000+提升效率与开发的AI工具和实用程序 | 免费好用的在线工具
  • CMDragon 更新日志 - 最新更新、功能与改进 | 免费好用的在线工具
  • 支持我们 - 成为赞助者 | 免费好用的在线工具
  • AI文本生成图像 - 应用商店 | 免费好用的在线工具
  • 临时邮箱 - 应用商店 | 免费好用的在线工具
  • 二维码解析器 - 应用商店 | 免费好用的在线工具
  • 文本转思维导图 - 应用商店 | 免费好用的在线工具
  • 正则表达式可视化工具 - 应用商店 | 免费好用的在线工具
  • 文件隐写工具 - 应用商店 | 免费好用的在线工具
  • IPTV 频道探索器 - 应用商店 | 免费好用的在线工具
  • 快传 - 应用商店 | 免费好用的在线工具
  • 随机抽奖工具 - 应用商店 | 免费好用的在线工具
  • 动漫场景查找器 - 应用商店 | 免费好用的在线工具
  • 时间工具箱 - 应用商店 | 免费好用的在线工具
  • 网速测试 - 应用商店 | 免费好用的在线工具
  • AI 智能抠图工具 - 应用商店 | 免费好用的在线工具
  • 背景替换工具 - 应用商店 | 免费好用的在线工具
  • 艺术二维码生成器 - 应用商店 | 免费好用的在线工具
  • Open Graph 元标签生成器 - 应用商店 | 免费好用的在线工具
  • 图像对比工具 - 应用商店 | 免费好用的在线工具
  • 图片压缩专业版 - 应用商店 | 免费好用的在线工具
  • 密码生成器 - 应用商店 | 免费好用的在线工具
  • SVG优化器 - 应用商店 | 免费好用的在线工具
  • 调色板生成器 - 应用商店 | 免费好用的在线工具
  • 在线节拍器 - 应用商店 | 免费好用的在线工具
  • IP归属地查询 - 应用商店 | 免费好用的在线工具
  • CSS网格布局生成器 - 应用商店 | 免费好用的在线工具
  • 邮箱验证工具 - 应用商店 | 免费好用的在线工具
  • 书法练习字帖 - 应用商店 | 免费好用的在线工具
  • 金融计算器套件 - 应用商店 | 免费好用的在线工具
  • 中国亲戚关系计算器 - 应用商店 | 免费好用的在线工具
  • Protocol Buffer 工具箱 - 应用商店 | 免费好用的在线工具
  • IP归属地查询 - 应用商店 | 免费好用的在线工具
  • 图片无损放大 - 应用商店 | 免费好用的在线工具
  • 文本比较工具 - 应用商店 | 免费好用的在线工具
  • IP批量查询工具 - 应用商店 | 免费好用的在线工具
  • 域名查询工具 - 应用商店 | 免费好用的在线工具
  • DNS工具箱 - 应用商店 | 免费好用的在线工具
  • 网站图标生成器 - 应用商店 | 免费好用的在线工具
  • XML Sitemap
本站提供的所有下载资源均来自互联网,仅提供学习交流使用,版权归原作者所有。如需商业使用,请联系原作者获得授权。 如您发现有涉嫌侵权的内容,请联系我们 邮箱:[email protected]