DeepSeek总结的PostgreSQL 表访问方法

张

张建站

2026/5/21 20:06:29

10分钟阅读

来源https://thebuild.com/blog/2026/05/20/table-access-methods-wake-up/PostgreSQL 表访问方法醒醒吧作者:Christophe Pettus日期:2026-05-20表访问方法 API 自 PostgreSQL 12 版本开始就存在了。在它存在的大部分时间里它一直是一个安静的底层设施几乎没有扩展活动与之相关——一种在文档中占一个段落、在会议上有一个热情的演讲然后就是五年沉默的 API。这种情况正在改变。在过去的一个月里两个与 TAM 相关的扩展发布了重要版本。storage_engine1.0.7 为 PG 16-18 增加了面向列的压缩和行压缩访问方法。pg_sorted_heap0.13.0 提供了一个物理排序的堆带有区域映射修剪和一个与规划器集成的向量搜索钩子。这两者都不会在明天取代默认的堆。但它们都在做一些足够有趣的事情值得一看。最初的承诺以及它为何停滞不前TAM API 最初的承诺是存储布局可以按表进行交换而无需触及规划器和执行器的其余部分。实际情况则不那么干净。TAM 接口在几个地方假设了一个元组形状的记录这对于行存储变体来说没问题但对于列式存储来说则不舒服。默认情况下成本估计不知道你自定义存储的访问模式因此规划器会愉快地为那些本应进行区域映射修剪的布局生成顺序扫描计划。大多数早期的 TAM 扩展要么接受规划器的成本导致慢速计划要么提供扩展特定的规划器钩子这带来了维护负担并且每个主要版本都会出现问题。这两种结果都没有激发出后续工作的浪潮。现在不同的是在扩展中提供规划器钩子的成本已经降低并且对其的需求已经增加。pg_sorted_heap实际在做什么pg_sorted_heap有趣之处在于它将用于范围和向量相似性查询的规划器钩子直接集成到访问方法中。堆按用户指定的键进行物理排序。该键上的区域映射与堆一起维护。规划器被告知这两者。对排序键的范围查询在扫描时修剪整个区域无需索引。向量域中的最近邻查询使用相同的机制作为粗略的第一遍然后进行精炼。这是一个真实的架构模式——它出现在 DuckDB、ClickHouse、每个现代 Parquet 读取器以及早期的pg_lake扩展代码中——最终通过 TAM 进入标准 PostgreSQL。实现的稳健性是另一个问题。0.13.0 版本还很早期。但其设计是正确的设计。storage_engine在做什么storage_engine1.0.7 做了一些不同的事情新颖程度较低但更直接有用。colcompress访问方法将列打包到压缩的运行中并在读取时支付解包成本。rowcompress访问方法在常规行布局之上进行块级压缩。两者都是有限度的实验。都不会成为你的主要 OLTP 表。两者在堆和 TOAST 无法满足需求的特定场景中都很有用。如果你有宽列的、主要追加的表包含高基数的 varchar 列并且你一直在说服自己构建一个单独的分析副本在你这样做之前请先看看这个。接下来会发生什么未来一年值得关注的是为 PG19/PG20 提出的核心列式工作与 TAM 扩展生态系统是趋同还是分化。社区的方向广泛地朝向更强的可插拔性——更细粒度的 TAM 钩子、无需解析pgsql-hackers上每个补丁的规划器集成点以及一个自定义存储可以插入的真实成本估算方案。供应商的方向Snowflake、Databricks、Microsoft都在其 Postgres 形态产品的下面有专有存储层则广泛地背离这一点因为它们的差异化位于 TAM 线之下而可插拔性会削弱其护城河。无论哪一方赢得未来两年的架构心智份额都将决定 2028 年“Postgres”的含义。我有一个偏好。你可以猜到是什么。今天实际的答案是运行基准测试。两个扩展都有足够稳定的版本你可以这样做。TAM 时代不再是假设。

制造业数智化转型落地新思路：AI不是炫技，是解决实际生产痛点

当下制造业数智化转型早已进入深水区，很多企业陷入一个怪圈：跟风上线各类 AI 工具、数字化系统，最后却大多沦为摆设。究其根本，不是 AI 技术不够先进，而是多数方案只懂技术不懂工业，看不懂产线真实痛点、摸…...

2026/5/21 20:05:14 阅读更多 →

Java地址解析神器：5分钟解决收货地址智能识别难题

Java地址解析神器：5分钟解决收货地址智能识别难题【免费下载链接】address-parse Java 版智能解析收货地址项目地址: https://gitcode.com/gh_mirrors/addr/address-parse 还在为处理混乱的收货地址而头疼吗？😫 用户填写的地址信息五…...

2026/5/21 20:03:33 阅读更多 →

从零开始：Java原生连接RabbitMQ完整流程（个人学习笔记001)

TOC) 该文章仅用于个人复习与记录，如有错误，烦请指出，非常感谢 RabbitMQ 是一款开源的消息中间件（也称为消息队列），其核心作用是让不同的系统、服务或组件之间能够异步地传递数据。使用该中间件可以很好地…...

2026/5/21 20:02:15 阅读更多 →

app扫描wifi的时候需要打开GPS定位----否则扫不到

这是很奇怪的一个事情，wifi和定位有什么关系？但是就是要打开。...

2026/5/18 6:22:28 阅读更多 →

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！

AMD Ryzen调试神器SMUDebugTool：免费开源工具让你的处理器性能飞起来！ 【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Tab…...

2026/5/19 8:13:30 阅读更多 →

Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密）

更多请点击： https://intelliparadigm.com 第一章：Midjourney抽象表现主义风格迁移全链路（从梵高笔触到AI熵增美学的底层逻辑解密） 抽象表现主义并非仅关乎色彩与笔触的失控，而是神经感知系统在高维特征空间中对抗坍缩…...

2026/5/19 8:47:40 阅读更多 →

2026届毕业生推荐的AI科研方案实际效果

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 处在学术研究的起始阶段，开题报告的撰写常常令好多研究生以及青年学者觉得麻烦&…...

2026/5/18 10:49:06 阅读更多 →