postgresql数据库计算索引的开销

作者：廖劫讲 | 来源：互联网 | 2014-05-28 15:41

每种索引访问模式都必须提供一个用于规划器/优化器的开销计算函数．这个函数的过程OID在访问模式在pg_am里的记录的amcostestimate字段里给出．注意:在PostgreSQL7.0以前，使用的是另外一种注册与索引相关的开销计算函数的模式．amcostestimate

每种索引访问模式都必须提供一个用于规划器/优化器的开销计算函数．这个函数的过程 OID 在访问模式在 pg_am 里的记录的 amcostestimate 字段里给出．

注意: 在 PostgreSQL 7.0 以前，使用的是另外一种注册与索引相关的开销计算函数的模式．

amcostestimate 函数收到一列 WHERE 子句，这些子句被认为对索引是有用的．这个函数本身必须返回计算出来的访问索引的开销和 WHERE 子句的选择性（也就是说，在索引扫描过程中主表行中要被捡索出来的部分）．对于简单的情况，几乎所有开销计算器的工作都可以通过调用优化器里标准的过程来完成，需要一个 amcostestimate 函数的原因是允许索引访问模式提供一些索引类型相关的信息，这样就有可能改进标准的计算（预计）．

每个 amcostestimate 函数都必须有下面的名字：

void
amcostestimate (Query *root,
RelOptInfo *rel,
IndexOptInfo *index,
List *indexQuals,
Cost *indexStartupCost,
Cost *indexTotalCost,
Selectivity *indexSelectivity,
double *indexCorrelation);
前面四个参数是输入：

root
被处理的查询．

rel
索引所处的关系(表)．

index
索引本身．

indexQuals
索引条件子句列表（隐含地 AND）；一个 NIL 列表表明没有可用的条件．

最后四个参数是通过引用传递的输出：

*indexStartupCost
设置为索引启动处理的开销

*indexTotalCost
设置为索引处理的总开销

*indexSelectivity
设置为索引选择性

*indexCorrelation
设置索引扫描顺序和下层表的顺序之间的相关性系数

请注意开销计算函数必须用 C 写，而不是 SQL 或者任何可以用的过程语言．因为他们必须访问规划器/优化器的内部数据结构．

索引访问开销应该以src/backend/optimizer/path/costsize.c 里面使用的单位计算：一次顺序磁盘存储块抓取开销为 1.0，一次非顺序抓取的开销为 random_page_cost，并且处理一个索引记录的开销通常应该当做 cpu_index_tuple_cost （它是一个可以由用户调节的优化器参数）．另外，应该用一个 cpu_operator_cost 的合适的倍数作为索引处理期间任何激活的比较操作符（尤其是计算 indexQuals （索引查询）自己）．

访问开销应该包含所有与扫描索引本身的相关的磁盘和 CPU 开销，而不是检索或处理被索引标识的主表索引的开销．

"启动开销"是全部索引开销中在我们开始抓取第一条记录之前必须消耗的开销．对于大多数索引，这部分可以当做零，但是一个有着比较高启动开销的索引类型可能希望把这个值设置为非零．

indexSelectivity （索引选择性）应该设置为在索引扫描过程中主表记录里将被检索出的部分．如果是一个松索引的场合，这个数字将明显地比实际传递给给出的资格条件的记录部分高．

indexCorrelation 应该设置为索引顺序和表顺序的相关性系数(范围在 -1.0 和 1.0 之间)．它用于调整从主表中抓取行的开销的计算．

开销计算

一次典型的开销计算器将象下面这样进行：

计算和返回基于给出的资格条件的将要访问的主表的行数量．如果不知到任何索引类型相关的信息，则使用标准的优化器函数 clauselist_selectivity():

*indexSelectivity = clauselist_selectivity(root, indexQuals,
lfirsti(rel->relids));

计算（估计）在扫描过程中将要被访问的索引记录数．对于许多索引类型，这个数字等于 indexSelectivity 乘以索引里面的记录数量，但是它可以更多．（请注意索引在页面里的大小和记录可以从结构 IndexOptInfo 里获得．）

计算（估计）在扫描过程中将要被检索出的索引页面数．这个数字可以只是 indexSelectivity 乘以以页面数计算的索引的大小．

计算索引访问开销．一个常见的计算器可以这样做：

    /*
     * （我们一般性的假设是索引页面将被顺序读入，
     * 因此它们每个的开销为1.0，没有 random_page_cose．
     * 同样，我们计算每条索引记录的索引条件的开销．
     * 所有开销都假设是在扫描过程中逐步递增的．）
     *
     * Our generic assumption is that the index pages will be read
     * sequentially, so they have cost 1.0 each, not random_page_cost.
     * Also, we charge for evaluation of the indexquals at each index tuple.
     * All the costs are assumed to be paid incrementally during the scan.
     */
    cost_qual_eval(&index_qual_cost, indexQuals);
    *indexStartupCost = 0;
    *indexTotalCost = numIndexPages +
        (cpu_index_tuple_cost + index_qual_cost.per_tuple) * numIndexTuples;

计算索引相关性．对于在一个字段上的简单排序的索引，这个它可以从 pg_statistic 中检索出来．如果相关性未知，保守的估计是零(不相关)．

开销计算器的例子可以在 src/backend/utils/adt/selfuncs.c 找到．

通常，一个 amcostestimate 函数的 pg_proc 记录会应该显示八个参数，所有参数都声明为 internal （因为它们的类型都不是 SQL 知道的类型），并且它们的返回类型是 void。

推荐阅读

lua
require luasql.mysql_luarocks错误 require ‘luasql.mysql' 报module 'luasql.mysql' not found:

错误：requireluasql.mysqlstdin:1:moduleluasql.mysqlnotfound:nofieldpackage.preload[lua ... [详细]

蜡笔小新 2023-10-13 11:22:42
lua
初探PLC 的ST 语言转换成C++ 的方法

自动控制软件绕不开ST（StructureText）语言。它是IEC61131-3标准中唯一的一个高级语言。目前，大多数PLC产品支持ST ... [详细]

蜡笔小新 2023-10-17 19:30:09
lua
使用Power Design和SQL Server进行数据库反向工程的方法详解

本文介绍了如何使用Power Design（PD）和SQL Server进行数据库反向工程的方法。通过创建数据源、选择要反向工程的数据表，PD可以生成物理模型，进而生成所需的概念模型。该方法适用于SQL Server数据库，对于其他数据库是否适用尚不确定。详细步骤和操作说明可参考本文内容。 ... [详细]

蜡笔小新 2023-12-14 16:18:06
lua
windows下lua5.3下载解压后的文件功能及wlua53.exe用法说明

本文介绍了在Windows系统下，下载并解压lua5.3后得到的四个文件：lua53.dll, lua53.exe, luac53.exe和wlua53.exe的功能。其中，前三个文件的作用已知，但对于wlua53.exe的具体用法，作者通过查阅资料得出该文件与图形界面的窗口相关，但未找到相关说明。因此，作者希望能够请教关于wlua53.exe的具体用法。 ... [详细]

蜡笔小新 2023-12-09 09:36:07
lua
Ansibleplaybook roles安装redis实例(学习笔记二十九)

1、相关redis参数：2、templatesredis.conf配置相关参数：daemonizeyespidfilevarrunredis_{{red ... [详细]

蜡笔小新 2023-10-17 15:59:52
lua
开发笔记:go 接口

本文由编程笔记#小编为大家整理，主要介绍了go接口相关的知识，希望对你有一定的参考价值。一、接口是什么接口提供了一种方式来说明对象的行为 ... [详细]

蜡笔小新 2023-10-17 15:12:18
lua
Openresty+Lua+Redis灰度发布

Openresty+Lua+Redis灰度发布灰度发布，简单来说，就是根据各种条件，让一部分用户使用旧版本，另一部分用户使用新版本。百度百科中解释：灰度发布是指在黑与白之间，能够平 ... [详细]

蜡笔小新 2023-10-15 13:04:33
lua
cocos2dx-lua使用UIListView制作二级折叠菜单

折叠菜单，用过jqueryaccordion的同学都知道是啥玩艺儿~，图片效果就是介样：cocos2dx不带有此控件，因此我们动手来实现一个。原理很简单，展开的时候往listview里i ... [详细]

蜡笔小新 2023-10-15 10:46:01
match
Server Installation for Jitsi Meet

2019独角兽企业重金招聘Python工程师标准ServerInstallationforJitsiMeetThisdescribesconfiguringaserverji ... [详细]

蜡笔小新 2023-10-14 19:43:03
lua
在lua中调用DLL

整整的花了一个下午的时候，才在lua中调用了动态链接库。比起其他脚本语言，lua的调用方式算是比较繁琐的，但是lua的编程思想非常的统一& ... [详细]

蜡笔小新 2023-10-14 18:22:27
match
在Lua中处理TSV文件

我有一个非常大的TSV文件。第一行是标题。如果字段为空白，则以下各行包含数 ... [详细]

蜡笔小新 2023-10-14 10:54:39
rsa
单目标应用：最有价值球员算法（Most Valuable Player Algorithm，MVPA）求解旅行商问题TSP

一、最有价值球员算法最有价值球员算法（MostValuablePlayerAlgorithm，MVPA）由Bouchekara等人于20 ... [详细]

蜡笔小新 2023-10-14 10:30:17
object
redis知识汇总[随笔记录]

... [详细]

蜡笔小新 2023-10-13 17:02:48
lua
luaI/O

--文件IO：分简单模式与完全模式。简单模式在做一些简单的文件操作时较为合适。但是在进行一些高级的文件操作的时候，简单模式就显得力不从心。例如同时读取多 ... [详细]

蜡笔小新 2023-10-13 13:36:55
lua
样式迁移(风格迁移)

原文来源：https:arxiv.org、https:github.com作者：FujunLuan、SylvainParis、EliShechtman、KavitaB ... [详细]

蜡笔小新 2023-10-13 12:12:36

廖劫讲

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章