作家
登录

PostgreSQL逻辑优化—这样搭建整体架构

作者: 来源: 2017-12-12 16:33:21 阅读 我要评论

开辟者大年夜赛路演 | 12月16日,技巧立异,北京不见不散


PostgreSQL逻辑优化——如许搭建整体架构

一棵完成 transform 和 rewrite 操作的萌芽树是否是一棵最优的萌芽树?如不雅不是,那么竽暌怪该若何对该萌芽树进行优化?而优化所应用的策略恰是本文要评论辩论的重点内容,并且优化部分也是全部萌芽引擎的可贵。

子链接(SubLink)若何优化?子萌芽(SubQuery)又若何处理?对表达式(Expression)若何进行优化?若何寻找最优的萌芽筹划(Cheapest Plan)?哪些身分会影响 JOIN 策略(Join Strategies)的选择,而这些策略又是什么?萌芽价值(Cost)又是若何估算的?何时需对萌芽筹划进行物化(Plan Materialization)处理等一系列的问题。

在萌芽筹划的优化过程中,对不合的语句类型有着不合的处理策略:

(1)对对象类语句(例如,DML、DDL 语句),一向行更进一步的优化处理。

(2)当语句为非对象语句时,PostgreSQL 应用 pg_plan_queries 对语句进行优化。

与前面一样,PostreSQL 也供给定制化优化引擎接口,我们可以应用自定义优化器 planner_hook,或者应用标准化优化器 standard_planner。

Pg_plan_queries 的函数原型如下所示。

逻辑优化——整体架构介绍

在未应用第三方供给的优化器时,PostgreSQL 将 planner 函数作为优化的人口函数,并由函数 subquery_planner 来完成具体的优化操作。大年夜下图中的 Call Stack 我们可以看出 planner 与 subquery_planner 之间的调用关系。

在 standard_planner 中,起首处理 “DECLARE CURSOR stmt” 情势的语句,即竽暌刮标语句,并设置 tuple_fraction 值。那么 tuple_fraction 又是什么呢?

完查对 tuple_faction 的设置后,进入后续优化流程,subquery_planner 的函数原型如下所示。

这里也许你也许会困惑,为什么是 subquery_planner 呢?大年夜名字上看该函数像是用来处理子萌芽,那么为什么竽暌姑来作为全部萌芽语句优化的人口呢(Primary Entry Point)?

子萌芽语句作为萌芽语句的一部分,很大年夜程度上与父萌芽具有类似的构造,同时两者在处理方法和办法上也存在着必定的类似性:子萌芽的处理流程可以在对其父萌芽的过程中应用。例如,本例中的子萌芽语句 SELECT sno FROM student WHERE student.classno = sub.classno,其处理方法与全部萌芽语句一样。是以,应用 subquery_planner 作为我们萌芽优化的人口,固然大年夜函数名上来看其似乎是用于子萌芽语句的处理。

由 gram.y 中给出的 SelectStmt 的定义可以看出,个中包含了诸如 WINDOWS、HAVING、ORDER BY、GROUP BY 等子句。那du么 subquery_planner 函数似乎也应当有响应于这些语句的优化处理。就这点而言,subquery_planner 与原始语法树到萌芽树的转换所采取的处理方法类似。根据上述分析,我们可给出如下所示的 subquery_planner 的函数原型。

按照上述给出的原型,只要完成假定的 process_xxx 函数,就可以实现对萌芽语法树的优化工作。是不是认为很简单?当然不是,道理很简单,然则理论与实际还有必定的距离。

例如,若何处理萌芽中大年夜量出现的子链接?若何对 d 算子履行 “下推”?若何选择索引?若何选择 JOIN 策略?这些都须要我们细心处理。

函数以萌芽树作为输入参数,并以优化后语句作为返回值。

PostgreSQL 给出的 subquery_planner 如下所示。

tuple_fraction 描述我们期望获取的元组的比例,0 代表我们须要获取所有的元组;当 tuple_factionÎ(0,1) 时,注解我们须要大年夜知足前提的元组中掏出 tuple_faction 这么多比例的元组;当 tuple_factionÎ [1,+¥ ) 时,注解我们将按照所指定的元组数进行检索,例如,LIMIT 语句中所指定的元组数。

由 PostgreSQL 给出的实现可以看出,核心处理思惟与我们评论辩论的相一致:根据类型对萌芽语句进行分类处理。

这里须要留意的一点就是萌芽筹划的生成部分,PostgreSQL 将萌芽筹划的生成也归入 subquery_planner 中,但为了便利问题的评论辩论,我们并未将萌芽筹划的生成部分在 subquery_planner 中给出。我们将萌芽优化的重要步调总结如下:

处理 CTE 表达式,ss_process_ctes;上提子链接,pull_up_sublinks;FROM 子句中的内联函数,集合操作,RETURN 及函数处理,inline_set_returning_ functions;上提子萌芽,pull_up_subqueries;UNION ALL 语句处理,flatten_simple_union_all;处理 FOR UPDATE(row lock)情况,preprocess_rowmarks;持续表的处理,expand_inherited_tables;处理目标列(target list),preprocess_expression;处理 withCheckOptions,preprocess_expression;处理 RETURN 表达式,preprocess_expression;处理前提语句 - qual,preprocess_qual_conditions;处理 HAVING 子句,preprocess_qual_conditions;处理 WINDOW 子句,preprocess_qual_conditions;处理 LIMIT OFF 子句,preprocess_qual_conditions;WHERE 和 HAVING 子句中的前提归并,如不雅存在能归并的 HAVING 子句则将其归并到 WHERE 前提中,不然保存在 HAVING 子句中; 清除外连接(Outer Join)中的冗余部分,reduce_outer_joins;生成萌芽筹划,grouping_planner。 	
				
			

  推荐阅读

  如何在执行一个命令或程序之前就了解它会做什么

开辟者大年夜赛路演 | 12月16日,技巧立异,北京不见不散 有没有想过在履行一个 Unix 敕令前就知道它干些什么呢?并不是每小我都邑知道一个特定的敕令或者法度榜样将会做什么。当然,你可以>>>详细阅读


本文标题:PostgreSQL逻辑优化—这样搭建整体架构

地址:http://www.17bianji.com/lsqh/39716.html

关键词: 探索发现

乐购科技部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与乐购科技进行文章共享合作。

网友点评
自媒体专栏

评论

热度

精彩导读
栏目ID=71的表不存在(操作类型=0)