热门标签 | HotTags
当前位置:  开发笔记 > 数据库 > 正文

HowdoestheMETHOD_OPTparameterworkMethod_opt参数应用

这篇文章将详细介绍method_opt参数怎样影响目标列上的统计信息以及为目标列收集什么类型的统计信息.Method_opt可能是存储过程dbms_stats.gather_*_stats中最令人费解的参数.这个参数最常见的功能就是控制直方图的收集方式,但实际上它的功能远不及此.

这篇文章将详细介绍 method_opt 参数怎样影响目标列上的统计信息以及为目标列收集什么类型的统计信息. Method_opt 可能是存储过程 dbms_stats.gather_*_stats 中最令人费解的参数. 这个参数最常见的功能就是控制直方图的收集方式, 但实际上它的功能远不及此.

这篇文章将详细介绍 method_opt 参数怎样影响目标列上的统计信息以及为目标列收集什么类型的统计信息.

Method_opt 可能是存储过程 dbms_stats.gather_*_stats 中最令人费解的参数. 这个参数最常见的功能就是控制直方图的收集方式, 但实际上它的功能远不及此. 它的实际功能如下所示:

控制哪些列收集基本的统计信息 收集直方图, 收集扩展的统计信息

Method_opt 参数用法分为两个部分, 如下图所示:

\

“For all [indexed | hidden] columns” 这一部分控制着哪些列将会收集列的基本统计信息(目标列上的最小值, 最大值, 列上不同值的数量, 空值的数量等等). 系统默认值为 FOR ALL COLUMNS, 它将收集表上所有列(包括隐藏列)的基本的统计信息. 此外, 它的其他可选值如下所示:

FOR ALL INDEXED COLUMNS 指定只有含有索引的字段才能收集列的基本统计信息. 一般不推荐使用这个选项值, 因为在数据库环境中的所有 sql 语句所使用的字段, 比如 select 后面的字段, where 后面字段, group by 中的字段, 并不只是会引用含有索引的字段.FOR ALL HIDDEN COLUMNS 指定表中所有不可见的字段才能收集列的基本统计信息, 也就是说不会去收集表上实际可见的列的统计信息. 同样的一般也不推荐使用这个选项值. 这个选项值通常只用于这种情况, 在一个所有列的统计信息都是准确的表中新增了一个或几个不可见或者说是虚拟的列, 只需要收集这个或者这几个不可见列的统计信息, 而不再重复去其他列的统计信息, 那么就使用 for all hidden columns 这个选项.

如果一个字段(列)并不包括在这部分收集基本统计信息的列的列表中, 收集完成后只会计算这个列的平均长度. 而列的平均长度通常会用于计算行的平均长度.

"Size [size_clause]" 这一部分控制收集直方图的方式, size 后面可以有以下选项:

AUTO Oracle 自己决定根据列的统计信息(sys.col_usage$)以及列的数据倾斜程度(均匀分布程度)决定哪些列需要收集直方图 Integer 指定收集直方图的桶数, 桶数最小为 1 最大为 254 (针对 11g 及以前的版本, 12c 后没有这个限制).注意如果桶数为 1, 即 size 1 意味着不建立直方图, 如果已经有直方图的列则会删除该列的直方图.REPEAT 只在已经有直方图的列上重新收集直方图. repeat 会确保在全局级别上对已经存在直方图的列重新收集直方图. 一般不推荐使用这个选项, 因为新的直方图使用的桶数将不能超过旧的直方图中的桶数. 假设当前直方图中桶数为 5, 当使用 size repeat 重新收集直方图时, 新的直方图使用的桶数将不能超过 5 , 这钟方式可能不会取得好的效果.SKEWONLY 只在数据不均匀分布的列上收集直方图.

如果 method_opt 的默认参数 FOR ALL COLUMNS SIZE AUTO 在你的数据环境不适用, 可能你遇到的情况属于下面两种情况:

除了指定的列, 在其它列上创建直方图 只在指定的列上创建直方图

下面假设我们只想在 sales 表上的 cust_id 列上创建直方图. 记住, method_opt 参数不仅可以指定哪些列收集基本的统计信息, 还可以指定哪些列收集直方图, 因此我们需要考虑把 method_opt 参数分为两个部分.


下面图中的第一部分指定了哪些列将收集基本的统计信息. 在这里我们想要收集表上所有列的基本统计信息, 因此我们使用 For all columns. 但是关于 size 部分, 我们应该怎样设置参数呢? 因为我们只想在一个列上收集直方图, 所以我们先指定 size 1 来阻止所有列收集直方图(删除所有列的直方图)


下面图中的第二部分指定了 cust_id 列需要收集直方图, “For columns” 是 method_opt 语法中额外的部分, 它允许在参数设置部分为指定的列提供明确的操作. 在这里我们使用 FOR COLUMNS SIZE 254 CUST_ID 来指定 cust_id 列收集直方图. 因此最终的 Method_opt 参数设置如下:

\

下面我们就使用 DBMS_STATS.GATHER_TABLE_STATS 来执行收集统计信息, 虽然在系统中 sales 表中有很多列会用在 where 查询语句中, 但在这里我们只是在 cust_id 列上建立直方图.

BEGIN
dbms_stats.Gather_table_stats('SH', 'SALES', method_opt => 'FOR ALL COLUMNS SIZE 1 FOR COLUMNS SIZE 254 CUST_ID');
END;

/

PL/SQL procedure successfully completed.

SQL> SELECT column_name, num_distinct, histogram

FROM user_tab_col_statistics

WHERE table_name = 'SALES';


\

对于 method_opt 参数在很多种情况下需要用到更复杂的设置, 比如你不想收集指定列的任何统计信息. 目前并没有方法告诉 oracle 怎么样不去收集指定列的统计信息, 但是你可以反过来考虑, 你可以通过 for columns 语法明确的列出需要收集统计信息的列. 下面我们演示不收集 sales 表中 prog_id 列的统计信息的方法:

BEGIN
dbms_stats.delete_column_stats('SH', 'SALES', 'PROD_ID');
END;

/

    PL/SQL procedure completed successfully. 

   BEGIN 
       dbms_stats.Gather_table_stats('SH', 'SALES', 
         method_opt => 'FOR COLUMNS SIZE 254 CUST_ID TIME_ID CHANNEL_ID PROMO_ID QUANTITY_SOLD AMOUNT_SOLD'); 
   END; 
   /

   PL/SQL procedure completed successfully.   

-- 即使我们没有收集 prod_id 列的统计信息, oracle 仍然会准确的计算每行的平均长度.


SQL> SELECT num_rows, avg_row_len FROM user_tables WHERE table_name = 'SALES';

\

   SQL> SELECT column_name, num_distinct, histogram 
          FROM   user_tab_col_statistics 
         WHERE  table_name = 'SALES';

\

注意: for columns 语句只能用于 gather_table_stats 存储过程.

最后, 在本文的开头我提到 method_opt 参数可以用于收集扩展的统计信息. 扩展的统计信息包含两类列的统计信息: 列的组合以及列的表达式的统计信息. 在下面的例子中, oracle 将会收集 sales 表上 prod_id 和 cust_id 列的组合的统计信息以及所有基本列的统计信息, 同时, oracle 还将会为列的组合的统计信息自动生成名字.

   BEGIN
       dbms_stats.Gather_table_stats('SH', 'SALES',
       method_opt => 'FOR ALL COLUMNS SIZE 254 FOR COLUMNS SIZE 254(PROD_ID, CUST_ID)');
   END;
    /
   PL/SQL procedure successfully completed.    

SQL> SELECT column_name, num_distinct, histogram FROM user_tab_col_statistics WHERE table_name = 'SALES';

\

在收集统计信息的语句中, 我们不建议在 method_opt 中直接指定参数, 而建议使用 dbms_stats.set_table_prefs 存储过程

   BEGIN
       dbms_stats.Set_table_prefs('SH', 'SALES', 'METHOD_OPT', -
       'FOR ALL COLUMNS SIZE 254 FOR COLUMNS SIZE 1 PROD_ID');
   END;
    /  

总结, GATHER_DICTIONARY_STATS, GATHER_DATABASE_STATS, 和 GATHER_SCHEMA_STATS 存储过程只接受 “ FOR ALL [INDEXED|HIDDEN] columns ” 语法, 不能指定具体的列名.

GATHER_TABLE_STATS procedure 存储过程可以接受以 “for columns ” 格式的额外参数, 使用这种语法可以控制以下内容:

哪些列将收集基本的统计信息哪些列将收集直方图以及指定直方图的桶数 收集扩展的统计信息

推荐阅读
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了如何在MySQL中将零值替换为先前的非零值的方法,包括使用内联查询和更新查询。同时还提供了选择正确值的方法。 ... [详细]
  • 本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识,包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说,本文提供了一些有价值的参考内容。 ... [详细]
  • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
  • 本文由编程笔记小编整理,介绍了PHP中的MySQL函数库及其常用函数,包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]
  • 本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取,用于解析LOCAL_LISTENER,并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例,并展示了listener.ora文件的内容。 ... [详细]
  • Spring特性实现接口多类的动态调用详解
    本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍,以及getBeansOfType方法的应用,解决了在实际工作中遇到的接口及多个实现类的问题。同时,文章还提到了SPI使用的不便之处,并介绍了借助ApplicationContext实现需求的方法。阅读本文,你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]
  • Java String与StringBuffer的区别及其应用场景
    本文主要介绍了Java中String和StringBuffer的区别,String是不可变的,而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象,内存使用上要优于String类。因此,在需要频繁对字符串进行修改的情况下,使用StringBuffer更加适合。同时,文章还介绍了String和StringBuffer的应用场景。 ... [详细]
  • Oracle分析函数first_value()和last_value()的用法及原理
    本文介绍了Oracle分析函数first_value()和last_value()的用法和原理,以及在查询销售记录日期和部门中的应用。通过示例和解释,详细说明了first_value()和last_value()的功能和不同之处。同时,对于last_value()的结果出现不一样的情况进行了解释,并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。 ... [详细]
  • MyBatis错题分析解析及注意事项
    本文对MyBatis的错题进行了分析和解析,同时介绍了使用MyBatis时需要注意的一些事项,如resultMap的使用、SqlSession和SqlSessionFactory的获取方式、动态SQL中的else元素和when元素的使用、resource属性和url属性的配置方式、typeAliases的使用方法等。同时还指出了在属性名与查询字段名不一致时需要使用resultMap进行结果映射,而不能使用resultType。 ... [详细]
  • 本文详细介绍了在ASP.NET中获取插入记录的ID的几种方法,包括使用SCOPE_IDENTITY()和IDENT_CURRENT()函数,以及通过ExecuteReader方法执行SQL语句获取ID的步骤。同时,还提供了使用这些方法的示例代码和注意事项。对于需要获取表中最后一个插入操作所产生的ID或马上使用刚插入的新记录ID的开发者来说,本文提供了一些有用的技巧和建议。 ... [详细]
  • 本文介绍了一个在线急等问题解决方法,即如何统计数据库中某个字段下的所有数据,并将结果显示在文本框里。作者提到了自己是一个菜鸟,希望能够得到帮助。作者使用的是ACCESS数据库,并且给出了一个例子,希望得到的结果是560。作者还提到自己已经尝试了使用"select sum(字段2) from 表名"的语句,得到的结果是650,但不知道如何得到560。希望能够得到解决方案。 ... [详细]
  • 本文详细介绍了Spring的JdbcTemplate的使用方法,包括执行存储过程、存储函数的call()方法,执行任何SQL语句的execute()方法,单个更新和批量更新的update()和batchUpdate()方法,以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]
  • 高质量SQL书写的30条建议
    本文提供了30条关于优化SQL的建议,包括避免使用select *,使用具体字段,以及使用limit 1等。这些建议是基于实际开发经验总结出来的,旨在帮助读者优化SQL查询。 ... [详细]
  • 本文介绍了通过mysql命令查看mysql的安装路径的方法,提供了相应的sql语句,并希望对读者有参考价值。 ... [详细]
author-avatar
Ly丶爱着那一个人_686
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有