乘风原创程序

  • PostgreSQL 禁用全表扫描的实现
  • 2021/1/27 11:31:44
  • postgresql可以通过一些设置来禁用全表扫描(full scan/seq scan)

    注意:

    设置此功能后不是完全避免全表扫描,而是只要有不通过全表扫描能得出结果的就不走全表扫描。

    如果什么路都不通,那肯定得全表扫描,不然怎么获取数据。

    而且并不是不走全表扫描性能就一定好。

    下面展示下这个功能:

    查询表结构:

    highgo=# \d test
        table test
     column |    type    | modifiers 
    -------------+--------------------------------+-----------
     g   | character varying(50)   | 
     a   | character varying(12)   | 
     m   | timestamp(0) without time zone | 
     w   | character varying(5)   | 
    indexes:
     "s__x0" btree ("g", "a", "m", "w")

    先检查视图:

    highgo=# select * from pg_db_role_setting ;
     setdatabase | setrole | setconfig 
    -------------+---------+-----------
    (0 rows)

    查询执行计划:

    highgo=# explain select "g","z" from test where "g"='pg';
             query plan         
    ------------------------------------------------------------------------------
     seq scan on test (cost=0.00..3.11 rows=1 width=72)
     filter: (("g")::text = '7e'::text)
    (2 rows)

    对用户进行限制:

    highgo=# alter role xyh set enable_seqscan =off;
    alter role
     
    highgo=# select * from pg_db_role_setting ;
     setdatabase | setrole |  setconfig  
    -------------+---------+----------------------
       0 | 26171 | {enable_seqscan=off}

    再次查询执行计划:

    highgo=# explain select "g","z" from test where "g"='7e';
             query plan         
    ------------------------------------------------------------------------------
     index scan using "s__x0" on test (cost=0.14..8.15 rows=1 width=72)
     index cond: (("g")::text = '7e'::text)
    (2 rows)

    补充:psql 会引起全表扫描的10种sql语句

    1、模糊查询效率很低:

    原因:like本身效率就比较低,应该尽量避免查询条件使用like;对于like ‘%...%'(全模糊)这样的条件,是无法使用索引的,全表扫描自然效率很低;另外,由于匹配算法的关系,模糊查询的字段长度越大,模糊查询效率越低。

    解决办法:首先尽量避免模糊查询,如果因为业务需要一定要使用模糊查询,则至少保证不要使用全模糊查询,对于右模糊查询,即like ‘…%',是会使用索引的;左模糊like

    ‘%...'无法直接使用索引,但可以利用reverse + function index 的形式,变化成 like ‘…%';全模糊是无法优化的,一定要的话考虑用搜索引擎。出于降低数据库服务器的负载考虑,尽可能地减少数据库模糊查询。

    2、查询条件中含有is null的select语句执行慢

    原因:oracle 9i中,查询字段is null时单索引失效,引起全表扫描。

    解决方法:sql语法中使用null会有很多麻烦,最好索引列都是not null的;对于is null,可以建立组合索引,nvl(字段,0),对表和索引analyse后,is null查询时可以重新启用索引查找,但是效率还不是值得肯定;is not null 时永远不会使用索引。一般数据量大的表不要用is null查询。

    3、查询条件中使用了不等于操作符(<>、!=)的select语句执行慢

    原因:sql中,不等于操作符会限制索引,引起全表扫描,即使比较的字段上有索引

    解决方法:通过把不等于操作符改成or,可以使用索引,避免全表扫描。例如,把column<>'aaa',改成column<'aaa' or column>'aaa',就可以使用索引了。

    4、使用组合索引

    如果查询条件中没有前导列,那么索引不起作用,会引起全表扫描;但是从oracle9i开始,引入了索引跳跃式扫描的特性,可以允许优化器使用组合索引,即便索引的前导列没有出现在where子句中。

    例如:

    create index skip1 on emp5(job,empno); 

    全索引扫描

    select count(*) from emp5 where empno=7900; 

    索引跳跃式扫描

    select /*+ index(emp5 skip1)*/ count(*) from emp5 where empno=7900; 

    前一种是全表扫描,后一种则会使用组合索引。

    5、or语句使用不当会引起全表扫描

    原因:where子句中比较的两个条件,一个有索引,一个没索引,使用or则会引起全表扫描。例如:where a=:1 or b=:2,a上有索引,b上没索引,则比较b=:2时会重新开始全表扫描。

    6、组合索引

    排序时应按照组合索引中各列的顺序进行排序,即使索引中只有一个列是要排序的,否则排序性能会比较差。

    例如:

    create index skip1 on emp5(job,empno,date); 
    select job,empno from emp5 where job='manager'and empno='10' order by job,empno,date desc; 
    

    实际上只是查询出符合job='manager'and empno='10'条件的记录并按date降序排列,但是写成order by date desc性能较差。

    7、update 语句

    如果只更改1、2个字段,不要update全部字段,否则频繁调用会引起明显的性能消耗,同时带来大量日志。

    8、对于多张大数据量

    (这里几百条就算大了)的表join,要先分页再join,否则逻辑读会很高,性能很差。

    9、select count(*) from table;

    这样不带任何条件的count会引起全表扫描,并且没有任何业务意义,是一定要杜绝的。

    10、sql的where条件要绑定变量

    比如where column=:1,不要写成where column=‘aaa',这样会导致每次执行时都会重新分析,浪费cpu和内存资源。

    以上为个人经验,希望能给大家一个参考,也希望大家多多支持本教程网。如有错误或未考虑完全的地方,望不吝赐教。