乘风原创程序

    当前位置:首页>>数据库>>Mssql>>PostgreSQL对GROUP BY子句使用常量的特殊限制详解
  • PostgreSQL对GROUP BY子句使用常量的特殊限制详解
  • 2021/2/5 13:01:10
  • 一、问题描述

    最近,一个统计程序从oracle移植到postgresql(版本9.4)时,接连报告错误:

    错误信息1: postgresql group by position 0 is not in select list.

    错误信息2: non-integer constant in group by.

    产生错误的sql类似于:

    insert into sum_tab (intfield1, intfield2, strfield1, strfield2, cnt)
    select intfield, 0, strfield, 'null', count(*) from detail_tab
    where ...
    group by intfield, 0, strfield, 'null';

    其中,detail_tab表保存原始的详细记录,而sum_tab保存统计后的记录信息。

    二、原因分析

    经过测试,发现错误是因为postgresql对group by子句使对使用常量有着特殊限制。测试过程过于繁琐,这里不再一一写demo了,直接给出结论:

    1 group by子句中不能使用字符串型、浮点数型常量, 否则会报告错误信息2。如:

    select intfield, 'aaa', count(*) from tab group by intfield, 'aaa'; 
    select intfield, 0.5, count(*) from tab group by intfield, 0.5;

    2 group by子句中也不能使用0和负整数,否则会报错误信息1。如:

    select intfield, 0, count(*) from tab group by intfield, 0;
    select intfield, -1, count(*) from tab group by intfield, -1;

    那么,group by子句中可以使用什么类型的常量?经测试,在常用的类型中,正整数、日期型常量均可以。

    select intfield, 1, count(*) from tab group by intfield, 1;
    select intfield, now(), count(*) from tab group by intfield, now();

    对于第一节中的sql,因为0和‘null'有着特殊的含义,该如何处理?

    实际上,在group by子句中可以不使用任何常量,只列出聚集字段即可,即将第一节中的sql改为:

    insert into sum_tab (intfield1, intfield2, strfield1, strfield2, cnt)
    select intfield, 0, strfield, 'null', count(*) from detail_tab
    where ...
    group by intfield, strfield;

    三、mysql的情况

    考虑到将来统计程序也可能移植到mysql(版本8.x),随后进行了类似测试,结论为:

    1 支持不带任何常量的group by子句;

    2 支持带非0整数、浮点数(包括0.0)、字符串、日期型常量的group by子句。

    也就是说,在常见类型中,mysql 8的group by子句支持除整数0(非浮点数0.0)以外的所有类型。否则,会报错:

    error 1054 (42s22): unknown column '0' in 'group statement'

    顺便说一句,oracle对整数0也支持。

    四、结论

    1、postgresql的group by子句只支持正整数、日期型的常量;

    2、mysql支持除非0整数以外的所有常规类型常量,而oracle似乎全部支持;

    3、如果有在各各数据库平台可移植的需求,尽量不要在group by子句中使用常量。

    补充:postgresql的group by问题

    关于postgresql数据库分组查询时,跟mysql还是有区别的。纠结了半天

    select
     prjnumber,
     zjhm,
    -- to_char ( to_timestamp ( kqsj / 1000 ), 'yyyy-mm-dd hh24:mi:ss' ) kqsj,
    
     kqflag,
     workername,
     max(kqsj)
     
    -- workertype,
    -- tpcodename,
    -- isactive 
    from
     gb_clockingin 
    where
     kqsj between 1590940800000 and 1593532799000 
     and prjnumber = '3205842019121101a01000' 
    
    group by 
     zjhm,
     kqflag,
     prjnumber,
     workername
    

    以上为个人经验,希望能给大家一个参考,也希望大家多多支持本教程网。如有错误或未考虑完全的地方,望不吝赐教。