SQL骚操作,一条SQL 统计近 7天、30天、全部的订单量

Mysql   2023-09-27 09:03   178   0  

你好,我是yes。

最近在搞新项目,一直在迭代,这期接到个新需求,统计商户近 1天、7天、30天、全部的订单量。

一般而言这种统计类需求都不会直接查库,而是交由数仓同学统计,然后回写到业务表或者业务同学直接读数仓表。

但是由于这是新项目,还没接数仓,并且量还没起来,所以这期就将就着先直接查库实现。

那么问题来了,这 SQL 咋写呢?

直接看简化的表结构:

CREATE TABLE order (
  `id` bigint NOT NULL AUTO_INCREMENT,
  `order_no` varchar(32) NOT NULL COMMENT '订单号',
  `user_id` bigint NOT NULL COMMENT '用户id',
  `create_time` timestamp NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
  PRIMARY KEY (`id`) USING BTREE,
  KEY `idx_userid_createtime` (`user_id`,`create_time`) USING BTREE
)

今天是 2023-09-12 ,如果我们要统计近 1 天的订单量,那么 SQL 很简单:

SELECT count(*) FROM order where user_id = 'xx' and time_create >'2023-09-12 00:00:00'

同理 7天、30天

SELECT count(*) FROM order where user_id = 'xx' and time_create >'2023-09-06 00:00:00'

SELECT count(*) FROM order where user_id = 'xx' and time_create >'2023-08-14 00:00:00'

还有全部

SELECT count(*) FROM order where user_id = 'xx'

但是这样一来需要查四次数据库!能不能整个花活,把它压缩成一条 SQL 一次性查询呢?

动脑瓜子刮了刮,还真行!看下面这条 SQL:

SELECT statistics, count(*) from (
SELECT CASE 
 WHEN time_create > '2023-09-12 00:00:00' THEN '1'
 WHEN time_create > '2023-09-06 00:00:00' THEN '7'
 WHEN time_create > '2023-08-14 00:00:00' THEN '30'
 ELSE
  'all'
END as statistics
from `order` where user_id = 'xxx'
) temp GROUP BY statistics;

执行结果如下:

思路就是利用 case when 先给对应时间数据打个标记,存放在临时表,然后通过 group by 统计。

我用了一个 4w 多订单数据的用户测试了一下,执行时间是 0.5s ,问题主要出在临时表,一旦数据量起来就不太行,但是暂时没接数仓就先这样顶着了,就前期用用。

突然回想起前公司那时候没招数据同学,让我去整 BI, 那 SQL 写的天花乱坠,感觉把一辈子的 SQL 都写完了,SQL Boy 也不容易啊。

博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。
闲言碎语
你所有的忧伤,都来自于你的余额。
赞赏支持

如果觉得博客文章对您有帮助,异或土豪有钱任性,可以通过以下扫码向我捐助。也可以动动手指,帮我分享和传播。您的肯定,是我不懈努力的动力!感谢各位亲~