Hive综合案例练习(中级)第二题:查询至少连续三天下单的用户
创始人
2024-06-03 16:13:03

查询至少连续三天下单的用户

题目需求

查询订单信息表(order_info)中最少连续3天下单的用户id,期望结果如下:

user_id
101

题目解析

  • 第一步:用户一天可能存在多次下单的情况,所以需要对用户进行去重

去重方法如下:

--方法一:使用distinct
selectdistinctuser_id,create_date
from order_info;--方法二:使用group by
selectuser_id,create_date
from order_info
group by user_id, create_date;--方法二:使用窗口函數
selectuser_id,create_date
from
(selectuser_id,create_date,row_number() over (partition by user_id,create_date) rnfrom order_info
)t1
where rn=1;
  • 第二步:具体见各个方案。

代码实现

  • 方案一

    selectdistinct user_id
    from
    (selectuser_idfrom(selectuser_id,create_date,date_sub(create_date, row_number() over (partition by user_id order by create_date)) difffrom(selectuser_id,create_datefrom order_infogroup by user_id, create_date)t1)t2group by user_idhaving count(diff) >= 3
    )t3
    
  • 方案二

    selectdistinct user_id
    from
    (selectuser_id,datediff(lead2, create_date) difffrom(selectuser_id,create_date,lead(create_date, 2, '9999-12-31') over (partition by user_id order by create_date) lead2from(selectuser_id,create_datefrom order_infogroup by user_id, create_date)t1)t2
    )t3
    where diff=2;
    
  • 方案三

    selectdistinct user_id
    from
    (selectuser_id,ts,count(*) over (partition by user_id order by ts range between 86400 preceding and 86400 following) cntfrom(selectuser_id,unix_timestamp(create_date, 'yyyy-MM-dd') tsfrom(selectuser_id,create_datefrom order_infogroup by user_id, create_date)t1)t2
    )t3
    where cnt=3;
    

相关内容

热门资讯

清华大学等联手打造智能分析系统...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:科技行者)这...
【诗华动保特约】上涨50-10... (来源:博亚和讯)受原料豆粕、玉米价格上涨影响,加之后续将迎来年前饲料需求旺季,饲盟、大北农、正大、...
【甘快看·家有喜事】硬核村支书... “这边牛料再加点,你看这脊背,还得往上提提膘。”“这批牛长势不错,大家的辛苦没白费。”“防疫记录再核...
李在明指示韩国军警联合调查可能... 据韩联社10日报道,针对可能有民间无人机“侵入朝鲜”,韩国总统李在明当天指示军警联合调查组进行严格调...
上海宝藏社区食堂|上海苏州河畔... (来源:上观新闻)昨天中午11时不到,位于静安区康定东路28号的“蝴蝶食坊”社区食堂内,取餐档口前已...