代码编织梦想

视频地址


有一个简单而又常见的需求:分组后取每组的最大一条数据


一、表结构

xdx_user

CREATE TABLE `xdx_user` (
  `id` int(10) NOT NULL AUTO_INCREMENT COMMENT '自增id',
  `name` varchar(255) NOT NULL COMMENT '名称',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4 COMMENT='用户表';

xdx_notify

CREATE TABLE `xdx_notify` (
  `id` int(10) NOT NULL AUTO_INCREMENT COMMENT '自增id',
  `user_id` int(10) NOT NULL COMMENT '用户id',
  `message` varchar(255) NOT NULL COMMENT '消息',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8mb4 COMMENT='通知表';

数据插入


INSERT INTO xdx_user (name) values ('张三'),('李四'),('王五');

INSERT into xdx_notify (user_id, message) VALUES 
(1,  '张三消息1'),(1, '张三消息2'),(1,'张三消息3'), (1, "张三消息 max"),
(2,  '李四消息max'),
(3, '王五消息1'),( 3, '王五消息2'),( 3, '王五消息3'),(3, '王五消息4'),(3, '王五消息max');

二、SQL

要求查出每个用户的 id,姓名,最后一次接收的消息(也就是id最大的)

1     张三      张三消息 max
2     李四      李四消息max
3     王五      王五消息max


2-1、分组找出每个用户的消息最大值

SELECT 
	xu.id '用户ID', 
	xu.name '用户名',
	xn.message '消息内容'
FROM xdx_user xu
LEFT JOIN (
	SELECT * FROM xdx_notify 
	WHERE id IN (SELECT MAX(id) FROM xdx_notify GROUP BY user_id)
) xn ON xu.id = xn.user_id

2-2、先排序,再分组 (错误写法)

以前总以为这种办法是可以的,以为会按照分组之后取第一条,今天却发现不行,不知道是不是因为SQL版本的问题

SELECT 
	xu.id '用户ID', 
	xu.name '用户名',
	xn.message '消息内容'
FROM xdx_user xu
LEFT JOIN (
	SELECT * 
	FROM (SELECT * FROM xdx_notify ORDER BY id DESC) 
	tmp GROUP BY tmp.user_id
) xn ON xu.id = xn.user_id

2-3、关联子查询

SELECT 
	xu.id '用户ID', 
	xu.name '用户名',
	xn.message '消息内容'
FROM xdx_user xu
LEFT JOIN (
	SELECT * FROM xdx_notify a
	WHERE id = (SELECT MAX(id) FROM xdx_notify b WHERE a.user_id =  b.user_id)
) xn ON xu.id = xn.user_id

2-4、使用 NOT EXISTS

SELECT 
	xu.id '用户ID', 
	xu.name '用户名',
	xn.message '消息内容'	
FROM xdx_user xu
LEFT JOIN (
	SELECT * 
	FROM xdx_notify a 
	WHERE NOT EXISTS (SELECT 1 FROM xdx_notify b WHERE a.user_id = b.user_id AND a.id < b.id)
) xn ON xu.id = xn.user_id

三、SQL分析

3-1、分组找出每个用户的消息最大值

通过执行结果发现,三次查询都没有走索引,都是全表扫描的
在这里插入图片描述


3-2、关联子查询

和上述结果一样,也是不走索引的
在这里插入图片描述


3-3、使用 NOT EXISTS

仔细看最里面的子查询,是走了主键索引的
在这里插入图片描述


3-4、总结

虽然上面的三种方法都可以拿到正确的结果,看似好像也差不多,但在实际的过程中却有很大的差别。

在主表900w数据,从表400w数据的时候,1、2写法几乎无法运行,但是写法3却可以很快的得出结果,最慢的就是最内层SQL执行比较慢,写法3却是走索引的所以要快很多。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/Tomwildboar/article/details/124497320

mysql group by 查询每组某值最大的一条数据_芥焉丶的博客-爱代码爱编程

表结构如下: 需求:查询每个学科(type)最高分(score) 想要的结果如下: 尝试通过group by order by 查询 sql 如下 SELECT * FROM `reports` GROUP

mysql分组查时间最新的一条数据-爱代码爱编程

实现逻辑:先查出每组最大的,再和结果关联 SELECT * FROM ( SELECT CONCAT(b.check_batch_code,r.create_time)c,b.check_batch_code,b.`st

mysql 多条数据中,分组获取值最大的数据记录_mysql分组取出每组最大一条-爱代码爱编程

摘要: 多条纪录中,几个字段相同,但是其中一个或者多个字段不同,则去该字段最大(这里只有一个不同) 源数据: 目的是移除:在同一天中只能存在一天数据,则取审核日期最大,数据库脚本如下: SELECT p.BizType, pdt.WeekDate, pdt.BizDateDtl, MAX(p.AuditTime

mysql 查询分组数据中每组某一数值最大的数据_mysql分组取最大一条数据-爱代码爱编程

方法一、将时间进行排序后再分组 该表表名为customer,  park_id表示园区id,joined_at表示用户的加入时间,created_at表示用户的创建时间。 需求:查出每个园区中,最早加入园区的第一位用户 select * from (select * from customer order by joined_at,creat