sql中筛选第一条记录【分组排序】教程
问题描述
我们现在有一张表titles,共有4个字段,分别是emp\_no(员工编号),title(职位),from\_date(起始时间),to\_date(结束时间),记录的是员工在某个时间段内职位名称,因为会存在升职,转岗之类的,里面emp\_no可能会对应多个职位,我们现在要取到所有员工最近的职位信息,包括离职员工。
- -
本文介绍两种方法去实现结果:
方法一
嵌套一个group by+max()子查询获取最近的职位信息。
思路
- 通过对emp\_no分组取每个emp\_no对应的最大的from\_date;
<pre class="sql">```
SELECT
emp_no,
max( from_date ) AS max_date
FROM
titles
GROUP BY
emp_no
结果如下:
- 通过查询出来的最大的from\_date取筛选最近的的一条职位信息。
<pre class="sql">```
SELECT
t.emp_no,
t.title
FROM
titles t
LEFT JOIN ( SELECT emp_no, max( from_date ) AS max_date FROM titles GROUP BY emp_no ) et
ON t.emp_no = et.emp_no AND t.from_date = et.max_date
结果如下:
- -
方法二
通过rank over partition by函数实现,这个目前是Oracle独有的函数,如果你用的是mysql或者sql server就没办法使用了。
语法
功能:在原有表的基础上加上一个根据条件排序的伪列。
<pre class="sql">```
SELECT
*,
RANK() OVER (PARTITION BY emp_no ORDER BY from_date DESC) AS rank
FROM
titles
RANK() OVER (PARTITION BY emp_no ORDER BY from_date DESC) AS rank
表示把表根据emp\_no进行分区,然后在分区内根据from\_date进行降序排列,排序结果生成一列命名为rank。
我们之前在问题里面提到了一个emp\_no会对应多条职位信息,然后对于每个emp\_no的记录进行一个降序排列,接下来我们只需要把上面的结果当成一个子查询然后筛选rank = 1
就好了。
完整代码如下
<pre class="sql">```
SELECT
*
FROM
( SELECT *, RANK ( ) OVER ( PARTITION BY emp_no ORDER BY from_date DESC ) AS rank FROM titles ) r
WHERE
r.rank = '1'
由于我笔记本只装了mysql的环境,所以就没法给各位展示效果了。
- -
综上,如果各位目前使用的是Oracle,推荐各位使用方法二:
- 方法二容错率高,如果titles表里面有两条记录emp\_no和from\_date都是一样的,方法一就会报错了,单条子查询返回多行;
- 方法二还可以实现取第二条,第三条等等的记录,方法一只有一个最大或者最小可供选择。
- -
peace~