数据库如何取前百分之N的记录?

    作者:丶平凡世界更新于: 2021-06-27 22:49:49

    不同的SQL平台,如何取前百分之N的记录?数据库的基本结构分三个层次,反映了观察数据库的三种不同角度。

    以 内模式为 框架所组成的数据库叫做物理数据库;以 概念模式为框架所组成的数据叫概念数据库;以外模式为框架所组成的数据库叫用户数据库。

    最近帮业务部门梳理业务报表,其中有个需求是就算某指标等待时间最长的前百分之十,其实就是对等待时长进行倒序排序后,取结果集的前百分之十。

    数据库如何取前百分之N的记录?_数据库原理_数据库管理系统_数据库软件_课课家

    这个需求在SQL ServerOracle上都很容易实现,甚至是在MySQL 8.0也很容易实现,只是恰好我们业务数据库是MySQL 5.7

    先给大家介绍下不同数据库平台的实现方法。

    SQL Server实现方法

    SQL Server上有个TOP Percent的方法可以直接取结果的前(或后)百分之N例如有如下一张City表

    我们取前10%的数据记录可以这样写:

    1. SELECT  
    2. TOP 10 PERCENT   
    3. FROM City 
    4. ORDER BY ID DESC 

    结果如下:

    Oracle实现方法

    Oracle有个ROWNUM伪列可以用来帮助我们计算前百分之N。ROWNUM伪列的特点:

    • ROWNUM是按照记录插入时的顺序排序的
    • ROWNUM并不实际存在,是对筛选后的结果集的一个排序,如果不存在结果集就不会有ROWNUM
    • ROWNUM不能用基表名作为前缀
    • 在使用ROWNUM进行查询时,请注意:

    1)若使用大于号(>),则只能使用(>0),其他均不可以 2)若使用小于号(<),同一般情况 3)若使用等于号(=),则只能使用等于1(=1)我们可以先计算出整个表的记录行数量

    1. SELECT COUNT(*) CNT FROM City 

    然后根据count聚合查询总条数乘以百分比,来确定要查询的条数

    1. SELECT 0.1*COUNT(*) CNT FROM City 

    最后取出伪列小于共有数据的百分比的数据

    1. SELECT * FROM CITY 
    2. WHERE ID IN 
    3. SELECT ID FROM  
    4. SELECT ID FROM CITY ORDER BY ID DESC 
    5. WHERE ROWNUM < (SELECT COUNT(*)*0.1 FROM CITY) 

    注意:Oracle不支持子查询内ORDER BY,需要在外面再嵌套一层。

    MySQL 8.0的实现方法

    MySQL 8.0的实现方法主要是借助窗口函数ROW_NUMBER() OVER()。其实就是给排好序的集合添加一个自增长列,与Oracle的ROWNUM有点类似

    1. SELECT * FROM 
    2. SELECT *, 
    3. ROW_NUMBER() OVER(ORDER BY ID DESC) rn 
    4. FROM  City 
    5. ORDER BY ID DESC 
    6. ) a 
    7. WHERE a.rn<=(SELECT 0.1*COUNT(*) FROM City) 

    MySQL 5.X的实现方法

    我们知道MySQL 5.X是没有开窗函数ROW_NUMBER() OVER()的,那该如何实现呢?

    这里我们需要借助变量来实现,其实思路还是创建一个自增长列,只是方法不同。

    1. SELECT  
    2.   A.*, 
    3.   @row_num:=@row_num+1 AS ROW_NUM 
    4. FROM  
    5.   City A , (SELECT @row_num:=0) B 
    6. ORDER BY ID DESC 

    这样我们就可以得到一张有自增长列的结果集了,接下来还是按照上面类似的方法,取前10%即可。

    1. SELECT * FROM 
    2. SELECT  
    3.   A.*, 
    4.   @row_num:=@row_num+1 AS ROW_NUM 
    5. FROM  
    6.   City A , (SELECT @row_num:=0) B 
    7. ORDER BY ID DESC 
    8. ) C 
    9. WHERE C.ROW_NUM<=(@row_num*0.1) 

    其实MySQL 5.X也挺简单的,只是当时不怎么想用变量,想看看有没有其他办法,最后发现还是得用变量

    以上就是不同平台的数据库求前百分之N的方法了,代码可以验证一下收藏起来留着下次直接套用。

    总结

    其中有涉及一些知识点,需要小伙伴们自己去进一步了解:

    • SQL Server的TOP PERCENT
    • Oracle的ROWNUM,子查询排序
    • ROW_NUMBER() OVER()
    • MySQL的变量
      数据库中的数据是为众多用户所 共享其信息而建立的,已经摆脱了具体 程序的限制和制约。不同的用户可以按各自的用法使用数据库中的数据;多个用户可以同时共享数据库中的数据资源,即不同的用户可以同时存取数据库中的同一个数据。数据共享性不仅满足了各用户对信息内容的要求,同时也满足了各用户之间信息通信的要求。

课课家教育

未登录