Java模拟rank() over()函数获取分组排名的方法设计及实现

news/2024/10/30 9:22:35/

背景

考试批次班级姓名语文
202302三年一班张小明130.00
202302三年一班王二小128.00
202302三年一班谢春花136.00
202302三年二班冯世杰129.00
202302三年二班马功成130.00
202302三年二班魏翩翩136.00

假设我们有如上数据,现在有一个需求需要统计各学生语文单科成绩在班级中的排名和全年段排名,你会如何实现?

很容易的我们想到了 rank() over() 实现

over()是分析函数,可以和 rank()、 dense_rank() 、 row_number() 配合使用。
复制代码

使用语法如下:

RANK() OVER(PARTITION BY COLUMN ORDER BY COLUMN)
dense_rank() OVER(PARTITION BY COLUMN ORDER BY COLUMN)
ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN)
复制代码

解释:partition by用于给结果集分组,如果没有指定那么它把整个结果集作为一个分组。

  1. rank()涵数主要用于排序,并给出序号 ,对于排序并列的数据给予相同序号,并空出并列所占的名次。
  2. dense_rank() 功能同rank()一样,区别在于不空出并列所占的名次
  3. row_number()涵数则是按照顺序依次使用 ,不考虑并列

rank 结果为 1,2,2,4 dense_rank 结果为 1,2,2,3 row_number 结果为 1,2,3,4

实际应用中,会存在数据从其他外部系统接入且数据量不大等多种情况,那么使用Java代码的方式实现分组排名的功能则显得更加方便。

详细设计及实现

排序定义类 OrderBy

public class OrderBy {private String orderByEL;/*** 是否升序*/private boolean ascend;public OrderBy(){//默认升序this.ascend = true;}public String orderByEL(){return this.orderByEL;}public OrderBy orderByEL(String orderByEL){this.orderByEL = orderByEL;return this;}public OrderBy ascend(boolean ascend){this.ascend = ascend;return this;}public boolean ascend(){return this.ascend;}
}
复制代码

该类定义了如下属性:

  1. 排序的fileld
  2. 是否升序

获取排名方法

该方法定义如下:

<T> void rankOver(List<T> dataList, String[] partitionByFields, List<OrderBy> orderByList, String resultField, int rankType);
复制代码

该方法提供了5个入参:

  1. dataList 排序的数据集
  2. partitionByFields 分组field的数组
  3. orderByList 排序字段集合
  4. resultField 排名结果存放的字段
  5. rankType 排名方式
    • 1:不考虑并列(row_number 结果为 1,2,3,4)
    • 2:考虑并列,空出并列所占的名次(rank 结果为 1,2,2,4)
    • 3:考虑并列,不空出并列所占的名次(dense_rank 1,2,2,3)

该方法具体实现如下

    public static <T> void rankOver(List<T> dataList, String[] partitionByFields, List<OrderBy> orderByList, String resultField, int rankType) {if (CollectionUtils.isEmpty(orderByList)) {return;}//STEP_01 剔除掉不参与排名的数据List<T> tempList = new ArrayList<>();for (T data : dataList) {boolean part = true;for (OrderBy rptOrderBy : orderByList) {Object o1 = executeSpEL(rptOrderBy.orderByEL(), data);if (o1 == null) {//参与排序的值为null的话则不参与排名part = false;break;}}if (part) {tempList.add(data);}}if (CollectionUtils.isEmpty(tempList)) {return;}//STEP_02 分组Map<String, List<T>> groupMap = group(tempList, null, partitionByFields);for (List<T> groupDataList : groupMap.values()) {order(orderByList, groupDataList);if (rankType == 1) {int rank = 1;for (T temp : groupDataList) {setFieldValue(temp, resultField, rank);rank++;}} else {int prevRank = Integer.MIN_VALUE;int size = groupDataList.size();for (int i = 0; i < size; i++) {T current = groupDataList.get(i);if (i == 0) {//第一名setFieldValue(current, resultField, 1);prevRank = 1;} else {T prev = groupDataList.get(i - 1);boolean sameRankWithPrev = true;//并列排名for (OrderBy rptOrderBy : orderByList) {Object o1 = executeSpEL(rptOrderBy.orderByEL(), current);Object o2 = executeSpEL(rptOrderBy.orderByEL(), prev);if (!o1.equals(o2)) {sameRankWithPrev = false;break;}}if (sameRankWithPrev) {setFieldValue(current, resultField, getFieldValue(prev, resultField));if (rankType == 2) {++prevRank;}} else {setFieldValue(current, resultField, ++prevRank);}}}}}}
复制代码

使用案例

定义一个学生类:

public class Student {private String batch;private String banji;private String name;private Double yuwen;//extraprivate Integer rank1;private Integer rank2;public Student(String batch, String banji, String name, Double yuwen) {this.batch = batch;this.banji = banji;this.name = name;this.yuwen = yuwen;}
}复制代码

我们写一个方法,返回如下数据:

public List<Student> getDataList() {List<Student> dataList = new ArrayList<>();dataList.add(new Student("202302", "三年一班", "张小明", 130.0));dataList.add(new Student("202302", "三年一班", "王二小", 128.0));dataList.add(new Student("202302", "三年一班", "谢春花", 136.0));dataList.add(new Student("202302", "三年二班", "冯世杰", 129.0));dataList.add(new Student("202302", "三年二班", "马功成", 130.0));dataList.add(new Student("202302", "三年二班", "魏翩翩", 136.0));return dataList;
}
复制代码

获取学生语文成绩的班级排名和年段排名,排名采用并列并空出并列所占用名次的方式。

List<Student> dataList = getDataList();
List<OrderBy> orderByList = new ArrayList<>();
orderByList.add(new OrderBy().orderByEL("yuwen").ascend(false));
//获取全校排名
DataProcessUtil.rankOver(dataList, new String[]{"batch"}, orderByList, "rank1", 2);
//获取班级排名
DataProcessUtil.rankOver(dataList, new String[]{"batch", "banji"}, orderByList, "rank2", 2);
log("语文单科成绩排名情况如下:");Map<String, List<Student>> groupMap = DataProcessUtil.group(dataList, null, new String[]{"batch"});
for (Map.Entry<String, List<Student>> entry : groupMap.entrySet()) {log("考试批次:" + entry.getKey());for (Student s : entry.getValue()) {log(String.format("班级:%s 学生:%s 语文成绩:%s 班级排名:%s 全校排名:%s", s.getBanji(), s.getName(), s.getYuwen(), s.getRank2(), s.getRank1()));}log("");
}
复制代码

结果如下:

语文单科成绩排名情况如下:
考试批次:202302
班级:三年一班 学生:张小明 语文成绩:130.0 班级排名:2 全校排名:3
班级:三年一班 学生:王二小 语文成绩:128.0 班级排名:3 全校排名:6
班级:三年一班 学生:谢春花 语文成绩:136.0 班级排名:1 全校排名:1
班级:三年二班 学生:冯世杰 语文成绩:129.0 班级排名:3 全校排名:5
班级:三年二班 学生:马功成 语文成绩:130.0 班级排名:2 全校排名:3
班级:三年二班 学生:魏翩翩 语文成绩:136.0 班级排名:1 全校排名:1
复制代码

可以看到全校排名中 有两个并列第一名 两个并列第三名,且空出了并列所占用的名次2 和 名次4


http://www.ppmy.cn/news/40747.html

相关文章

如何避免 MyBatis 查询导致的内存溢出:配置与策略指南

前言 在处理大型数据库查询时&#xff0c;内存溢出是一个常见的问题。如果不加以控制&#xff0c;一次性加载大量数据到内存中可能会导致程序崩溃。本文将介绍如何在 MyBatis 中通过各种配置和操作来有效避免查询导致的内存溢出。我们将讨论设置 defaultFetchSize、分页查询、…

如何给ClickHouse表生成随机真实测试数据

学习ClickHouse数据库&#xff0c;通常需要下载官网一些示例数据。我们也可以通过内置函数generateRandom快速生成测试数据&#xff0c;从而测试学习一些特性的性能及底层原理。 函数语法 generateRandom函数基于给定schema生成随机数据&#xff0c;用于填充测试表。不是所有类…

《大众金融》企业级开发实战

目录 主要内容 1 配置中心简介 1.1 什么是配置 1.2 传统配置形式存在的问题 1.3 配置中心的作用 2 Apollo简介 2.3 Apollo特性 2.4 产品对比 2.5 Apollo初体验 2.5.1 访问控制台 应用配置中心Apollo-讲义 主要内容 1&#xff09;了解配置中心的概念以及使用场景 2&…

educoder实训——计算几何形状的表面积与体积

第1关:计算长方形的面积 任务描述 本关任务:编写一个能计算长方形面积的小程序。 相关知识 长方体的长、宽、高分别是X、Y、Z。 长方形面积:S=X∗Y 长方体表面积:S=2∗X∗Y+2∗X∗Z+2∗Y∗Z 长方体体积:V=X∗Y∗Z 问题描述 根据相应的公式来计算长方形的面积,结果严…

数字孪生在飞行器中的应用

2011年美国空军实验室的EricJ.Tuegel等[10]利用超高保真的飞机数字孪生模型&#xff0c;根据飞行条件将飞机结构变形和温度变化结合&#xff0c;在虚拟模型中模拟对飞机结构造成的局部损伤和组织变化&#xff0c;以保证飞机结构的完整性并对飞机结构进行寿命预测。 Hochhalter…

Vue项目总结(1)项目结构分析

1&#xff0c;项目的基本结构 项目文件目录&#xff1a; 其中&#xff0c;dist是运行npm run build命令后所生成的。dist是发布实际使用的文件。dist目录可以更改&#xff0c;更改是在vue.config.js中更改。 package.json保存一些依赖信息&#xff0c;config保存一些项目初始化…

一、vue之初体验-两种方式引入vue

一、Vue引入方式-CDN <html lang"en"><head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" /><meta name"viewport" content"widthdevice-width, initial-s…

python传参数的方法

Python的参数传递是通过传参指针来完成的&#xff0c;当参数指针指向了另一个变量时&#xff0c;它就会被传递给它。这种传递方式与 Java或C#中的传参方式是类似的&#xff0c;在 Python中&#xff0c;参数可以是一个字符串&#xff0c;也可以是一个对象。这个方法的好处是它不…