Java 根据指定字段实现对对象进行去重

embedded/2024/10/16 0:14:32/

文章目录

    • 引入问题
    • 方法一:使用 HashSet 数据结构
    • 方法二:使用 Java 8 的 Stream API 的 distinct() 去重
    • 方法三:使用 Map 数据结构
    • 方法四:使用 Collectors.toMap() 方法
    • 方法五:使用 Collectors.collectingAndThen() 方法

注: 该文中的多种方法实现涉及 Java 8 Stream API 特性,若没有接触过,建议先阅读另一篇文章进行了解: Java8 Stream API全面解析——高效流式编程的秘诀

引入问题

首先,我自定义了一个名为 Person 的 Java 类:

java">public class Person {private String name;private int age;public Person(String name, int age) {this.name = name;this.age = age;}@Overridepublic int hashCode() {return super.hashCode();}@Overridepublic boolean equals(Object obj) {return super.equals(obj);}@Overridepublic String toString() {return "Person{" +"name='" + name + '\'' +", age=" + age +'}';}
}
  • Person 类中有两个属性:nameage 和一个全参构造方法:

    • name 是一个字符串类型的变量,用于表示人的姓名;age 是一个整数类型的变量,用于表示人的年龄。
    • 构造方法用于创建 Person 类的对象。
  • 并且重写了三个方法:hashCode()equals()toString()

    • hashCode() 方法返回对象的哈希码,此处直接调用了父类 ObjecthashCode() 方法。
    • equals() 方法用于比较对象是否相等,此处直接调用了父类 Objectequals() 方法。
    • toString() 方法返回一个描述该对象内容的字符串,格式为 "Person{name='姓名', age=年龄}"

最终,我们需要根据 Person 类的 name 字段对目标集合进行去重:

java">public static void main(String[] args) {List<Person> persons = new ArrayList<>();persons.add(new Person("Tom", 20));persons.add(new Person("Jerry", 18));persons.add(new Person("Tom", 22));persons.add(new Person("Jim", 23));persons.add(new Person("Tom", 22));persons.forEach(System.out::println);
}

方法一:使用 HashSet 数据结构

根据 Java 对象某个字段进行去重,可以使用 HashSet 数据结构。HashSet 内部实现了哈希表,能够快速判断元素是否已存在,从而实现去重。

Tips: HashSet 是如何实现元素去重的,或者说如何判断元素是否重复?

在 Java 中,HashSet 是一种基于哈希表实现的集合类,它内部维护了一个存储元素的哈希表。HashSet 通过元素的哈希码(hashcode)来判断元素是否重复的。

当我们向 HashSet 中添加元素时,HashSet 会首先计算该元素的哈希码,并根据哈希码将元素放入对应的桶中。如果该桶中已经有了相同哈希码的元素,则会调用元素的 equals() 方法,比较元素是否相等。如果相等,则认为该元素已经存在于 HashSet 中,不进行重复添加;否则将该元素添加到集合中。

如果我们通过 HashSet 进行去重,就需要正确地实现 hashCode()equals() 方法。hashCode() 方法应该返回与元素属性相关的哈希码,而 equals() 方法应该根据元素属性判断元素是否相等。只有这样才能保证在 HashSet 中正确地去重和查找元素。

使用 HashSet 去重的具体步骤如下:

  1. 重写对象的 equalshashCode 方法。在这两个方法中,分别比较对象的指定字段,并返回相应的哈希值。
  2. 创建一个 HashSet 对象,并将所有要去重的对象添加到该 HashSet 中。
  3. 遍历该 HashSet,处理去重后的结果。

重写 Person 类的 equalshashCode 方法,用于比较指定字段:

java">public class Person {......// 重写 hashCode 方法@Overridepublic int hashCode() {// 哈希值只与 name 字段有关return name.hashCode(); }// 重写 equals 方法@Overridepublic boolean equals(Object o) {if (this == o) return true;if (o == null || getClass() != o.getClass()) return false;Person person = (Person) o;// 比较 name 字段return name.equals(person.name); }
}

在重写的 equals() 方法中,首先使用 this == o 来判断两个对象是否为同一个对象(即内存地址是否相同),如果是,则直接返回 true。如果不是同一个对象,则继续比较其他属性。

接着,使用 o == null 判断传入的参数是否为 null,如果是 null,则两个对象肯定不相等,直接返回 false。然后使用 getClass() 方法来获取传入对象的类,判断其是否与当前对象的类相同,如果不同,则两个对象肯定不相等,直接返回 false

最后,将参数对象强制转换成 Person 类型,并比较两个对象的 name 属性是否相等。如果相等,则认为两个对象相等,返回 true,否则返回 false

同时重写 hashCode() 方法,以确保两个对象相等时它们的哈希码也相等。

使用 HashSet 去重:

java">public static void main(String[] args) {......HashSet<Person> personHashSet = new HashSet<>(persons);personHashSet.forEach(System.out::println);
}

去重结果为:

Person{name='Tom', age=20}
Person{name='Jerry', age=18}
Person{name='Jim', age=23}

方法二:使用 Java 8 的 Stream API 的 distinct() 去重

Java 8 增加的 Stream API 提供了 distinct() 方法去重。

Stream 流的 distinct() 方法是基于对象的 equals() 方法来判断对象是否相等,因此我们需要重写 Person 类的 equals() 方法:

java">public class Person {......// 重写 equals 方法@Overridepublic boolean equals(Object o) {if (this == o) return true;if (o == null || getClass() != o.getClass()) return false;Person person = (Person) o;// 比较 name 字段return name.equals(person.name); }
}

之后调用 stream() 方法将列表转换为流,并且使用 distinct() 方法基于 name 字段进行去重:

java">List<Person> collect = persons.stream().distinct().collect(Collectors.toList());

最后打印去重后的 Person 集合:

Person{name='Tom', age=20}
Person{name='Jerry', age=18}
Person{name='Jim', age=23}

方法三:使用 Map 数据结构

Java 中的 Map 是一种用于存储键值对的集合。我们可以利用 Map 中的键唯一的特性实现去重。

我们只需要遍历 List 中的 Person 对象,将 name 作为 key,Person 对象作为 value 存入 Map 中,这样就可以去除重复的 name 对应的 Person 对象:

java">public static void main(String[] args) {......Map<String, Person> map = new HashMap<>();for (Person person : persons) {map.put(person.getName(), person);}
}

去重结果如下:

Person{name='Tom', age=22}
Person{name='Jerry', age=18}
Person{name='Jim', age=23}

方法四:使用 Collectors.toMap() 方法

Collectors.toMap()是 Java 8 中的一个收集器(Collector),它可以将 Stream 中的元素收集到一个 Map 中,其中每个元素都是一个键值对。该方法有多个重载形式:

  1. toMap(Function<? super T, ? extends K> keyMapper, Function<? super T, ? extends U> valueMapper)

    将 Stream 中的元素转换为键值对,并存储到一个Map中。其中,keyMapper用于指定如何从元素中提取键,valueMapper用于指定如何从元素中提取值。

    如果存在重复的键,则会抛出IllegalStateException异常。

  2. toMap(Function<? super T, ? extends K> keyMapper, Function<? super T, ? extends U> valueMapper, BinaryOperator<U> mergeFunction)

    与第一种形式类似,但当存在重复的键时,会使用mergeFunction函数来处理冲突。例如,可以使用mergeFunction来选择较小或较大的值,或将两个值合并成一个新值。

  3. toMap(Function<? super T, ? extends K> keyMapper, Function<? super T, ? extends U> valueMapper, BinaryOperator<U> mergeFunction, Supplier<M> mapSupplier)

    与第二种形式类似,但允许指定用于创建 Map 的具体实现类。

使用第二种重载形式将包含Person对象的List转换为一个以Person对象的姓名作为键的Map

java">public static void main(String[] args) {......Map<String, Person> collect = persons.stream().collect(Collectors.toMap(Person::getName, p -> p, (p1, p2) -> p1));
}
  • Person::getName:函数式接口Function类型的方法引用,用于将Person对象的姓名作为键。
  • person -> person:Lambda 表达式,用于将Person对象本身作为值。
  • (p1, p2) -> p1:Lambda 表达式,用于处理当存在重复键时的情况。此处选择保留第一个键对应的值,而忽略第二个键对应的值。

去重结果如下:

Person{name='Tom', age=20}
Person{name='Jerry', age=18}
Person{name='Jim', age=23}

方法五:使用 Collectors.collectingAndThen() 方法

Collectors.collectingAndThen()是 Java 8 中的一个收集器(Collector)方法,它允许在收集元素后应用一个最终转换函数。在使用collectingAndThen()时,先通过一个初始的收集器将元素收集起来,然后再应用一个最终转换函数对收集结果进行处理。

以下是collectingAndThen()方法的常用重载形式:

collectingAndThen(Collector<T, A, R> downstream, Function<R, RR> finisher)

  • downstream:初始的收集器,用于将元素收集起来并生成一个中间结果。
  • finisher:最终转换函数,用于对中间结果进行处理,并返回最终结果。

使用collectingAndThen()方法实现去重并返回去重后的结果集:

java">public static void main(String[] args) {......ArrayList<Person> collect = persons.stream().collect(Collectors.collectingAndThen(Collectors.toMap(Person::getName, person -> person, (p1, p2) -> p1),map -> new ArrayList<>(map.values())));
}
  • 使用Collectors.toMap()persons流中的元素转换为一个以 name 作为键的Map
  • 通过 map -> new ArrayList<>(map.values())Map的值部分提取出来,并使用ArrayList的构造函数将其包装为一个新的ArrayList<Person>对象。最终得到的ArrayList<Person>对象即为去重后的结果集。

输出去重后的结果:

Person{name='Tom', age=20}
Person{name='Jerry', age=18}
Person{name='Jim', age=23}

http://www.ppmy.cn/embedded/128148.html

相关文章

【TOP K】leetcode 215.数组中第K个最大的元素

1 题目描述 题目链接&#xff1a;数组中第K个最大的元素 2 题目解析 首先区分 第K个最大的元素和 第K个不同的元素 考虑使用什么数据结构&#xff1f; 使用堆的数据结构&#xff0c;可以使用priority_queue&#xff0c;然后 建大堆&#xff0c;这样大的元素就在前面。接着…

关于coroutine的异常捕获和取消机制

https://www.youtube.com/watch?vVWlwkqmTLHc&listPLQkwcJG4YTCQcFEPuYGuv54nYai_lwil_&index11 协程总结 抓不到的异常 如果我们在launch外面try catch 意图捕获异常的话 //无法捕获异常导致奔溃private fun cannotCatchException() {lifecycleScope.launch {try …

智能听诊器:宠物健康管理的革命

智能听诊器不仅仅是一个简单的监测工具&#xff0c;它代表了宠物健康管理的一次革命。通过收集和分析宠物的生理数据&#xff0c;智能听诊器能够帮助宠物主人和医生更好地理解宠物的健康需求&#xff0c;从而提供更加个性化的护理方案。 智能听诊器通过高精度的传感器&#xf…

人类与人工智能的和谐关系

人类与人工智能的和谐关系 打不过就加入吧,人类在人工智能为基础的智能机器面前 毫无优势可言,这方面的介绍 见我之前的文章《智能机器是世界上的新物种》 第一、人不要想着与机器对抗 人不要想着与机器竞争&#xff0c;或者是比赛&#xff0c;哪怕规则都是人类定的&#xf…

022 elasticsearch文档管理(添加、修改、删除、批处理)

文章目录 添加文档修改文档删除文档根据_id取文档使用批处理_bulk PortX&#xff1a; https://portx.online/zh MobaXterm&#xff1a; https://mobaxterm.mobatek.net/ FinalShell&#xff1a; http://www.hostbuf.com/ 添加文档 向索引中添加一行数据 使用json来表示 使用…

【DevOps工具篇】Docker的DNS原理

在使用 Docker 容器时,网络在实现容器与外界之间的通信方面起着至关重要的作用。容器网络的一个基本方面是 DNS(域名系统),它允许容器使用域名而不是依赖 IP 地址来发现彼此并相互通信。在本文中,我们将探讨 Docker DNS 以及它如何促进容器通信。 🔎 什么是 DNS? 域名…

微信小程序上传组件封装uploadHelper2.0使用整理

一、uploadHelper2.0使用步骤说明 uploadHelper.js ---上传代码封装库 cos-wx-sdk-v5.min.js---腾讯云&#xff0c;对象存储封装库 第一步&#xff0c;下载组件代码&#xff0c;放置到自己的小程序项目中 第二步、 创建上传对象&#xff0c;执行选择图片/视频 var _this th…

Spring Boot技术在医疗病历B2B交互中的实践与挑战

第6章 程序测试与评价 6.1 程序调试 在设计系统的过程中&#xff0c;存在一些错误是必然的。对于语句的语法错误&#xff0c;在程序运行时自动提示&#xff0c;并请求立即纠正&#xff0c;因此&#xff0c;这类错误比较容易发现和纠正。但另一类错误是在程序执行时由于不正确的…