当前位置:首页 > 文章列表 > 文章 > java教程 > Java集合交集并集差集操作详解

Java集合交集并集差集操作详解

2026-04-07 19:23:41 0浏览 收藏
Java集合的交集、并集与差集操作看似简单,实则暗藏诸多陷阱:retainAll会原地修改集合,addAll不等于数学并集,removeAll的顺序稍有不慎就删错对象;三者均高度依赖正确实现的equals和hashCode——哪怕Lombok自动生成的@Data类中混入LocalDateTime等未重写判等逻辑的字段,也会导致筛选失效;更需警惕Arrays.asList()的不可变性、null参数引发的NPE、性能瓶颈源于低效的contains查找,以及多线程下的并发修改异常。掌握这些细节,才能让集合运算真正可靠、高效、符合业务预期。

如何在Java中交集并集差集操作_retainAll与removeAll的集合数学运算

Java集合交集用 retainAll,但会修改原集合

交集不是“生成新集合”,而是原地保留共同元素——retainAll 会直接清空原集合中不在参数集合里的所有项。如果你需要保留原集合不变,必须先 new ArrayList(original)new HashSet(original) 复制一份再操作。

常见错误现象:listA.retainAll(listB) 后发现 listA 变了,但业务逻辑里还指望它保持原样;或者对 Arrays.asList() 返回的不可变列表调用,抛出 UnsupportedOperationException

  • 使用场景:去重筛选、权限校验(如“用户拥有的角色 ∩ 系统允许的角色”)
  • retainAll 的参数是 Collection,不要传 null,否则 NPE
  • 性能影响:底层遍历原集合,对每个元素调用 contains,所以传入的参数集合最好用 HashSet 而非 ArrayList,避免 O(n×m) 查找

并集不能只靠 addAll,得看是否要去重

Java 没有内置的“并集”方法名,但行为取决于你用的集合类型:Set.addAll() 天然去重,List.addAll() 直接追加、重复照收。别默认认为 addAll 就等于数学并集。

常见错误现象:用 listA.addAll(listB) 当作并集,结果出现重复 ID;或在多线程环境下直接操作共享 ArrayList,没加同步导致数据错乱。

  • 如果要严格数学并集(无重复),优先用 HashSet:先构造 new HashSet(a),再 addAll(b)
  • Stream.concat(a.stream(), b.stream()).distinct().collect(...) 更函数式,但小数据量没必要,且 distinct() 依赖 equals/hashCode
  • 兼容性注意:Android API 24+ 才支持 Stream,老版本得回退到循环 + contains 判断

removeAll 是差集,但“谁减谁”容易搞反

差集 A − B 对应的是 a.removeAll(b),不是 b.removeAll(a)。这个顺序和数学符号方向一致,但很多人写反,结果删错了集合。

常见错误现象:想取“用户未读消息 − 已归档消息”,却写了 archived.removeAll(unread),把归档列表清空了;或在 for-each 循环里对正在遍历的集合调用 removeAll,触发 ConcurrentModificationException

  • 安全做法:差集操作前,确保目标集合可修改;若需遍历中删除,改用迭代器 iterator.remove() 或收集待删元素后批量移除
  • 参数集合如果是 nullremoveAll 会抛 NullPointerException;空集合则安全,相当于什么也不删
  • 性能提示:和 retainAll 一样,参数用 HashSet 更快;若参数是数据库 ID 列表,别直接传 List,先转成 Set

三个操作都依赖 equalshashCode 正确实现

不管你用的是 String 还是自定义对象,只要集合里放的是对象引用,retainAllremoveAllcontains 全部依赖 equals 判等逻辑。没重写这两个方法,就等于用默认的内存地址比较,永远得不到预期结果。

最容易被忽略的地方:DTO 或 Entity 类加了 Lombok 的 @Data,但字段里有 java.time.LocalDateTime 这类不重写 equals 的类型,导致两个“看起来一样”的对象被判定为不相等。