Intersect() 是获取两个 List<T> 交集的最快方法,时间复杂度接近 O(n+m),但自定义类型需实现 IEquatable<T> 或提供 IEqualityComparer<T>,否则因引用比较返回空;结果无序且去重。
用 Intersect() 最快拿到两个 List<T> 的交集
直接调用 intersect() 是最常用也最稳妥的方式,它底层基于 hashset<t> 去重比较,时间复杂度接近 o(n+m),比手写循环或嵌套 contains() 快得多。
常见错误是传入自定义类型却没重写 Equals() 和 GetHashCode(),结果返回空集合——因为默认引用比较,两个内容相同的对象不被视为“相等”。
- 基础类型(
int、string、DateTime)可直接用,无需额外处理 - 自定义类必须实现
IEquatable<T>或重载Equals()+GetHashCode() - 若只想按某个字段比较(比如只看
Id),传入自定义IEqualityComparer<T>
示例:
var list1 = new List<int> {1, 2, 3, 4};<br>var list2 = new List<int> {3, 4, 5, 6};<br>var common = list1.Intersect(list2).ToList(); // [3, 4]
自定义对象交集必须提供比较逻辑
没提供比较器时,Intersect() 对引用类型默认做引用比较。哪怕两个对象属性一模一样,只要不是同一个实例,就进不了交集。
使用场景多见于 DTO、实体类或配置项列表比对,比如从数据库查出两批用户,要找出共同关注的标签。
- 推荐实现
IEquatable<T>,比单独重写Equals()更明确且高效 - 若无法改类(如第三方模型),用
Intersect(other, new MyComparer())传入临时比较器 - 注意:字符串比较默认区分大小写,需要忽略大小写时,用
StringComparer.OrdinalIgnoreCase
示例(按 Id 比较):
public class User : IEquatable<User><br>{<br> public int Id { get; set;}<br> public string Name {get; set;}<br><br> public bool Equals(User other) => other != null && other.Id == this.Id;<br> public override int GetHashCode() => Id.GetHashCode();<br>}
Intersect() 返回的是无序、去重的结果
它不保证保留原始顺序,也不保留重复元素——哪怕 list1 里有多个 3,交集中也只出现一次。这点和 Where(x => list2.Contains(x)) 行为完全不同。
如果你需要“按 list1 的顺序保留重复”,就不能用 Intersect(),得换思路:
- 用
list1.Where(x => list2.Contains(x))—— 简单但性能差(O(n×m)),小数据量可接受 - 先用
list2.ToHashSet()预热,再list1.Where(set2.Contains)—— 平衡可读与性能 - 要保留重复且按
list1顺序?考虑GroupBy+Join,但逻辑变重
兼容性上没问题:Intersect() 从 .NET 3.5 就支持,所有主流运行时都可用。
别在循环里反复调用 Intersect()
每次调用都会新建内部 HashSet,如果在高频路径(比如每帧、每请求)中对大列表反复求交集,GC 压力和 CPU 开销会明显上升。
典型误用场景:实时过滤搜索建议、WebSocket 连接状态同步、批量任务依赖检查。
- 提前把常变少的列表转成
HashSet<T>缓存,复用IntersectWith()方法 - 若两个列表都频繁变动,考虑用增量更新代替全量重算(比如记录上次交集 + 差异事件)
- 调试时留意内存快照里是否有大量短命
HashSet<T>实例
示例优化:
var set2 = new HashSet<int>(list2); // 一次构造 <br>var result = list1.Intersect(set2).ToList(); // 复用 set2
交集逻辑看着简单,真正卡住人的往往是自定义类型的相等性定义、顺序 / 重复语义混淆,还有没意识到 Intersect() 内部的哈希重建开销。