当前位置:首页 > 文章列表 > 文章 > python教程 > Python数组交集:set与双指针对比解析

Python数组交集:set与双指针对比解析

2026-03-15 22:09:44 0浏览 收藏
本文深入对比了Python中求数组交集的两种主流方法——基于哈希表的set操作与适用于有序数组的双指针法:set方案简洁高效、时间复杂度约O(n+m),适合无需保序和去重的常规场景,但会丢失原始顺序与元素频次;双指针法则在输入已排序的前提下,以O(1)额外空间实现保序输出和精准重复控制,是处理如LeetCode 350等频次敏感问题的不二之选。最终选择不应只看性能,而应紧扣三大实际约束——输入是否已排序、是否需保留重复、以及内存与开发效率的权衡,避开“未排序硬用双指针”或“需频次却用set”等高频陷阱。

Python怎么找两数组交集_set()操作与双指针算法对比

set() 求交集快不快?看场景

绝大多数情况下,set(nums1) & set(nums2) 是最简、最快的选择——前提是不关心顺序、不保留重复元素、且数组不是超大(比如上亿元素)。

Python 的 set 底层是哈希表,求交集时间复杂度接近 O(min(len(nums1), len(nums2))),但建集合本身要遍历一次数组,总开销约 O(n + m)。内存会多占一份去重后的副本。

常见错误现象:list(set(nums1) & set(nums2)) 返回结果顺序不定;如果原数组有重复值(如 [1,1,2][1,2,2]),交集只留一个 1 和一个 2,丢失频次信息。

  • 需要去重 + 无视顺序 → 直接用 set 最省事
  • 输入已排序,且想保持升序输出 → set 会打乱顺序,不如双指针
  • 内存敏感(如嵌入式或流式处理)→ set 额外占内存,慎用

双指针法适合什么情况?

当两个数组都已排序,且你要求结果也有序、或需保留重复逻辑(比如“每个元素在交集中出现次数 = 两数组中该元素最小出现次数”),双指针是更精准的解法。

它不依赖哈希,空间复杂度仅 O(1)(不算输出列表),遍历过程天然保序,还能灵活控制重复行为。

典型使用场景:LeetCode 350 “两个数组的交集 II”,要求返回带重复的交集;或者你在处理数据库分页结果、时间序列对齐等已排好序的数据流。

  • 两数组必须事先升序排列,否则指针移动会漏匹配
  • 边界判断容易错:任一指针越界就得停,别写成 while i 后还继续访问 nums1[i]
  • 重复处理逻辑要明确:遇到相等时 append 后,两个指针都进一;不等时只动小数那边的指针

set.intersection()& 有区别吗?

没实质区别。set1 & set2 是运算符语法糖,底层调用的就是 set1.intersection(set2)。但注意:后者支持多个参数,比如 set1.intersection(set2, set3, set4),而 & 只能两两连用(set1 & set2 & set3 也行,但本质还是左结合)。

性能上几乎无差异,Cython 层都走同一套逻辑。不过 intersection() 支持传入任意可迭代对象(比如 set1.intersection([1,2,3])),而 & 要求右边也得是 set 类型,否则报 TypeError: unsupported operand type(s)

  • 想一行写多个集合交集 → 用 .intersection() 更直白
  • 右边可能是 list/tuple 且不想显式转 set → 只能用 .intersection()
  • 做类型检查或 lint 报警时,有些工具对运算符重载提示较弱,用方法名更易追踪

实际选哪个?关键看这三点

别纠结“哪个更高级”,就盯住输入特征和输出需求:

  • 输入是否已排序?是 → 优先双指针;否 → set 省心
  • 是否要保留重复?是 → 双指针可精确控频次;set 天然去重,绕不开
  • 内存 or 速度优先?大数据量且内存紧 → 双指针;中小数据且写快为主 → set

最容易被忽略的是:很多人直接对未排序数组硬套双指针,结果逻辑全错;或者在需要频次的题里盲目用 set,提交后发现用例过不了。顺序和重复性这两个约束,比“哪个快”重要得多。

到这里,我们也就讲完了《Python数组交集:set与双指针对比解析》的内容了。个人认为,基础知识的学习和巩固,是为了更好的将其运用到项目中,欢迎关注golang学习网公众号,带你了解更多关于的知识点!

Axure生成HTML详细步骤教程Axure生成HTML详细步骤教程
上一篇
Axure生成HTML详细步骤教程
DataFrame遍历效率低的常见原因解析
下一篇
DataFrame遍历效率低的常见原因解析
查看更多
最新文章
资料下载
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    4158次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    4509次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    4390次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    6013次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    4762次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码