当前位置:首页 > 文章列表 > 文章 > python教程 > Python字典合并技巧:键值匹配高效方法

Python字典合并技巧:键值匹配高效方法

2025-07-11 23:54:34 0浏览 收藏

各位小伙伴们,大家好呀!看看今天我又给各位带来了什么文章?本文标题《Python字典合并:键值匹配高效整合方法》,很明显是关于文章的文章哈哈哈,其中内容主要会涉及到等等,如果能帮到你,觉得很不错的话,欢迎各位多多点评和分享!

Python数据整合:基于键值匹配高效合并字典列表

本教程详细阐述了如何在Python中高效地将多个字典列表进行合并与数据补充。通过匹配特定键的值,我们可以将来自不同源列表(如listA和listB)的额外信息(如original_name和original_address)整合到主数据列表(dataList)的每个字典条目中,从而构建一个包含所有所需字段的全新字典列表。本文将提供实用的代码示例和最佳实践,帮助读者掌握此类数据整合技巧。

在数据处理过程中,我们经常会遇到需要从多个数据源整合信息以构建一个更完整数据集的场景。例如,你可能有一个包含核心记录的列表,以及其他包含补充属性的辅助列表。目标是根据共同的标识符(如名称或地址)将这些补充属性添加到核心记录中。

场景描述与挑战

假设我们有以下三个字典列表:

  • listA:包含 name 和 original_name,用于提供原始名称信息。
  • listB:包含 address 和 original_address,用于提供原始地址信息。
  • dataList:主数据列表,包含 id, created_at, name, address 等核心信息。

我们的任务是创建一个新的列表 finalList,它基于 dataList,但同时从 listA 中匹配 name 字段,并添加 original_name;从 listB 中匹配 address 字段,并添加 original_address。

原始数据示例如下:

listA = [
  {
    "name": "name sample 1",
    "original_name" : "original name sample 1",
  },
  {
    "name": "name sample 2",
    "original_name" : "original name sample 2",
  }
]

listB = [
  {
    "address": "address sample 1",
    "original_address" : "original address sample 1",
  },
  {
    "address": "address sample 2",
    "original_address" : "original address sample 2",
  }
]

dataList = [
  {
    "id": "1",
    "created_at": "date 1",
    "name": "name sample 1",
    "address": "address sample 1",
  },
  {
    "id": "2",
    "created_at": "date 2",
    "name": "name sample 2",
    "address": "address sample 2",
  }
]

期望的 finalList 结构应为:

finalList = [
  {
    "id": "1",
    "created_at": "date 1",
    "name": "name sample 1",
    "original_name" : "original name sample 1",
    "address": "address sample 1",
    "original_address" : "original address sample 1",
  },
  {
    "id": "2",
    "created_at": "date 2",
    "name": "name sample 2",
    "original_name" : "original name sample 2",
    "address": "address sample 2",
    "original_address" : "original address sample 2",
  }
]

解决方案:基于嵌套循环的匹配与更新

一种直观且有效的方法是利用 Python 的循环结构,遍历辅助列表,并在主列表中查找匹配项进行更新。为了避免修改原始 dataList,我们首先创建一个它的深拷贝。

核心思路

  1. 复制主列表:使用 copy 模块的 deepcopy 函数创建 dataList 的一个独立副本,作为我们最终操作的 finalList。
  2. 合并辅助列表:将 listA 和 listB 合并成一个迭代器(通过 listA + listB),这样可以一次性处理所有补充数据。
  3. 遍历并匹配更新
    • 对于合并后的每个辅助字典条目 (entry):
    • 判断 entry 中包含的是 name 还是 address 键,以确定其来源。
    • 根据判断结果,遍历 finalList 中的每个字典 (data)。
    • 如果 data 中相应的匹配键值与 entry 中的键值匹配,则将 entry 中对应的 original_ 字段添加到 data 中。

示例代码

from copy import deepcopy

# 原始数据定义 (与上述场景描述一致)
listA = [
  {"name": "name sample 1", "original_name" : "original name sample 1"},
  {"name": "name sample 2", "original_name" : "original name sample 2"}
]

listB = [
  {"address": "address sample 1", "original_address" : "original address sample 1"},
  {"address": "address sample 2", "original_address" : "original address sample 2"}
]

dataList = [
  {"id": "1", "created_at": "date 1", "name": "name sample 1", "address": "address sample 1"},
  {"id": "2", "created_at": "date 2", "name": "name sample 2", "address": "address sample 2"}
]

# 1. 创建dataList的深拷贝,避免修改原始数据
finalList = deepcopy(dataList)

# 2. 遍历listA和listB的合并结果
# 这种方式巧妙地将两个不同类型的补充数据统一处理
for entry in listA + listB:
    # 3. 根据entry中存在的键(name或address)进行判断
    if "name" in entry:
        # 如果是来自listA的条目,则匹配name并添加original_name
        for data in finalList:
            if data['name'] == entry['name']:
                data['original_name'] = entry['original_name']
    elif "address" in entry:
        # 如果是来自listB的条目,则匹配address并添加original_address
        for data in finalList:
            if data['address'] == entry['address']:
                data['original_address'] = entry['original_address']

# 打印结果,验证原始dataList未被修改,且finalList已包含所需信息
print("原始dataList (未修改):")
print(dataList)
print("\n合并后的finalList:")
print(finalList)

运行结果

原始dataList (未修改):
[{'id': '1', 'created_at': 'date 1', 'name': 'name sample 1', 'address': 'address sample 1'}, {'id': '2', 'created_at': 'date 2', 'name': 'name sample 2', 'address': 'address sample 2'}]

合并后的finalList:
[{'id': '1', 'created_at': 'date 1', 'name': 'name sample 1', 'address': 'address sample 1', 'original_name': 'original name sample 1', 'original_address': 'original address sample 1'}, {'id': '2', 'created_at': 'date 2', 'name': 'name sample 2', 'address': 'address sample 2', 'original_name': 'original name sample 2', 'original_address': 'original address sample 2'}]

注意事项与性能优化

上述方法对于小规模数据是有效且易于理解的。然而,当列表规模非常大时,嵌套循环的性能会成为瓶颈。其时间复杂度为 O(M * N),其中 M 是 listA + listB 的总长度,N 是 finalList 的长度。对于大型数据集,可以考虑以下优化策略:

1. 使用字典进行预处理(哈希映射)

将辅助列表转换为字典(哈希映射),以实现 O(1) 的平均查找时间。这将把整体时间复杂度降低到 O(M + N),因为预处理和最终遍历

本篇关于《Python字典合并技巧:键值匹配高效方法》的介绍就到此结束啦,但是学无止境,想要了解学习更多关于文章的相关知识,请关注golang学习网公众号!

HTML表格加密传输方法与常用协议解析HTML表格加密传输方法与常用协议解析
上一篇
HTML表格加密传输方法与常用协议解析
HTML表格提醒功能实现方法有哪些
下一篇
HTML表格提醒功能实现方法有哪些
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    516次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    500次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    485次学习
查看更多
AI推荐
  • ChatExcel酷表:告别Excel难题,北大团队AI助手助您轻松处理数据
    ChatExcel酷表
    ChatExcel酷表是由北京大学团队打造的Excel聊天机器人,用自然语言操控表格,简化数据处理,告别繁琐操作,提升工作效率!适用于学生、上班族及政府人员。
    3194次使用
  • Any绘本:开源免费AI绘本创作工具深度解析
    Any绘本
    探索Any绘本(anypicturebook.com/zh),一款开源免费的AI绘本创作工具,基于Google Gemini与Flux AI模型,让您轻松创作个性化绘本。适用于家庭、教育、创作等多种场景,零门槛,高自由度,技术透明,本地可控。
    3407次使用
  • 可赞AI:AI驱动办公可视化智能工具,一键高效生成文档图表脑图
    可赞AI
    可赞AI,AI驱动的办公可视化智能工具,助您轻松实现文本与可视化元素高效转化。无论是智能文档生成、多格式文本解析,还是一键生成专业图表、脑图、知识卡片,可赞AI都能让信息处理更清晰高效。覆盖数据汇报、会议纪要、内容营销等全场景,大幅提升办公效率,降低专业门槛,是您提升工作效率的得力助手。
    3437次使用
  • 星月写作:AI网文创作神器,助力爆款小说速成
    星月写作
    星月写作是国内首款聚焦中文网络小说创作的AI辅助工具,解决网文作者从构思到变现的全流程痛点。AI扫榜、专属模板、全链路适配,助力新人快速上手,资深作者效率倍增。
    4545次使用
  • MagicLight.ai:叙事驱动AI动画视频创作平台 | 高效生成专业级故事动画
    MagicLight
    MagicLight.ai是全球首款叙事驱动型AI动画视频创作平台,专注于解决从故事想法到完整动画的全流程痛点。它通过自研AI模型,保障角色、风格、场景高度一致性,让零动画经验者也能高效产出专业级叙事内容。广泛适用于独立创作者、动画工作室、教育机构及企业营销,助您轻松实现创意落地与商业化。
    3815次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码