当前位置：首页 > 文章列表 > 文章 > python教程 > Python嵌套列表字典怎么访问

Python嵌套列表字典怎么访问

2025-08-29 15:57:48 0浏览收藏

本文深入解析Python中处理嵌套列表和字典的技巧，尤其是在面对多层JSON数据时。针对开发者常犯的错误，如混淆列表索引和字典键，文章通过实例详细阐述了如何使用正确的索引方式逐层访问深层数据。从顶层字典开始，逐步深入到列表和字典的嵌套结构，最终精准提取目标值。同时，提供了使用`dict.get()`方法和`try-except`块处理数据缺失的健壮性建议。此外，还简述了`json_normalize`的适用场景，强调其更适用于大规模数据分析，而非简单的单值提取，旨在帮助开发者高效、准确地处理复杂数据结构。

掌握Python中嵌套列表与字典的数据访问技巧

本文详细介绍了在Python中如何高效且准确地访问复杂嵌套数据结构（特别是包含列表和字典的多层JSON数据）中的特定值。通过具体示例，文章解释了直接索引列表元素和字典键的正确方法，避免了常见的类型错误，并提供了处理多条记录和潜在数据缺失的健壮性建议，旨在帮助开发者熟练提取深层数据。

理解嵌套数据结构

在处理JSON等半结构化数据时，我们经常会遇到多层嵌套的列表（List）和字典（Dictionary）混合结构。理解这些结构是正确访问其中数据的关键。

字典（Dictionary）：由键值对组成，通过键（字符串）来访问其对应的值。例如：{"key": "value"}，访问方式为 data["key"]。
列表（List）：由一系列有序的元素组成，通过索引（整数）来访问其对应位置的元素。例如：["item1", "item2"]，访问方式为 data[0]。

当列表和字典相互嵌套时，我们需要根据当前元素的类型，选择正确的访问方式。

以提供的JSON数据片段为例：

{
  "liveData": {
    "plays": {
      "allPlays": [
        {
          "runners": [
            {
              "details": {
                "event": "Single",
                "runner": {
                  "id": 656941,
                  "fullName": "Kyle Schwarber"
                }
              }
            }
          ]
        }
      ]
    }
  }
}

要访问 id 值，我们需要逐步深入这个结构。

常见错误分析与正确访问方法

许多开发者在处理这种嵌套数据时常犯的一个错误是，试图用字典键的方式去访问列表元素，或者反之。例如，原始问题中尝试 x = play['runners']['details'] 时，会遇到 'details' is not an acceptable index since it is a string and not an integer or a slice 的错误。

这是因为 play['runners'] 是一个列表（[...]），而不是一个字典。列表不能通过字符串键来访问，它只能通过整数索引来访问其内部元素。在这个特定的数据结构中，runners 列表包含一个字典元素。因此，我们首先需要通过索引 [0] 来获取列表中的第一个（也是唯一一个）字典元素，然后才能继续使用键来访问其内部的 details。

正确的访问路径应该是：

data["liveData"]：从顶层字典获取 liveData 字典。
data["liveData"]["plays"]：从 liveData 字典获取 plays 字典。
data["liveData"]["plays"]["allPlays"]：从 plays 字典获取 allPlays 列表。
data["liveData"]["plays"]["allPlays"][0]：从 allPlays 列表获取第一个元素，它是一个字典。
data["liveData"]["plays"]["allPlays"][0]["runners"]：从上一步获取的字典中获取 runners 列表。
data["liveData"]["plays"]["allPlays"][0]["runners"][0]：从 runners 列表获取第一个元素，它又是一个字典。
data["liveData"]["plays"]["allPlays"][0]["runners"][0]["details"]：从上一步获取的字典中获取 details 字典。
data["liveData"]["plays"]["allPlays"][0]["runners"][0]["details"]["runner"]：从 details 字典中获取 runner 字典。
data["liveData"]["plays"]["allPlays"][0]["runners"][0]["details"]["runner"]["id"]：最终从 runner 字典中获取 id 的值。

示例代码

以下是一个完整的Python代码示例，演示如何加载JSON数据并正确地访问嵌套的 id 值：

import json

# 模拟从文件中读取的JSON数据
json_data = """
{
  "liveData": {
    "plays": {
      "allPlays": [
        {
          "runners": [
            {
              "details": {
                "event": "Single",
                "runner": {
                  "id": 656941,
                  "fullName": "Kyle Schwarber"
                },
                "responsiblePitcher": null,
                "isScoringEvent": false,
                "rbi": false,
                "earned": false,
                "teamUnearned": false,
                "playIndex": 6
              }
            }
          ]
        }
      ]
    }
  }
}
"""

# 将JSON字符串解析为Python字典
data = json.loads(json_data)

# 按照正确的路径访问 'id' 值
try:
    id_value = data["liveData"]["plays"]["allPlays"][0]["runners"][0]["details"]["runner"]["id"]
    print(f"成功获取ID: {id_value}")
except (KeyError, IndexError) as e:
    print(f"访问数据时发生错误: {e}. 请检查路径或数据结构是否符合预期。")

# 示例：如果需要处理多个runner或allPlays
# 假设allPlays中可能有多个play，每个play可能有多个runner
print("\n--- 遍历所有runner的ID ---")
all_plays = data.get("liveData", {}).get("plays", {}).get("allPlays", [])

for play_index, play in enumerate(all_plays):
    runners = play.get("runners", [])
    for runner_index, runner_data in enumerate(runners):
        details = runner_data.get("details", {})
        runner_info = details.get("runner", {})
        runner_id = runner_info.get("id")
        if runner_id is not None:
            print(f"Play[{play_index}] -> Runner[{runner_index}] ID: {runner_id}")
        else:
            print(f"Play[{play_index}] -> Runner[{runner_index}] 未找到ID或数据结构不完整。")

处理多条记录与健壮性

在实际应用中，allPlays 列表或 runners 列表可能包含多个元素，而不仅仅是第一个。为了提取所有相关数据，你需要使用循环（如 for 循环）来遍历这些列表。

此外，为了使代码更加健壮，防止因数据缺失（例如某个键不存在或列表为空）而引发 KeyError 或 IndexError，建议采取以下策略：

使用 dict.get() 方法：当访问字典中的键时，使用 dict.get(key, default_value) 可以避免 KeyError。如果键不存在，它将返回 default_value（默认为 None），而不是抛出错误。
检查列表长度或使用 try-except：在访问列表元素前，可以检查列表是否为空或索引是否越界。更通用的做法是使用 try-except 块来捕获 KeyError 和 IndexError，从而优雅地处理数据缺失的情况。

上述示例代码中，第二个部分展示了如何结合 for 循环和 dict.get() 来遍历并安全地访问所有可能的 runner ID。