当前位置:首页 > 文章列表 > 文章 > python教程 > 使用 EFS 在 AWS Lambda 上安装 Python 依赖项

使用 EFS 在 AWS Lambda 上安装 Python 依赖项

来源:dev.to 2024-12-08 20:27:59 0浏览 收藏

编程并不是一个机械性的工作,而是需要有思考,有创新的工作,语法是固定的,但解决问题的思路则是依靠人的思维,这就需要我们坚持学习和更新自己的知识。今天golang学习网就整理分享《使用 EFS 在 AWS Lambda 上安装 Python 依赖项》,文章讲解的知识点主要包括,如果你对文章方面的知识点感兴趣,就不要错过golang学习网,在这可以对大家的知识积累有所帮助,助力开发能力的提升。

使用 EFS 在 AWS Lambda 上安装 Python 依赖项

使用 aws lambda 时,开发人员面临的常见挑战之一是管理大型 python 依赖项。 pandasshapelygeopandas 等库对于地理空间分析等任务至关重要,通常会超过 lambda 的 250 mb 解压层限制。一个实用的解决方案?将您的依赖项存储在 efs(弹性文件系统) 上并将其挂载到您的 lambda 函数。

在这篇文章中,我们将逐步介绍其设置过程,包括先决条件、主要优势和分步实施。


先决条件

这篇文章面向具有高级 aws 经验的用户。它假设您对 lambda、efs、vpc 和安全组等 aws 服务有深入的了解,并且熟悉管理基础设施和在云中部署可扩展的解决方案。
在我们深入设置之前,请确保您具备以下条件:

  1. aws lambda 函数:您将使用 efs 配置的已部署 lambda 函数。
  2. efs 文件系统:在同一 aws 区域中创建的弹性文件系统。
  3. efs 访问点:在同一 aws 区域中创建的 efs 访问点,根目录路径为 /data ,确保正确设置 posix 权限和目录创建权限,如下所示,1101 和 1001,次要组id 1002 和权限 0755。
  4. vpc 和网络:确保 lambda 函数与 efs 位于同一 vpc 中,并正确配置子网和安全组。
  5. iam 权限:您的 lambda 函数需要访问 efs 的权限。附加适当的策略(例如,elasticfilesystem:clientmount、elasticfilesystem:clientwrite)。

用于安装软件包的处理程序代码

处理程序直接在挂载到 aws lambda 函数的 amazon efs 存储上安装 python 依赖项。这种方法绕过了 lambda 层的大小限制,使其适用于地理空间数据处理通常需要的重依赖项,例如 pandas、geopandas 和 shapely。它确保 /mnt/data 目录中提供所需的库,供 lambda 在执行期间使用:

import os
import subprocess

package_dir = "/mnt/data/lib/{}/site-packages/"

def get_python_version_tag():
    """generates a python version tag like 'python3.11'."""
    return f"python{os.sys.version_info.major}.{os.sys.version_info.minor}"

def install_package(package):
    """installs a python package into the efs-mounted directory."""
    target_dir = package_dir.format(get_python_version_tag())
    os.makedirs(target_dir, exist_ok=true)
    try:
        subprocess.run(
            [
                "pip",
                "install",
                package,
                "--target",
                target_dir,
                "--upgrade",
                "--no-cache-dir",
            ],
            check=true,
        )
        print(f"package {package} installed successfully!")
    except subprocess.calledprocesserror as e:
        print(f"failed to install package {package}: {e}")

def handler(event, context):
    """aws lambda handler for installing packages."""
    try:
        # list of packages to install from the event input
        packages = event.get("packages", [])
        for package in packages:
            install_package(package)
        #optional for see packages installed
        #os.system(f"ls -la {package_dir.format(get_python_version_tag())}")
        return {"statuscode": 200, "body": "packages installed successfully!"}
    except exception as e:
        print(f"error: {e}")
        return {"statuscode": 500, "body": f"an error occurred: {e}"}

测试步骤

调用 lambda 函数时,传递以下 json 负载:

{
    "packages": ["requests", "pandas"]
}

验证软件包安装

使用 ssh 会话或 aws cli 导航到您的 efs 挂载点(例如 /mnt/data/lib/)。
检查 site-packages/ 目录下已安装的软件包。
或者简单地使用 a 查看已安装的软件包

os.system(f"ls -la {package_dir.format(get_python_version_tag())}")

最终使用 lambda 中安装的依赖项

更新 lambda 函数的处理程序以包含安装在 efs 上的依赖项,这里的关键是将 efs 中的依赖项路径挂载到 lambda 处理程序的 pythonpath:

重要提示

所有希望使用已安装依赖项的 lambda 函数都必须将 efs 附加到 lambda。如果没有此附件,lambda 将无法访问 efs 上存储的所需依赖项。

import sys
sys.path.append("/mnt/data/lib/python3.11/site-packages/")  # Adjust Python version as needed
# Dependencies are now available!!!
import pandas as pd  

def lambda_handler(event, context):
    return {"message": "Dependencies loaded successfully!"}

主要优点

虽然直接在 efs 中安装 python 依赖项并不常见,但在 lambda 的默认限制(例如 250 mb 解压缩层大小)受到限制的情况下,它提供了某些优势。这种方法对于需要使用诸如 pandasshapelygeopandas 等繁重库进行地理空间计算的应用程序特别有用,这些库通常超出层大小限制。

使用 efs 进行依赖关系的好处:

  • 绕过 lambda 层大小限制:安装和使用库,无需担心打包限制。
  • 启用大规模地理空间处理:在无服务器环境中处理复杂的空间计算。
  • 简化依赖关系管理:动态添加或更新库,无需重新部署 lambda 函数。

该解决方案非常适合高级数据处理任务,例如地理空间分析,还可以根据需要轻松扩展存储,同时保持无服务器架构的灵活性。

今天关于《使用 EFS 在 AWS Lambda 上安装 Python 依赖项》的内容就介绍到这里了,是不是学起来一目了然!想要了解更多关于的内容请关注golang学习网公众号!

版本声明
本文转载于:dev.to 如有侵犯,请联系study_golang@163.com删除
ErrorGroup如何捕获子协程panic信息?ErrorGroup如何捕获子协程panic信息?
上一篇
ErrorGroup如何捕获子协程panic信息?
掌握未来:西安电脑培训课程全面指南
下一篇
掌握未来:西安电脑培训课程全面指南
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    542次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    511次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    498次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • 千音漫语:智能声音创作助手,AI配音、音视频翻译一站搞定!
    千音漫语
    千音漫语,北京熠声科技倾力打造的智能声音创作助手,提供AI配音、音视频翻译、语音识别、声音克隆等强大功能,助力有声书制作、视频创作、教育培训等领域,官网:https://qianyin123.com
    146次使用
  • MiniWork:智能高效AI工具平台,一站式工作学习效率解决方案
    MiniWork
    MiniWork是一款智能高效的AI工具平台,专为提升工作与学习效率而设计。整合文本处理、图像生成、营销策划及运营管理等多元AI工具,提供精准智能解决方案,让复杂工作简单高效。
    140次使用
  • NoCode (nocode.cn):零代码构建应用、网站、管理系统,降低开发门槛
    NoCode
    NoCode (nocode.cn)是领先的无代码开发平台,通过拖放、AI对话等简单操作,助您快速创建各类应用、网站与管理系统。无需编程知识,轻松实现个人生活、商业经营、企业管理多场景需求,大幅降低开发门槛,高效低成本。
    156次使用
  • 达医智影:阿里巴巴达摩院医疗AI影像早筛平台,CT一扫多筛癌症急慢病
    达医智影
    达医智影,阿里巴巴达摩院医疗AI创新力作。全球率先利用平扫CT实现“一扫多筛”,仅一次CT扫描即可高效识别多种癌症、急症及慢病,为疾病早期发现提供智能、精准的AI影像早筛解决方案。
    148次使用
  • 智慧芽Eureka:更懂技术创新的AI Agent平台,助力研发效率飞跃
    智慧芽Eureka
    智慧芽Eureka,专为技术创新打造的AI Agent平台。深度理解专利、研发、生物医药、材料、科创等复杂场景,通过专家级AI Agent精准执行任务,智能化工作流解放70%生产力,让您专注核心创新。
    156次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码