当前位置:首页 > 文章列表 > 文章 > python教程 > SciPy优化子集问题:背包算法详解

SciPy优化子集问题:背包算法详解

2025-09-13 10:00:44 0浏览 收藏

IT行业相对于一般传统行业,发展更新速度更快,一旦停止了学习,很快就会被行业所淘汰。所以我们需要踏踏实实的不断学习,精进自己的技术,尤其是初学者。今天golang学习网给大家整理了《SciPy优化子集和问题:Knapsack算法应用指南》,聊聊,我们一起来看看吧!

使用SciPy解决列表子集和问题:基于Knapsack算法的优化裁剪策略

本教程探讨如何从一个包含具有不同“面积”属性对象的列表中,选择一个子集,使其总面积接近目标值,同时最大化保留的对象数量。我们将此问题建模为0/1背包问题,并利用SciPy库中的milp函数实现高效优化,提供详细的代码示例和解释。

问题背景与挑战

在实际应用中,我们经常会遇到需要从一组具有特定属性(例如,面积、体积、成本等)的对象中,选择一个子集以满足某个总和目标的问题。具体来说,假设我们有一个MyClass实例列表obj_list,每个实例都含有一个area属性。我们的目标是从这个列表中移除最少数量的实例,使得剩余实例的总面积tot_area尽可能接近一个预设的target_area,允许一定的上下浮动。

一个直观但存在缺陷的思路是:首先对所有实例按面积进行排序,然后从最小的实例开始移除,直到总面积达到目标。然而,这种贪心策略可能不是最优的。例如,移除几个小面积实例可能不如移除一个特定的大面积实例更能有效地达到目标,同时保留更多的对象。因此,我们需要一种更系统、更优化的方法来解决这个问题。

问题建模:Knapsack算法

上述问题实际上是著名的Knapsack(背包)问题的一个变种。在经典的0/1背包问题中,我们有一组物品,每个物品都有一个重量和一个价值,目标是在不超过背包容量的前提下,最大化装入物品的总价值。

将我们的问题映射到Knapsack模型中:

  • 物品(Items):obj_list中的每个MyClass实例。
  • 重量(Weights):每个实例的area属性。
  • 价值(Values):由于我们的目标是“移除最少数量的实例”,这等价于“最大化保留的实例数量”。因此,我们将每个实例的价值都设为1。
  • 背包容量(Knapsack Capacity):不是一个固定的值,而是一个范围。我们希望总面积tot_area落在target_area附近的一个可接受区间内。

因此,我们的目标是选择一个实例子集,使得这些实例的总面积落在目标范围内,并且所选实例的总价值(即数量)最大化。

基于SciPy的混合整数线性规划(MILP)实现

解决0/1背包问题通常可以通过动态规划或整数线性规划(ILP)来实现。Python的SciPy库提供了scipy.optimize.milp函数,这是一个用于解决混合整数线性规划问题的强大工具,非常适合我们这里的0/1背包问题。

milp函数的核心思想是将问题表述为: 最小化 c @ x 受限于 lb <= A @ x <= ub 以及 x 的整数性和界限

其中:

  • x 是决策变量向量,每个元素x_i代表是否选择第i个物品(0表示不选,1表示选择)。
  • c 是目标函数的系数向量。由于milp是最小化问题,而我们希望最大化选中的物品数量,因此我们将c设置为物品价值的负值。
  • A 是约束矩阵。
  • lb 和 ub 是约束的下界和上界。
  • integrality 指定哪些变量必须是整数。
  • bounds 指定变量的取值范围。

示例代码与解析

下面通过一个具体的Python示例来展示如何使用scipy.optimize.milp解决此问题:

import numpy as np
from scipy import optimize
from scipy.optimize import milp

# 1. 数据准备
# 假设的实例面积列表,代表MyClass实例的area属性
sizes = np.array([0.003968, 0.0148, 0.022912, 0.024832, 0.02912, 0.032448,
                  0.034176, 0.035136, 0.035584, 0.049344, 0.057984, 0.059904,
                  0.063744, 0.080064, 0.085824])
# 目标总面积
target_area = 0.45
# 允许的目标面积误差百分比,实现“软边界”
pct_error = 0.03

# 2. 定义目标函数系数
# 由于我们希望最大化选择的实例数量,因此将所有实例的“价值”设为1。
# milp函数是最小化目标函数,所以我们将系数设为负值,以达到最大化效果。
values = np.full_like(sizes, 1.0)
c = -values

# 3. 定义决策变量的属性
# integrality: 决策变量x_i必须是整数(0或1),表示选中或未选中。
integrality = np.full_like(values, True)
# bounds: 决策变量x_i的取值范围为[0, 1]。结合integrality,使其成为布尔变量。
bounds = optimize.Bounds(0, 1)

# 4. 定义约束条件
# 计算目标面积的上下限,形成一个“软边界”
lb = (1 - pct_error) * target_area
ub = (1 + pct_error) * target_area
# 线性约束:所有选中实例的面积之和必须落在[lb, ub]区间内。
# A矩阵在这里是一个行向量,其元素就是各个实例的面积。
constraints = optimize.LinearConstraint(A=sizes, lb=lb, ub=ub)

# 5. 执行混合整数线性规划
optimization_result = milp(c=c, constraints=constraints,
                           integrality=integrality, bounds=bounds)

# 6. 结果解读
if not optimization_result.success:
    raise RuntimeError('MILP优化过程失败!')

# optimization_result.x 是决策变量的最终值,表示哪些实例被选中(接近1)
# 通过astype(bool)将其转换为布尔数组,方便筛选
selected_indices = optimization_result.x.astype(bool)

print(f'优化后的总面积: {sizes[selected_indices].sum()}')
# 示例输出: 优化后的总面积: 0.45998399999999995

print(f'决策变量结果 (选中为1,未选中为0):\n{optimization_result.x}')
# 示例输出: 决策变量结果 (选中为1,未选中为0):
# [0. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 0. 0.]

print(f'选中的实例面积列表:\n{sizes[selected_indices]}')
# 示例输出: 选中的实例面积列表:
# [0.0148   0.022912 0.024832 0.02912  0.032448 0.034176 0.035136 0.035584
#  0.049344 0.057984 0.059904 0.063744]

代码解析要点:

  1. 数据准备:sizes数组包含了所有MyClass实例的面积。target_area是我们希望达到的总面积,pct_error定义了可接受的误差范围。
  2. 目标函数:values数组中的每个元素都为1,表示每个实例的“价值”相同。c = -values是为了将最大化问题(最大化选中的实例数量)转换为milp函数所需的最小化问题。
  3. 决策变量:integrality=True确保x_i只能取整数值。bounds=(0, 1)限制x_i在0到1之间。这两者结合,使得x_i成为0/1的布尔决策变量。
  4. 约束条件:lb和ub根据target_area和pct_error计算得出,定义了总面积的允许范围。optimize.LinearConstraint(A=sizes, lb=lb, ub=ub)构建了一个线性约束,要求所有被选中的实例的面积之和必须落在这个范围内。
  5. 优化执行:milp函数接收这些参数并执行优化,返回一个包含结果的对象optimization_result。
  6. 结果解读:optimization_result.x是最终的决策变量数组。其中值为1(或非常接近1)的索引对应被选中的实例,值为0的索引对应被移除的实例。通过布尔索引,我们可以轻松地获取选中的实例及其总面积。

注意事项与最佳实践

  • “软边界”的灵活性:通过pct_error参数,我们可以灵活地控制目标面积的容忍度,这在许多实际场景中非常有用,比严格的单一目标值更具实用性。
  • 0/1整数规划:milp函数非常适合处理这种二元决策(选或不选)的问题。对于更复杂的整数规划问题(如变量可以取任意整数值),milp同样适用。
  • 错误处理:在调用milp后,务必检查optimization_result.success属性。如果为False,表示优化过程未能成功找到可行解,需要根据具体情况进行调试或调整参数。
  • 性能考量:对于大规模问题(例如,实例数量非常庞大),MILP的求解时间可能会显著增加。在这种情况下,可能需要考虑使用更专业的优化求解器(如Gurobi、CPLEX)或探索近似算法。
  • 问题泛化:此方法不仅适用于“面积”,还可以推广到任何需要从列表中选择子集以使某个属性总和接近目标值,同时最大化/最小化其他属性总和的问题。

总结

通过将列表裁剪问题建模为0/1背包问题,并利用SciPy库中的milp函数,我们能够高效且准确地找到一个最优的实例子集,使其总面积接近目标值,并最大化保留的实例数量。这种方法克服了简单贪心策略的局限性,提供了一个专业且可靠的解决方案,适用于各种需要进行组合优化的场景。

文中关于的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《SciPy优化子集问题:背包算法详解》文章吧,也可关注golang学习网公众号了解相关技术文章。

Win11语音访问设置与使用教程Win11语音访问设置与使用教程
上一篇
Win11语音访问设置与使用教程
DeepSeek区块链审计功能详解
下一篇
DeepSeek区块链审计功能详解
查看更多
最新文章
查看更多
课程推荐
  • 前端进阶之JavaScript设计模式
    前端进阶之JavaScript设计模式
    设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
    543次学习
  • GO语言核心编程课程
    GO语言核心编程课程
    本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
    514次学习
  • 简单聊聊mysql8与网络通信
    简单聊聊mysql8与网络通信
    如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
    499次学习
  • JavaScript正则表达式基础与实战
    JavaScript正则表达式基础与实战
    在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
    487次学习
  • 从零制作响应式网站—Grid布局
    从零制作响应式网站—Grid布局
    本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
    484次学习
查看更多
AI推荐
  • SEO  AI Mermaid 流程图:自然语言生成,文本驱动可视化创作
    AI Mermaid流程图
    SEO AI Mermaid 流程图工具:基于 Mermaid 语法,AI 辅助,自然语言生成流程图,提升可视化创作效率,适用于开发者、产品经理、教育工作者。
    379次使用
  • 搜获客笔记生成器:小红书医美爆款内容AI创作神器
    搜获客【笔记生成器】
    搜获客笔记生成器,国内首个聚焦小红书医美垂类的AI文案工具。1500万爆款文案库,行业专属算法,助您高效创作合规、引流的医美笔记,提升运营效率,引爆小红书流量!
    355次使用
  • iTerms:一站式法律AI工作台,智能合同审查起草与法律问答专家
    iTerms
    iTerms是一款专业的一站式法律AI工作台,提供AI合同审查、AI合同起草及AI法律问答服务。通过智能问答、深度思考与联网检索,助您高效检索法律法规与司法判例,告别传统模板,实现合同一键起草与在线编辑,大幅提升法律事务处理效率。
    388次使用
  • TokenPony:AI大模型API聚合平台,一站式接入,高效稳定高性价比
    TokenPony
    TokenPony是讯盟科技旗下的AI大模型聚合API平台。通过统一接口接入DeepSeek、Kimi、Qwen等主流模型,支持1024K超长上下文,实现零配置、免部署、极速响应与高性价比的AI应用开发,助力专业用户轻松构建智能服务。
    364次使用
  • 迅捷AIPPT:AI智能PPT生成器,高效制作专业演示文稿
    迅捷AIPPT
    迅捷AIPPT是一款高效AI智能PPT生成软件,一键智能生成精美演示文稿。内置海量专业模板、多样风格,支持自定义大纲,助您轻松制作高质量PPT,大幅节省时间。
    368次使用
微信登录更方便
  • 密码登录
  • 注册账号
登录即同意 用户协议隐私政策
返回登录
  • 重置密码