当前位置：首页 > 文章列表 > 科技周边 > 人工智能 > 分位数回归和分位数损失在神经网络中的应用

分位数回归和分位数损失在神经网络中的应用

来源：51CTO.COM 2024-01-01 23:05:13 0浏览收藏

偷偷努力，悄无声息地变强，然后惊艳所有人！哈哈，小伙伴们又来学习啦~今天我将给大家介绍《分位数回归和分位数损失在神经网络中的应用》，这篇文章主要会讲到等等知识点，不知道大家对其都有多少了解，下面我们就一起来看一吧！当然，非常希望大家能多多评论，给出合理的建议，我们一起学习，一起进步！

在构建预测模型时，我们不仅仅关注预测值，还希望了解预测值落在某个范围内的可能性。这种预测范围被称为区间预测。举个例子，当我们需要进行需求预测时，如果只准备最可能的需求预测量，那么缺货的概率会很高。但是如果我们将库存储备在预测的第95个百分位数，即需求有95%的可能性小于或等于该值，那么缺货数量将减少到大约20分之1的程度。通过区间预测，我们可以更好地评估不确定性，并采取相应的措施来减少风险。

要获得这些百分位数值，有几种机器学习方法可供选择：

scikit-learn:GradientBoostingRegressor(loss='quantile, alpha=alpha)
LightGBM: LGBMRegressor(objective='quantile', alpha=alpha)
XGBoost: XGBoostRegressor(objective='reg:quantileerror', quantile_alpha=alpha) (version 2.0~)

这些机器学习方法中，一种被称为分位数回归的技术，用来预测值落在某个范围内的可能性。而在这些方法中，使用了一种叫做Quantile Loss的损失函数。

神经网络中的分位数回归和分位数损失

Quantile loss是一种用于评估分位数回归模型性能的损失函数。在分位数回归中，我们不仅关注预测的中心趋势（如均值），还关注在分布的不同分位数处的预测准确性。Quantile loss的作用是允许我们根据所关注的分位数来量化预测的不确定性。通过使用Quantile loss，我们可以更全面地评估分位数回归模型的性能，提高对不同分位数预测的准确性。

对于给定的预测问题，我们希望预测一个连续型变量的分布，并且关注不同的分位数，比如中位数、0.25分位数、0.75分位数等。为了评估预测的准确性，我们可以使用Quantile Loss进行衡量。 Quantile Loss是一种损失函数，用于衡量预测分布与实际分布之间的差异。对于第q分位数，Quantile Loss的定义如下： L(q, y, \hat{y}) = (1-q)|y-\hat{y}| \cdot \mathbb{1}(y \leq \hat{y}) + q|y-\hat{y}| \cdot \mathbb{1}(

神经网络中的分位数回归和分位数损失

在《文字玩出花》游戏中，有一个非常受欢迎的关卡叫做怀旧大扫除。每天都会有新的挑战等待着我们。这个关卡要求我们仔细观察图像，并找出12个与时代不符的细节。为了帮助那些还没有通过

yy 是真实值。
yy 是模型的预测值。
qq 是目标分位数，取值范围为0,10,1。

这个损失函数的核心思想是，考虑到模型预测值与真实值之间的差异，通过乘以一个参数q来实现不同分位数的不同惩罚。当模型的预测值超过真实值时，损失函数会将差值乘以q；而当预测值低于真实值时，损失函数会将差值乘以1-q。这样做的目的是确保对于不同分位数，我们有不同的惩罚权重。例如，如果我们更关注较小的分位数（如中位数），我们可以设定较小的q值；反之，如果我们更关注较大的分位数，我们可以设定较大的q值。

用Pytorch实现分位数损失

以下是一个使用PyTorch定义自定义损失函数的示例，其中将分位数损失作为示例。 ```python import torch import torch.nn as nn class QuantileLoss(nn.Module): def __init__(self, quantile): super(QuantileLoss, self).__init__() self.quantile = quantile def forward(self, predictions, targets): errors = targets - predictions loss = torch.max((self.quantile - 1) * errors, self.quantile * errors) return loss.mean() # 示例用法 predictions = torch.tensor([1,

import torch  def quantile_loss(y_true, y_pred, quantile): errors = y_true - y_pred loss = torch.mean(torch.max((quantile - 1) * errors, quantile * errors)) return loss

对于训练来说，跟正常的训练方法一样：

for epoch in range(num_epochs):for batch_x, batch_y in dataloader:optimizer.zero_grad()outputs = model(batch_x)loss = quantile_loss(outputs, batch_y, quantile)loss.backward()optimizer.step()

让我们看看这个自定义的损失函数是否如预期的那样工作。

Pytorch分位数损失测试

首先，我们尝试为x生成均匀随机分布(-5~5)，为y生成与x指数成比例的正态随机分布，看看是否可以从x预测y的分位数点。

# Generate dummy data num_samples = 10000 shape = (num_samples, 1) torch.manual_seed(0)  # x is uniform random from -5 to 5 # y is random normal distribution * exp(scaled x) x_tensor = torch.rand(shape) * 10 - 5 x_scaled = x_tensor / 5 y_tensor = torch.randn(shape) * torch.exp(x_scaled)  # Convert values to NumPy array (for graphs) x = x_tensor.numpy() y = y_tensor.numpy()

网络结构很简单，两个中间层64个节点+每层relu。在没有任何正则化或提前停止的情况下使用100次epoch。待预测的四分位数(百分位数)在列中为[0.500,0.700,0.950,0.990,0.995]，在行中为批大小[1,4,16,64,256]，总共有25个预测。在10,000个训练数据实例(蓝色)中，低于预测输出值(红色)的实例的比率在图中被标记为“实际”值。

神经网络中的分位数回归和分位数损失

低于指定百分位数值的样本百分比通常接近指定值，并且输出分位数预测的是非常直接的。

再考虑一个稍微复杂的例子，其中y=clip(x， - 2,2) + randn。其中clip(x， - 2,2)是剪辑函数(将值限制在指定范围内)。当数字超出给定范围时，该函数将其限制到最近的边界（如果将范围设置为-2到2，并输入-5的输入值，该函数将返回-2;如果输入10，它将返回2)，而randn是遵循正态分布的随机数。网络结构和其他设置与前一种情况相同。

神经网络中的分位数回归和分位数损失