用于时间序列概率预测的分位数回归
有志者,事竟成!如果你在学习科技周边,那么本文《用于时间序列概率预测的分位数回归》,就很适合你!文章讲解的知识点主要包括,若是你对本文感兴趣,或者是想搞懂其中某个知识点,就请你继续往下看吧~
不要改变原内容的意思,微调内容,重写内容,不要续写。“分位数回归满足这一需求,提供具有量化机会的预测区间。它是一种统计技术,用于模拟预测变量与响应变量之间的关系,特别是当响应变量的条件分布命令人感兴趣时。与传统的回归方法不同,分位数回归侧重于估计响应变量变量的条件量值,而不是条件均值。”
图(A): 分位数回归
分位数回归概念
分位数回归是估计⼀组回归变量X与被解释变量Y的分位数之间线性关系的建模⽅法。
现有的回归模型实际上是研究被解释变量与解释变量之间关系的一种方法。他们关注解释变量与被解释变量之间的关系及其误差分布的情况,其中位数回归和分位数回归是两种常见的回归模型。它们是根据Koenker和Bassett (1978) 首次提出的。
普通最小二乘回归估计量的计算基于最小化残差平方和。分位数回归估计量的计算也是基于种对称形式的绝对值残差最小化。其中,中位数回归运算的是最绝对值差估计(LAD,least absolute deviations estimator)。
分位数回归的优点
解释被解释变量条件分布的全貌,并不只是分析被解释变量的条件期望(均值),也可分析解释变量如何影响被解释变量的中位数、分位数等。不同分位数下的回归系数估计常常不同,即解释变量对不同分位数的影响效果不同,因此解释变量不同分位数的影响不同会对被解释变量的影响产生不同。
进行中位数回归的估计法与最小乘法相比,估计结果对离群值则表现的更加稳健,且分位数回归对误差项并不要求很强的假设条件,因此对于非正态状态下的分布,中位数回归系数量则更加健康。同时,分位数回归系统量估计则加稳健。
分位数回归相对于蒙特卡罗模拟具有哪些优势呢?首先,分位数回归直接估计给定预测因子的响应变量的条件量值。这意味着,它不像蒙特卡罗模拟那样产生大量可能的结果,而是提供了响应变量分布的特定量级的估计值。这对于了解不同层次的预测不确定性特别有用,例如二分位数、四分位数或极端量值。其次,分位数回归提供了一种基于模型的预测不确定性估算方法,利用观测数据来估计变量之间的关系,并根据这种关系进行预测。相比之下,蒙特卡罗模拟依赖于为输入变量指定概率分布,并根据随机抽样生成结果。
NeuralProphet提供两种统计技术:(1)分位数回归和(2)保形分位数回归。共形分位数预测技术增加了一个校准过程来做分位数回归。在本文中,我们将使用Neural Prophet的分位数回归模块来做分位数回归预测。这个模块增加了一个校准过程,来保证预测结果与观测数据的分布一致。我们将在本章中使用Neural Prophet的分位数回归模块。
环境要求
安装 NeuralProphet。
!pip install neuralprophet!pip uninstall numpy!pip install git+https://github.com/ourownstory/neural_prophet.git numpy==1.23.5
导入需要的库。
%matplotlib inlinefrom matplotlib import pyplot as pltimport pandas as pdimport numpy as npimport loggingimport warningslogging.getLogger('prophet').setLevel(logging.ERROR)warnings.filterwarnings("ignore")
数据集
共享单车数据。该数据集是一个多变量数据集,包含每日租赁需求以及温度或风速等其他天气领域。
data = pd.read_csv('/bike_sharing_daily.csv')data.tail()
图(B): 共享单车
绘制共享单车的数量图。我们观察到,需求量在第二年有所增加,而且有季节性规律。
# convert string to datetime64data["ds"] = pd.to_datetime(data["dteday"])# create line plot of sales dataplt.plot(data['ds'], data["cnt"])plt.xlabel("date")plt.ylabel("Count")plt.show()
图 (C):自行车租赁日需求量
为建模做最基本的数据准备。NeuralProphet 要求列名为 ds 和 y,这与 Prophet 的要求相同。
df = data[['ds','cnt']]df.columns = ['ds','y']
构建分位数回归模型
直接在 NeuralProphet 中构建分位数回归。假设我们需要第 5、10、50、90 和 95 个量级的值。我们指定 quantile_list = [0.05,0.1,0.5,0.9,0.95],并打开参数 quantiles = quantile_list。
from neuralprophet import NeuralProphet, set_log_levelquantile_list=[0.05,0.1,0.5,0.9,0.95 ]# Model and predictionm = NeuralProphet(quantiles=quantile_list,yearly_seasnotallow=True,weekly_seasnotallow=True,daily_seasnotallow=False)m = m.add_country_holidays("US")m.set_plotting_backend("matplotlib")# Use matplotlibdf_train, df_test = m.split_df(df, valid_p=0.2)metrics = m.fit(df_train, validation_df=df_test, progress="bar")metrics.tail()
分位数回归预测
我们将使用 .make_future_dataframe()为预测创建新数据帧,NeuralProphet 是基于 Prophet 的。参数 n_historic_predictions 为 100,只包含过去的 100 个数据点。如果设置为 True,则包括整个历史数据。我们设置 period=50 来预测未来 50 个数据点。
future = m.make_future_dataframe(df, periods=50, n_historic_predictinotallow=100) #, n_historic_predictinotallow=1)# Perform prediction with the trained modelsforecast = m.predict(df=future)forecast.tail(60)
预测结果存储在数据框架 predict 中。
图 (D):预测
上述数据框架包含了绘制地图所需的所有数据元素。
m.plot(forecast, plotting_backend="plotly-static"#plotting_backend = "matplotlib")
预测区间是由分位数值提供的!
图 (E):分位数预测
预测区间和置信区间的区别
预测区间和置信区间在流行趋势中很有帮助,因为它们可以量化不确定性。它们的目标、计算方法和应用是不同的。下面我将用回归来解释两者的区别。在图(F)中,我在左边画出了线性回归,在右边画出了分位数回归。
图(F):置信区间与预测区间的区别
首先,它们的目标不同:
- 线性回归的主要目标是找到一条线,使预测值尽可能接近给定自变量值时因变量的条件均值。
- 分位数回归旨在提供未来观测值的范围,在一定的置信度下。它估计自变量与因变量条件分布的不同量化值之间的关系。
其次,它们的计算方法不同:
- 在线性回归中,置信区间是对自变量系数的区间估计,通常使用普通最小二乘法 (OLS) 找出数据点到直线的最小总距离。系数的变化会影响预测的条件均值 Y。
- 在分位数回归中,你可以选择依赖变量的不同量级来估计回归系数,通常是最小化绝对偏差的加权和,而不是使用OLS方法。
第三,它们的应用不同:
- 在线性回归中,预测的条件均值有 95% 的置信区间。置信区间较窄,因为它是条件平均值,而不是整个范围。
- 在分位数回归中,预测值有 95% 的概率落在预测区间的范围内。
写在最后
本文介绍了分位数回归预测区间的概念,以及如何利用 NeuralProphet 生成预测区间。我们还强调了预测区间和置信区间之间的差异,这在商业应用中经常引起混淆。后面将继续探讨另一项重要的技术,即复合分位数回归(CQR),用于预测不确定性。
文中关于预测,时间序列,概率的知识介绍,希望对你的学习有所帮助!若是受益匪浅,那就动动鼠标收藏这篇《用于时间序列概率预测的分位数回归》文章吧,也可关注golang学习网公众号了解相关技术文章。

- 上一篇
- 挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队

- 下一篇
- PHP 企业级应用分布式架构设计问答
-
- 科技周边 · 人工智能 | 6小时前 |
- 沃尔沃XC70亮相,SMA混动加持,年内上市
- 236浏览 收藏
-
- 科技周边 · 人工智能 | 9小时前 |
- 用豆包A/生成的表情包如何赚钱
- 191浏览 收藏
-
- 科技周边 · 人工智能 | 12小时前 |
- 小米汽车五一出行报告:超1亿公里行驶
- 281浏览 收藏
-
- 科技周边 · 人工智能 | 13小时前 | 法拉第未来 第一季度财报 FXSuperOne FX车型 汉福德工厂
- 法拉第未来Q1营收30万,亏损4380万
- 392浏览 收藏
-
- 前端进阶之JavaScript设计模式
- 设计模式是开发人员在软件开发过程中面临一般问题时的解决方案,代表了最佳的实践。本课程的主打内容包括JS常见设计模式以及具体应用场景,打造一站式知识长龙服务,适合有JS基础的同学学习。
- 542次学习
-
- GO语言核心编程课程
- 本课程采用真实案例,全面具体可落地,从理论到实践,一步一步将GO核心编程技术、编程思想、底层实现融会贯通,使学习者贴近时代脉搏,做IT互联网时代的弄潮儿。
- 508次学习
-
- 简单聊聊mysql8与网络通信
- 如有问题加微信:Le-studyg;在课程中,我们将首先介绍MySQL8的新特性,包括性能优化、安全增强、新数据类型等,帮助学生快速熟悉MySQL8的最新功能。接着,我们将深入解析MySQL的网络通信机制,包括协议、连接管理、数据传输等,让
- 497次学习
-
- JavaScript正则表达式基础与实战
- 在任何一门编程语言中,正则表达式,都是一项重要的知识,它提供了高效的字符串匹配与捕获机制,可以极大的简化程序设计。
- 487次学习
-
- 从零制作响应式网站—Grid布局
- 本系列教程将展示从零制作一个假想的网络科技公司官网,分为导航,轮播,关于我们,成功案例,服务流程,团队介绍,数据部分,公司动态,底部信息等内容区块。网站整体采用CSSGrid布局,支持响应式,有流畅过渡和展现动画。
- 484次学习
-
- 可图AI图片生成
- 探索快手旗下可灵AI2.0发布的可图AI2.0图像生成大模型,体验从文本生成图像、图像编辑到风格转绘的全链路创作。了解其技术突破、功能创新及在广告、影视、非遗等领域的应用,领先于Midjourney、DALL-E等竞品。
- 7次使用
-
- MeowTalk喵说
- MeowTalk喵说是一款由Akvelon公司开发的AI应用,通过分析猫咪的叫声,帮助主人理解猫咪的需求和情感。支持iOS和Android平台,提供个性化翻译、情感互动、趣味对话等功能,增进人猫之间的情感联系。
- 7次使用
-
- Traini
- SEO摘要Traini是一家专注于宠物健康教育的创新科技公司,利用先进的人工智能技术,提供宠物行为解读、个性化训练计划、在线课程、医疗辅助和个性化服务推荐等多功能服务。通过PEBI系统,Traini能够精准识别宠物狗的12种情绪状态,推动宠物与人类的智能互动,提升宠物生活质量。
- 7次使用
-
- 可图AI 2.0图片生成
- 可图AI 2.0 是快手旗下的新一代图像生成大模型,支持文本生成图像、图像编辑、风格转绘等全链路创作需求。凭借DiT架构和MVL交互体系,提升了复杂语义理解和多模态交互能力,适用于广告、影视、非遗等领域,助力创作者高效创作。
- 15次使用
-
- 毕业宝AIGC检测
- 毕业宝AIGC检测是“毕业宝”平台的AI生成内容检测工具,专为学术场景设计,帮助用户初步判断文本的原创性和AI参与度。通过与知网、维普数据库联动,提供全面检测结果,适用于学生、研究者、教育工作者及内容创作者。
- 27次使用
-
- GPT-4王者加冕!读图做题性能炸天,凭自己就能考上斯坦福
- 2023-04-25 501浏览
-
- 单块V100训练模型提速72倍!尤洋团队新成果获AAAI 2023杰出论文奖
- 2023-04-24 501浏览
-
- ChatGPT 真的会接管世界吗?
- 2023-04-13 501浏览
-
- VR的终极形态是「假眼」?Neuralink前联合创始人掏出新产品:科学之眼!
- 2023-04-30 501浏览
-
- 实现实时制造可视性优势有哪些?
- 2023-04-15 501浏览