首页 > 其他分享 >使用skforecast进行时间序列预测

使用skforecast进行时间序列预测

时间:2023-11-26 09:33:57浏览次数:29  
标签:end 预测 val train skforecast 序列

时间序列预测是数据科学和商业分析中基于历史数据预测未来价值的一项重要技术。它有着广泛的应用,从需求规划、销售预测到计量经济分析。由于Python的多功能性和专业库的可用性,它已经成为一种流行的预测编程语言。其中一个为时间序列预测任务量身定制的库是skforecast。

在本文中,将介绍skforecast并演示了如何使用它在时间序列数据上生成预测。skforecast库的一个有价值的特性是它能够使用没有日期时间索引的数据进行训练和预测。

数据集

我在本文中使用的数据集来自Kaggle,它通过加速度计数据提供了一个全面的窗口来了解各种体育活动。我们这里只提取了其中一个参与者的代表步行活动的加速信号。

数据集见这里:https://avoid.overfit.cn/post/de4e26b02fb74fb58c65ac2f86dce87c

超参数调优和滞后选择

第一步:将时间序列信号分为训练集、验证集和测试集。

  1. end_train = 2500
  2. end_val = 2750
  3. data_train = acc_x_walking[:end_train]
  4. data_val = acc_x_walking[end_train:end_val]
  5. data_test = acc_x_walking[end_val:]

Skforecast采用了类似于Sickit-Learn的结构,这是一个很多人都熟悉的框架。所以对五个模型进行超参数调优和选择滞后是一个简单的过程。

标签:end,预测,val,train,skforecast,序列
From: https://www.cnblogs.com/deephub/p/17856548.html

相关文章

  • 数据分享|Eviews用ARIMA、指数曲线趋势模型对中国进出口总额时间序列预测分析
    全文链接:https://tecdat.cn/?p=34361原文出处:拓端数据部落公众号研究的背景及意义众自20世纪80年代至今,随着改革开放的深入以及中国最终加入WTO,我国的对外贸易实现了跨越式的发展,中国已经成为世界第一大出口国和第二大进口国,中国经济对世界经济做出了重大贡献。与此同时,中国经......
  • PYTHON用KERAS的LSTM神经网络进行时间序列预测天然气价格例子|附代码数据
    全文下载链接:http://tecdat.cn?p=26519最近我们被客户要求撰写关于LSTM的研究报告,包括一些图形和统计输出。一个简单的编码器-解码器LSTM神经网络应用于时间序列预测问题:预测天然气价格,预测范围为10天。“进入”时间步长也设置为10天。)只需要10天来推断接下来的10天。......
  • php反序列化
    serialize()函数“所有php里面的值都可以使用函数serialize()来返回一个包含字节流的字符串来表示。序列化一个对象将会保存对象的所有变量,但是不会保存对象的方法,只会保存类的名字。”在程序执行结束时,内存数据便会立即销毁,变量所储存的数据便是内存数据,而文件、数据库是“持久......
  • 7-Bioedit软件做测序后的序列比对和序列的反向互补与翻译
     1,我有两段序列,一段是基因组提取出来的CDS序列,一段是PCR出来的测序的序列,我们需要将它们比对,看看有没有碱基的变化。这时候就需要用到Bioedit软件了。首先,将两端待比对的序列,放到记事本中,要fasta格式,做个例子,如下: 2,选中全部,CTRL+C,先复制。再打开Bioedit软件,File>NewAlignm......
  • P1439 【模板】最长公共子序列
    前置知识:\(LIS\):即最长上升子序列(\(Longest\)\(Increasing\)\(Subsequence\))LuoguB3637最长上升子序列这是一个简单的动规板子题。给出一个由\(n(n\le5000)\)个不超过\(10^6\)的正整数(\(x_1,x_2,\cdots,x_n\))组成的序列。请输出这个序列的最长上升子......
  • SnapGene:专业生物分析软件,轻松解析DNA序列 mac/win版
    SnapGene是一款功能强大的DNA序列生物分析软件,它可以帮助用户轻松解析、管理和可视化DNA序列数据。SnapGene适用于各种生物信息学研究领域,包括基因组学、转录组学和进化生物学等。点击获取SnapGenemac/win版首先,SnapGene具有直观的用户界面,使得用户可以轻松上手并快速掌握各种......
  • java.sql.SQLException: ORA-02289: 序列不存在
    --CreatesequencecreatesequenceLOG_IDminvalue1maxvalue9999999999999999999999999999startwith1incrementby1cache20;如果检查没问题的话,不妨试试上面的代码,就是sequenceLog_ID未创建,希望能有所帮助!......
  • R语言集成模型:提升树boosting、随机森林、约束最小二乘法加权平均模型融合分析时间序
    原文链接:http://tecdat.cn/?p=24148原文出处:拓端数据部落公众号 最近我们被要求撰写关于集成模型的研究报告,包括一些图形和统计输出。特别是在经济学/计量经济学中,建模者不相信他们的模型能反映现实。比如:收益率曲线并不遵循三因素的Nelson-Siegel模型,股票与其相关因素之间的......
  • 在r语言中使用GAM(广义相加模型)进行电力负荷时间序列分析|附代码数据
    原文链接:http://tecdat.cn/?p=9024原文出处:拓端数据部落公众号  最近我们被要求撰写关于GAM的研究报告,包括一些图形和统计输出。用GAM进行建模时间序列我已经准备了一个文件,其中包含四个用电时间序列来进行分析。数据操作将由data.table程序包完成。将提及的智能电表数据......
  • 斯坦福大学引入FlashFFTConv来优化机器学习中长序列的FFT卷积
    斯坦福大学的FlashFFTConv优化了扩展序列的快速傅里叶变换(FFT)卷积。该方法引入Monarch分解,在FLOP和I/O成本之间取得平衡,提高模型质量和效率。并且优于PyTorch和FlashAttention-v2。它可以处理更长的序列,并在人工智能应用程序中打开新的可能性。处理长序列的效率一直是机器学习......