首页 > 其他分享 >独家原创 | SCI 1区 高创新预测模型!

独家原创 | SCI 1区 高创新预测模型!

时间:2024-11-21 23:14:45浏览次数:3  
标签:Transformer SCI 预测 模型 博客 独家 CSDN 序列

 往期精彩内容:

时序预测:LSTM、ARIMA、Holt-Winters、SARIMA模型的分析与比较

全是干货 | 数据集、学习资料、建模资源分享!

EMD变体分解效果最好算法——CEEMDAN(五)-CSDN博客

拒绝信息泄露!VMD滚动分解 + Informer-BiLSTM并行预测模型-CSDN博客

风速预测(一)数据集介绍和预处理_风速数据在哪里下载-CSDN博客

风速预测(二)基于Pytorch的EMD-LSTM模型-CSDN博客

风速预测(三)EMD-LSTM-Attention模型-CSDN博客

风速预测(四)基于Pytorch的EMD-Transformer模型-CSDN博客

风速预测(五)基于Pytorch的EMD-CNN-LSTM模型-CSDN博客

风速预测(六)基于Pytorch的EMD-CNN-GRU并行模型-CSDN博客

风速预测(七)VMD-CNN-BiLSTM预测模型-CSDN博客

单步预测-风速预测模型代码全家桶-CSDN博客

CEEMDAN +组合预测模型(BiLSTM-Attention + ARIMA)-CSDN博客

CEEMDAN +组合预测模型(Transformer - BiLSTM + ARIMA)-CSDN博客

CEEMDAN +组合预测模型(CNN-LSTM + ARIMA)-CSDN博客

CEEMDAN +组合预测模型(CNN-Transformer + ARIMA)-CSDN博客

多特征变量序列预测(一)——CNN-LSTM风速预测模型-CSDN博客

多特征变量序列预测(二)——CNN-LSTM-Attention风速预测模型-CSDN博客

多特征变量序列预测(三)——CNN-Transformer风速预测模型-CSDN博客

多特征变量序列预测(四) Transformer-BiLSTM风速预测模型-CSDN博客

多特征变量序列预测(五) CEEMDAN+CNN-LSTM风速预测模型-CSDN博客

多特征变量序列预测(六) CEEMDAN+CNN-Transformer风速预测模型-CSDN博客

 多特征变量序列预测(七) CEEMDAN+Transformer-BiLSTM预测模型-CSDN博客

多特征变量序列预测(八)基于麻雀优化算法的CEEMDAN-SSA-BiLSTM预测模型-CSDN博客

多特征变量序列预测(九)基于麻雀优化算法的CEEMDAN-SSA-BiGRU-Attention预测模型-CSDN博客

多特征变量序列预测(10)基于麻雀优化算法的CEEMDAN-SSA-Transformer-BiLSTM预测模型-CSDN博客

多特征变量序列预测(11) 基于Pytorch的TCN-GRU预测模型-CSDN博客

基于麻雀优化算法SSA的CEEMDAN-BiLSTM-Attention的预测模型-CSDN博客

基于麻雀优化算法SSA的CEEMDAN-Transformer-BiGRU预测模型-CSDN博客

半天入门!锂电池剩余寿命预测(Python)-CSDN博客

超强预测模型:二次分解-组合预测-CSDN博客

VMD + CEEMDAN 二次分解,BiLSTM-Attention预测模型-CSDN博客

超强预测算法:XGBoost预测模型-CSDN博客

基于麻雀优化算法SSA的预测模型——代码全家桶-CSDN博客

VMD + CEEMDAN 二次分解,CNN-Transformer预测模型-CSDN博客

创新点:

1.利用时空卷积网络(TCN)来提取序列的全局空间特征,同时利用 Transformer 来提取序列中的长期依赖关系的时序特征,采用并行结构,加快模型的训练和推理速度;

2.利用交叉注意力进行并行网络时空特征的融合,这样可以同时考虑时序关系和位置关系,从而更好地捕捉时空序列数据中的特征,增强特征的表示能力来实现高精度的预测。

注意:此次产品,我们还有配套的模型讲解(方便学习网络结构)和参数调节讲解(用在自己数据集上调参)!有毕业设计或者发小论文需求的同学必看,模块丰富,创新度高,性能优越!

该模型 多变量特征 | 单变量序列预测都适用!

前言

本文基于前期介绍的电力变压器(文末附数据集),介绍一种基于交叉注意力融合时空特征的TCN-Transformer并行预测模型,以提高时间序列数据的预测性能。电力变压器数据集的详细介绍可以参考下文:

电力变压器数据集介绍和预处理

1 模型整体结构

模型整体结构如下所示,多特征变量时间序列数据先经过TCN网络提取全局特征,同时数据通过Transformer编码器层提取时序特征,使用交叉注意力机制融合空间和时序特征,通过计算注意力权重,使得模型更关注重要的特征再进行特征增强融合,最后经过全连接层进行高精度预测。

(1) 时空卷积网络(TCN):

  • TCN是一种卷积神经网络结构,用于捕捉时序数据中的时序关系。它由一系列的1D卷积层组成,每个卷积层都具有相同的卷积核大小和步长。

  • TCN中的残差连接(Residual Connections)和空洞卷积(Dilated Convolutions)用于增加网络的感受野,以便更好地捕捉时序数据中的长期依赖关系。

  • TCN可以同时处理多个时间步的输入,这使得模型能够在多个时间步上进行并行预测。

(2) Transformer模型:

  • Transformer是一种基于自注意力机制的序列建模方法,通过注意力机制来建模序列中不同位置之间的依赖关系,能够捕捉序列中的全局上下文信息。

  • 自注意力机制通过计算输入序列中不同位置的相关性来分配不同位置的权重。这使得模型能够根据序列中不同位置的重要性来进行建模和预测。

(3) 并行预测:

  • TCN-Transformer模型采用并行结构,能够同时预测多个时间步的目标。

  • 并行预测可以加快模型的训练和推理速度,并且能够充分利用时序数据中的信息,提高预测性能。

(4) 交叉注意力融合:

使用交叉注意力机制融空间和时序特征,可以通过计算注意力权重,学习时空特征中不同位置之间的相关性,可以更好地捕捉时空序列数据中的特征,提高模型性能和泛化能力。

多特征变量数据集制作与预处理

2.1 导入数据

2.2 制作数据集

制作数据集与分类标签

3 交叉注意力机制

图片

3.1 Cross attention概念

  • Transformer架构中混合两种不同嵌入序列的注意机制

  • 两个序列必须具有相同的维度

  • 两个序列可以是不同的模式形态(如:文本、声音、图像)

  • 一个序列作为输入的Q,定义了输出的序列长度,另一个序列提供输入的K&V

3.2 Cross-attention算法 

  • 拥有两个序列S1、S2

  • 计算S1的K、V

  • 计算S2的Q

  • 根据K和Q计算注意力矩阵

  • 将V应用于注意力矩阵

  • 输出的序列长度与S2一致

图片

在融合过程中,我们将经过Transformer的时序特征作为查询序列,TCN提取的全局空间特征作为键值对序列。通过计算查询序列与键值对序列之间的注意力权重,我们可以对不同特征之间的关联程度进行建模。

4 基于TCN-Transformer-CrossAttention的高精度预测模型

4.1 定义网络模型

4.2 设置参数,训练模型

50个epoch,训练误差极小,多变量特征TCN-Transformer-CrossAttention融合网络模型预测效果显著,模型能够充分提取时间序列的空间特征和时序特征,收敛速度快,性能优越,预测精度高,交叉注意力机制能够对不同特征之间的关联程度进行建模,从序列时空特征中提取出对模型预测重要的特征,效果明显!

4.3 模型评估和可视化

预测结果可视化

模型评估

5 代码、数据整理如下:

标签:Transformer,SCI,预测,模型,博客,独家,CSDN,序列
From: https://blog.csdn.net/2402_85668383/article/details/143957480

相关文章

  • 用函数实现:在字符串str中找出ASCII码值最大的字符,将其放在第一个位置上;并将该字符前的
    完整的题目在这里哈:用函数实现:在字符串str中找出ASCII码值最大的字符,将其放在第一个位置上;并将该字符前的原字符向后顺序移动。要求字符串str只包含数字、大写或小写字母。例如,调用fun_delet()函数之前给字符串输入:ABCDeFGH,调用后字符串中的内容为:eABCDFGH.     时......
  • 【鸿蒙基于API 13实战开发】—— 进程模型&线程模型分析
    ......
  • Python数据分析NumPy和pandas(四十、Python 中的建模库statsmodels 和 scikit-learn)
    主要学习两个流行的建模工具包,statsmodels和scikit-learn。一、pandas与模型代码之间的接口模型开发的常见工作流程是使用pandas进行数据加载和清理,然后再切换到建模库来构建模型本身。模型开发过程的一个重要部分在机器学习中称为特征工程,这可以描述从原始数据集中提取......
  • 多模态大语言模型——《动手学大模型》实践教程第六章
    目录1前言2多模态大语言模型3实践代码3.1理论知识预备3.1.1了解多模态大语言模型的类型3.1.2了解多模态大语言模型的通用技术框架3.2上手实践通用多模态大语言模型3.2.1面向通用统一的“任意到任意模态”多模态大语言模型:NExT-GPT3.2.2代码框架浏览3.2.3安装......
  • AI大模型如何赋能电商行业并引领变革?
    成长路上不孤单......
  • 九析带你轻松完爆AI大模型(十六)---项目实战①
    申明:九析唯一授权【超级网红系列课程——AI大模全栈型架构师】系列课程一、项目自述    九析老师:“早上好,三上,你看起来气色很好,元气满满。”    三上老师:“谢谢九析老师,早睡早起,对身体很有益处。不过你看起来倒有点疲惫。”    九析老师:“是......
  • 大模型在企业落地的三大阻力
    关注我的朋友应该看到了,上个月我作为助教参加了公司新一期的AICA首席架构师培养计划,在三天的学习里我和来自不同的企业学员们做了很多交流,发现大模型要想在企业真正落地,还有很多坎儿需要迈,很多块硬骨头需要啃。前排提示,文末有大模型AGI-CSDN独家资料包哦!今天就想结合这段......
  • 以数据为中心的大模型落地方法论与实践
    引言大模型落地到当前这个阶段,核心关注点还是领域大模型,而领域大模型落地的前提在于两点:需求端,对当前应用的降本增效以及新应用的探索;供给端,训练技术已经有较高的成熟度。前排提示,文末有大模型AGI-CSDN独家资料包哦!降本增效方面,以机器学习团队的构成为例,滴普科技Deepexi......
  • AI论文写作专属模型-积墨论文
    在这个信息爆炸的时代,学术研究和论文写作已经成为知识传播的重要途径。然而,传统的论文写作方式耗时耗力,往往让研究者们分身乏术。为了解决这一难题,积墨论文,一个革命性的AI论文写作专属模型,它将彻底改变您的写作体验。在线全文预览,所见即所得积墨论文支持在线全文预览功能,让您......
  • Transformer 模型全方位解析
    Transformer模型全方位解析引言Transformer模型自从在2017年被提出以来,已经成为了自然语言处理(NLP)领域的主流模型之一。它不仅在机器翻译、文本生成等任务中表现出色,还成为了许多先进模型(如BERT和GPT)的基础。本文将全面解析Transformer模型的概念、工作原理、优势、应用......