首页 > 编程语言 >Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测

时间:2024-09-09 10:53:33浏览次数:16  
标签:plot plt Python 模型 Attention CNN 电池


 分析师:Weiqiao Jue

在当今的数字化时代,数据的爆炸式增长既带来了机遇,也带来了挑战。如何从海量的数据中高效地提取有价值的信息,并进行准确的分类和预测,成为了众多领域亟待解决的关键问题。

本研究通过CNN+LSTM+Attention模型提高新闻文本分类的精确性的案例,结合Attention+CNN+BiLSTM锂离子电池健康、寿命预测的代码数据,深入探讨 Python 在不同领域的应用以及深度学习技术在数据处理和预测中的强大潜力,为推动相关领域的发展提供有益的参考和借鉴。

CNN+LSTM+Attention模型提高新闻文本分类的精确性

新闻文本分类,准确地将海量新闻文本划分到不同类别中,有助于信息的高效检索和利用。为了实现更高的分类精确性,我们引入了 CNN+LSTM+Attention 模型。该模型利用大规模的训练集和测试集数据,经过精心的数据处理和复杂的模型架构设计,能够有效地捕捉新闻文本中的语义特征和上下文关系,从而显著提高分类的准确性,减少误差。

 

任务/目标

使用CNN+LSTM+Attention模型提高新闻文本分类的准确性,减少误差

数据源准备

训练集为20w条样本,测试集为10w条样本。将训练集分为10份,前9份为训练集,最后1份为验证集。定义并创建vacab。Vacab有两份,一份是自创建的,另一份是外部加载的。得到词与字典对应的embedding。

模型构建

按照vacab将文本转换为对应的索引,最后返回的数据是list,里面的每一个元素是tuple。进而将每一个batch转换成tensor,生成训练数据。

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类

词向量输入CNN中,CNN中分别定义了3个大小不同的卷积核,经过卷积+池化后将3个向量拼接输入双向LSTM中。接着,经过Attention,在Attention中经过线性变化得到key,再将key与query相乘得到output,表示每个句子所分配到的权重,再进行softmax。最后进入FC层得到分类概率的向量。

最后测试集得分为74.10。相较于单一模型的文本分类其效果有显著提升。

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_02

Attention+CNN+BiLSTM锂离子电池健康、寿命预测

锂离子电池的健康状态(State of Health,SOH)和剩余使用寿命(Remaining Useful Life,RUL)是电池化学的重要方面,从不同角度描述了电池的当前老化程度。为提高电池健康评估模型的有效性和准确性,本文实现了一种利用卷积神经网络(Convolutional Neural Networks,CNN)、双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)和注意力机制(Attention Mechanism,AM)对锂离子电池的 SOH 和 RUL 进行估计的方法,构建了用于锂离子电池容量估计的混合网络模型,并计算 SOH 和 RUL。

引言

锂离子电池在现代社会中有着广泛的应用,准确评估其健康状态和剩余使用寿命对于确保设备的可靠运行至关重要。传统的电池健康评估方法存在一定的局限性,而深度学习方法在处理复杂数据和挖掘潜在特征方面具有优势。因此,本文提出了一种基于注意力机制的 CNN-BiLSTM 混合网络模型,以提高锂离子电池健康状态预测的准确性。

数据来源

本文使用的锂离子电池数据来自美国国家航空航天局艾姆斯预测数据存储库(NASA Ames Prognostics Data Repository)[1]。此外,还包括一个用于对该数据集进行初步数据探索的笔记本以及一个用于荷电状态(State of Charge,SOC)预测的支持向量机(Support Vector Machine,SVM)模型。

模型概述

该模型首先使用卷积神经网络(CNN)进行特征提取和数据降维。这些特征作为双向长短期记忆网络(BiLSTM)的输入。BiLSTM 用于双向学习输入时间序列局部特征中的时间相关性信息。注意力机制通过为重要特征分配权重,更加关注对输出结果影响最大的输入关键特征,并进行电池 SOH 的多步预测。总体而言,卷积层提取时间序列数据的内在特征,BiLSTM 可以基于提取的特征预测电池容量,而注意力机制为这些特征分配权重。混合神经网络模型的结构示意图如下图 [2] 所示。

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_03

 

结果与分析

不同电池的容量绘制。

绘制不同电池的容量曲线,如下所示:

ax.plot(B0005_capacity[0], B0005_capacity[1], color='blue', label='Battery-05')
 
ax.plot(B0006_capacity[0], B0006_capacity[1], color='green', label='Battery-06')
 
ax.plot(B0007_capacity[0], B0007_capacity[1], color='red', label='Battery-07')

 

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_04

充电数据绘制

针对充电数据进行绘制,代码如下:

 

indx = 1
 
for label in charging_labels: 
fig, ax = plt.subplots(1, figsize=(20, 7))
 
fig1, ax1 = plt.subplots(1, figsize=(20, 7)) 
fig2, ax2 = plt.subplots(1, figsize=(20, 7))
 
fig3, ax3=plt.subplots(1, figsize=(20, 7))
  
 
ax.plot(B0005_charging[5], B0005_charging[indx], color='red' ,label="B0005")
 
ax1.plot(B0006_charging[5], B0006_charging[indx], color='orange', label="B0006")

 

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_05

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_06

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_07

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_08

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_ci_09

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_10

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_ci_11

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_12

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_13

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_14

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_15

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_16

放电数据绘制

对于放电数据进行绘制,代码如下:

 

indx = 1
 
for label in charging_labels:
 
fig, ax = plt.subplots(1, figsize=(20, 7))
 
fig1, ax1 = plt.subplots(1, figsize=(20, 7))
 
fig2, ax2 = plt.subplots(1, figsize=(20, 7))
  
 
ax.plot(B0005_discharging[5], B0005_discharging[indx], color='red' ,label="B0005")
 
ax1.plot(B0006_discharging[5], B0006_discharging[indx], color='orange', label="B0006")
 
ax2.plot(B0007_discharging[5], B0007_discharging[indx], color='blue' ,label="B0007")

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_ci_17

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_ci_18

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_19

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_ci_20

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_ci_21

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_22

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_23

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_24

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_25

SVM

 SVM 模型应用

获取 B0005 的数据框并绘制残差图:

dfB0005 = getDataframe(B0005) 
sns.residplot(dfB0005['cycle'], dfB0005['capacity'])

 

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_26

使用最佳支持向量回归(Support Vector Regression,SVR)进行预测 

y_pred = best_svr.predict(X.values.reshape(-1, 1))

 

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_27

电池 SOC 的 CNN-BiLSTM-Attention 模型

定义模型参数:INPUT_DIMS = 4TIME_STEPS = 10lstm_units = 64。对数据进行归一化处理 

 

INPUT_DIMS = 4
 
TIME_STEPS = 10
 
lstm_units = 64
 
#Normalized
 
data,normalize = NormalizeMult(dfB0007)
 
capacity_data = data[:,0].reshape(len(dfB0007),1)
 
train_X, _ = create_dataset(data,TIME_STEPS)
 
_ , train_Y = create_dataset(capacity_data,TIME_STEPS)
  
 
print(train_X.shape,train_Y.shape)
  
 
m = attention_model()
 
m.summary()

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_28

print(train_X.shape,train_Y.shape)  
 
m = attention_model() 
m.summary()

 

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_29

绘制模型平均绝对误差(Mean Absolute Error,MAE)曲线和真实值与预测值对比曲线 

 

plt.plot(history.history['mae'])
 
plt.plot(history.history['val_mae'])
 
plt.title('model MAE')
 
plt.ylabel('MAE')
 
plt.xlabel('epoch')
 
plt.legend(['train', 'validation'], loc='upper left') 
plt.show()

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_ci_30

 

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_31

 

 

plt.plot(test_Y[:100])
 
plt.title('real vs pred')
 
plt.ylabel('value')
 
plt.xlabel('epoch')
 
plt.legend(['pred', 'real'], loc='upper left')

 

 

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_数据_32

结论

本文提出的基于注意力机制的 CNN-BiLSTM 混合网络模型在锂离子电池健康状态预测方面表现出了较好的性能。通过对来自 NASA 数据存储库的锂离子电池数据进行实验,验证了该模型在特征提取、时间相关性学习和关键特征关注方面的有效性。未来,可以进一步优化模型结构和参数,提高预测的准确性和稳定性,并将该模型应用于实际的电池管理系统中,为电池的安全运行和维护提供有力支持。

 

参考文献 

[1] B. Saha and K. Goebel (2007). "Battery Data Set", NASA Ames Prognostics Data Repository (https://ti.arc.nasa.gov/tech/dash/groups/pcoe/prognostic-data-repository/#battery), NASA Ames Research Center, Moffett Field, CA

[2] Zhu Z, Yang Q, Liu X, Gao D. Attention-based CNN-BiLSTM for  SOH and RUL estimation of  lithium-ion batteries. Journal of Algorithms & Computational Technology. 2022;16. doi:10.1177/17483026221130598

关于分析师 

在此对 Weiqiao Jue 对本文所作的贡献表示诚挚感谢,他完成了计算机科学与技术专业的硕士学位,专注深度学习、NLP、图像处理领域。擅长使用 PyCharm、Pytorch 框架。

Python用CNN+LSTM+Attention对新闻文本分类、锂离子电池健康、寿命数据预测_文本分类_33

 


标签:plot,plt,Python,模型,Attention,CNN,电池
From: https://blog.51cto.com/u_14293657/11959416

相关文章

  • 安卓版本python画一个太极图程序代码
    importturtleimportmathdefdraw_circle(color,radius,x,y):turtle.penup()turtle.goto(x,y)turtle.pendown()turtle.color(color)turtle.begin_fill()turtle.circle(radius)turtle.end_fill()defdraw_half_yin_yang(color,radius,x,y):turtle.penup()......
  • 基于Python的期货交易模拟系统
    基于Python的期货交易模拟系统。开发技术:PyCharm开发环境;Python语言;MySQL数据库;Django框架;B/S架构。项目内容:该系统从三个对象:由管理员和用户、期货公司来对系统进行设计构建。主要功能包括:个人信息修改,对用户信息、期货公司信息、期货投资、取消投资、风险控制、账户资金、......
  • 17 Python异常处理(捕获异常、抛出异常、自定义异常)
    本篇是Python系列教程第17篇,更多内容敬请访问我的Python合集当我们编写代码时,可能会遇到各种各样的错误情况,比如除数为零、找不到文件、网络问题等等。为了优雅地处理这些问题,Python提供了异常处理机制。1异常处理的基本结构Python中的异常处理主要依赖于try和ex......
  • Python 错误 AttributeError 解析,实际错误实例详解
    文章目录前言Python错误AttributeError:_csv.readerobjectHasNoAttributeNext修复Python中的AttributeError:'_csv.reader'objecthasnoattribute'next'错误Python错误AttributeError:‘_io.TextIOWrapper‘objectHasNoAttribute‘Sp......
  • 16 Python的包以及import和from的使用
    本篇是Python系列教程第16篇,更多内容敬请访问我的Python合集1创建包创建文件夹:首先你需要创建一个文件夹作为包的容器。添加__init__.py文件:在这个文件夹内需要有一个特殊的文件叫做__init__.py。这个文件可以为空,也可以包含初始化代码。它的存在标志着这个目录可......
  • (免费源码)计算机毕业设计必看必学 原创定制程序 java、PHP、python、小程序、文案全套
    springboot电影推荐网站摘 要随着互联网时代的到来,同时计算机网络技术高速发展,网络管理运用也变得越来越广泛。因此,建立一个B/S结构的电影推荐网站;电影推荐网站的管理工作系统化、规范化,也会提高平台形象,提高管理效率。本电影推荐网站是针对目前电影推荐网站的实际需求,从......
  • (免费源码)计算机毕业设计必看必学 原创定制程序 java、PHP、python、小程序、文案全套
    SSM?中小型药店信息管理系统摘要21世纪的今天,随着社会的不断发展与进步,人们对于信息科学化的认识,已由低层次向高层次发展,由原来的感性认识向理性认识提高,管理工作的重要性已逐渐被人们所认识,科学化的管理,使信息存储达到准确、快速、完善,并能提高工作管理效率,促进其发展。论......
  • 【Python学习笔记】 第5章 数值类型
    数值类型基础知识在Python中,数值实际上是一种类型的分类,包括:整数、浮点数复数小数:固定精度对象分数:有理数对象集合:带有数值运算的集合体布尔值:True,False内置函数与块:round,math,random等表达式、无限制精度整数(很大的整数)、位运算、八进制、十二进制、......
  • ubuntu升级python版本
    ubuntu升级python版本#更新包列表sudoaptupdate#安装Python所需的软件包sudoaptinstallsoftware-properties-common#添加PythonPPA(以Python3.12为例)sudoadd-apt-repositoryppa:deadsnakes/ppasudoaptupdate#安装新版本sudoaptinstallpython3.1......