首页 > 编程语言 >Python数据分析大作业(ARIMA 自回归积分滑动平均模型) 2000+字 图文分析文档 疫情分析+完整python代码

Python数据分析大作业(ARIMA 自回归积分滑动平均模型) 2000+字 图文分析文档 疫情分析+完整python代码

时间:2024-04-10 15:00:41浏览次数:14  
标签:plot plt Python 模型 ARIMA cas python 序列

资源地址:Python数据分析大作业 2000+字 图文分析文档 疫情分析+完整python代码
在这里插入图片描述

数据分析

数据来自法国疫情数据
在这里插入图片描述

时间序列是由四种因素组成的:长期趋势、季节变动、循环变动、随机波动。当我们对一个时间序列进行预测时,应该考虑将上述四种因素从时间序列中分解出来。
分解之后,能够克服其他因素的影响,仅仅考虑一种因素对时间序列的影响,也可以分析他们之间的相互作用,以及他们对时间序列的综合影响。当去掉这些因素后,就可以更好地进行时间序列之间的比较,从而更加客观的反映事物变化发展规律,序列可以用来建立回归模型,从而提高预测精度。时间序列的四种因素具有不同的特点:长期趋势反映了事物发展规律,是重点研究的对象;循环变动由于周期长,可以看作是长期趋势的反映,一般和长期趋势统称为趋势-周期因素;随机不规则变动由于不容易测量,通常也不单独分析(注:“S”型增长曲线是持续增长的,随机波动是一种与某个特殊事件相关的短期波动,具有一定的概率,可作为决策的辅助依据);季节变动有时会让预测模型误判其为不规则变动,从而降低模型的预测精度。当一个时间序列具有季节变动特征时,在预测之前会先将季节因素进行分解,也就是将季节变动因素从原时间序列中去除,并生成由剩余三种因素构成的序列来满足后续分析需求。
ARIMA 全称为自回归积分滑动平均模型(Autoregressive Integrated Movi ng Average Model,简记 ARIMA),ARIMA(p,d,q)模型是针对非平稳时间序列所 建立的模型。ARIMA 的含义包含 3 个部分,即 AR、I 、MA。
其中: AR 表示 auto regression,即自回归模型; I 表示 integration,即单整阶数,时间序列模型必须是平稳性序列才能建 立计量模型,ARIMA 模型作为时间序列模型也不例外,因此首先要对时间序列进 行单位根检验,如果是非平稳序列,就要通过差分来转化为平稳序列,经过几次 差分转化为平稳序列,就称为几阶单整; MA 表示 moving average,即移动平均模型。可见,ARIMA 模型实际上是 AR 模型和 MA 模型的组合。相应的,有三个参数:p,d,q。
其中:
p 代表预测模型中采用的时序数据本身的滞后数(lags) ,也叫做 AR/Auto Regressive 项。 d 代表时序数据需要进行几阶差分化,才是稳定的,也叫 Integrated 项。
q 代表预测模型中采用的预测误差的滞后数(lags),也叫做 MA/Moving Average

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

资源地址:Python数据分析大作业 2000+字 图文分析文档 疫情分析+完整python代码

代码详解

完整代码文件
image-20240407220302833

image-20240407220441078

image-20240407220508782

完整代码文件

主要是对时间序列数据进行分析和预测。让我们逐步解释每一部分:

  1. 导入必要的库

    from math import *
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
    from pylab import *
    
    • math: 导入数学函数库,但实际上在后续的代码中没有用到。
    • numpypandasmatplotlib.pyplot: 分别是用于数值计算、数据处理和可视化的常用库。
    • statsmodels.graphics.tsaplots.plot_acfstatsmodels.graphics.tsaplots.plot_pacf:用于绘制自相关性和偏自相关性图。
    • pylab: 导入了 *,所以其下所有函数都可直接使用。
  2. 设置中文字体和负号显示

    plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置中文字体为黑体
    plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题
    
  3. 读取数据

    cas_confirmes = pd.read_csv('cas_confirmes.csv', index_col=0)
    hospitalises = pd.read_csv('hospitalises.csv', index_col=0)
    

    从文件中读取了两个时间序列数据,分别是患病确诊人数和住院人数。

  4. 数据处理

    cas_confirmes.fillna(np.nanmean(cas_confirmes) + 30 * np.random.random(), inplace=True)
    hospitalises.fillna(np.nanmean(hospitalises), inplace=True)
    

    使用每列的均值填充缺失值。

  5. 数据可视化

    cas_confirmes.plot() 
    plt.title('Change in the number of cases')
    plt.show()
    hospitalises.plot()
    plt.title('Changes in the number of people in the hospital')
    plt.show()
    

    绘制了患病确诊人数和住院人数的变化趋势图。

  6. 自相关性分析

    plot_acf(cas_confirmes)
    plt.title('The autocorrelation of the number of patients')
    plot_pacf(cas_confirmes)
    plt.title('Partial autocorrelation of the number of patients')
    plt.show()
    
    plot_acf(hospitalises)
    plt.title('Autocorrelation graph of the number of people in the hospital')
    plot_pacf(hospitalises)
    plt.title('Partial autocorrelation graph of the number of people in the hospital')
    plt.show()
    

    绘制了患病确诊人数和住院人数的自相关性和偏自相关性图。

  7. ARIMA 模型定阶

    train_results = sm.tsa.arma_order_select_ic(cas_confirmes['2020-03-19':'2021-06-09'], ic=['bic'], trend='nc', max_ar=5, max_ma=5)
    print('BIC for the number of patients', train_results.bic_min_order)
    

    使用 BIC 准则确定 ARIMA 模型的阶数。

  8. 构建 ARIMA 模型

    model = ARIMA(cas_confirmes['2020-03-19':'2021-05-09'], order=(2,0,1))
    results_comfirm = model.fit();
    

    使用确定的阶数构建 ARIMA 模型,并对患病确诊人数和住院人数分别进行建模。

  9. 模型诊断

    print('The white noise test result of the diseased difference sequence was:', acorr_ljungbox(resid1.values.squeeze(), lags=1))
    print('The white noise test result of hospitalization difference sequence is:', acorr_ljungbox(resid2.values.squeeze(), lags=1))
    

    对模型的残差进行自相关性分析,检验残差序列是否为白噪声。

  10. 模型预测

    predict_comfirm=results_comfirm.forecast(30)
    

    使用训练好的 ARIMA 模型对未来一段时间内的患病确诊人数和住院人数进行预测。

  11. 可视化预测结果

    plt.plot(list(range(1,418)),predict_sunspots_comfirm,label='predict comfirmed')
    plt.plot(smooth_comfirm.loc['2020-03-18':'2021-06-09'],label='true comfirmed')
    plt.plot(list(range(417,447)),predict_comfirm[0],'g',label='future predict')
    plt.title('Actual and predicted disease graphs')
    plt.legend()
    

    绘制预测结果和真实数据的对比图。

完整代码文件&2000+图文分析报告

标签:plot,plt,Python,模型,ARIMA,cas,python,序列
From: https://blog.csdn.net/weixin_45741872/article/details/137481122

相关文章

  • 使用Python+selenium+pytest+allure 编写ui自动化
    一、1.1背景:每次新发布功能后都需要手动跑冒烟用例,重复点击太多,消耗人力资源1.2测试项目:飞书第三方isv应用1.3技术栈:Python+Selenium+Pytest+Allure1.4框架设计:使用PageObject设计模式,将页面的元素和元素之间的操作方法进行分离。它有三层架构,分别为:基础封装层BasePage,PO页面......
  • 干货!Python 异常处理
    python提供了两个非常重要的功能来处理python程序在运行中出现的异常和错误。python标准异常异常名称描述BaseException所有异常的基类SystemExit解释器请求退出KeyboardInterrupt用户中断执行(通常是输入^C)Exception常规错误的基类Stop......
  • Python兼职要点,搞副业不踩坑!
    程序开发领域有这样一句话:人生苦短,我用Python。这本是开发者大佬BruceEckel的金句:Lifeisshort,youneedPython,有趣的是,很多人并非专职程序员,但却把这句话奉为神谕。所以Python究竟有什么神力,让全世界的人都追捧?我认为Python能大受欢迎,就是因为它可能是最容易学会、......
  • Python 一骑绝尘,Go 进入 TOP 10 | TIOBE 3 月榜单发布
    近日,3月TIOBE编程语言榜单已最新出炉,一起来看看本月有什么值得关注的新变化吧!1、Python可谓“一骑绝尘”与前几个月相比,本月的Python可谓“一骑绝尘”——哪怕与第二名的C语言(11.17%)比较,其市场份额(15.63%)都领先了近4.5%。得益于过去一年AI热潮席卷全球,被许多人......
  • Python生成excel文件的三种方式
    在我们做平常工作中都会遇到操作excel,那么今天写一篇,如何通过python操作excel。当然python操作excel的库有很多,比如pandas,xlwt/xlrd,openpyxl等,每个库都有不同的区别,具体的区别,大家一起来看看吧~xlwt/xlrdxlrd是对于Excel进行读取,xlrd操作的是xls/xlxs格式的excelxlwt......
  • 10个极简Python代码
    1、列表重复元素判定以下方法可以检查给定列表是不是存在重复元素,它会使用set()函数来移除所有重复元素。2、字符元素组成判定检查两个字符串的组成元素是不是一样的。3、内存占用4、字节占用下面的代码块可以检查字符串占用的字节数。5、打印N次字符串该......
  • python random 模块
    random说明生成伪随机数。不应将此模块的伪随机生成器用于安全目的。有关安全性或加密用途,应使用secrets模块。设置随机数种子seed(a=None, version=2)初始化随机数生成器。如果使用相同的种子,将会生成相同的随机数序列。importrandomrandom.seed(23)print(random.r......
  • python 会员信息管理系统2.0
    问题介绍综合案例实现:会员管理系统设计与实现-V3利用所学习的知识点 ,结合会员管理系统的分析与实现, 了解面向对象开发过程中类内部功能的分析方法,系统讲解 Python语法、控制结构、四种典型序列 ,函数定义以及面向对象语法和模块的应用。(使用面向对象的思想)面向对象编......
  • 零基础入门学习Python第一阶
    01初识PythonPython简介Python的历史1.1989年圣诞节:GuidovonRossum开始写Python语言的编译器。2.1991年2月:第一个Python编译器(同时也是解释器)诞生,它是用C语言实现的(后面),可以调用C语言的库函数。在最早的版本中,Python已经提供了对“类”,“函数”,“异常处理”等构造块的......
  • 【Python使用turtle库随便画一些乱七八糟的东西】
    1、画一些五颜六色乱七八糟的Python代码如下:importrandomimportturtle#导入turtle和random库t=turtle.Turtle()#创建海龟笔t#创建一个常用颜色列表用来随机抽取颜色colors=["red","orange","lime","yellow","blue","indigo","p......