首页 > 其他分享 >大数据分析与可视化 之 实验10 Pandas实现数据分析

大数据分析与可视化 之 实验10 Pandas实现数据分析

时间:2023-12-30 20:24:45浏览次数:37  
标签:数据分析 10 天数 days 2018 date data Pandas

实验10 Pandas实现数据分析

实验学时:2学时
实验类型:验证
实验要求:必修

一、实验目的

  1. 掌握Pandas的字符串函数。
  2. 掌握Pandas 统计汇总函数。
  3. 掌握Pandas排序、分组、合并与级联函数。
  4. 能利用上述函数进行综合数据分析。

二、实验要求

通过编程实现使用Pandas字符串函数进行文本处理,使用统计、汇总、排序、分组函数进行综合数据分析。

三、实验内容

任务1. 根据实验7任务3中对2018年厦门天气数据文件Xiamen_2018.csv进行数据清洗后得到的数据,作如下数据分析:
(1)分析2018年厦门市白天和晚上都是晴天的天数、白天和晚上都是雨天的天数。
(2)分析2018年厦门市全年最高温和最低温均不超过10的天数。
(3)分析2018年厦门市全年最高温超过30的天数。
(4)分析2018年厦门市全年空气质量为优的天数。
用Python编写程序实现。

任务2. 利用tushare模块导出2022年股票代码为“000001”的股票数据,按周汇总计算每周开盘价(monday_open)均值、收盘价(friday_close)均值、最高价(week_high)的日期、最低价(week_low)日期。用Python编写程序实现。

test10.py

import tushare as ts
import pandas as pd


def task1():
    data = pd.read_csv('cleaned_xiamen_2018.csv', parse_dates=['日期'],
                       date_parser=lambda x: pd.to_datetime(x, format='%Y年%m月%d日'))

    # (1) 分析白天和晚上都是晴天的天数、白天和晚上都是雨天的天数
    sunny_days = data[(data['日间天气'] == '晴') & (data['夜间天气'] == '晴')]
    rainy_days = data[(data['日间天气'].str.contains('雨')) & (data['夜间天气'].str.contains('雨'))]
    print('(1) 白天和晚上都是晴天的天数:', len(sunny_days))
    print('(1) 白天和晚上都是雨天的天数:', len(rainy_days))

    # (2) 分析全年最高温和最低温均不超过10的天数
    low_temperature_days = data[(data['当日最高温度'] <= 10) & (data['当日最低温度'] <= 10)]
    print('(2) 最高温和最低温均不超过10的天数:', len(low_temperature_days))

    # (3) 分析全年最高温超过30的天数
    high_temperature_days = data[data['当日最高温度'] > 30]
    print('(3) 最高温超过30的天数:', len(high_temperature_days))

    # (4) 分析全年空气质量为优的天数
    good_air_days = data[data['质量等级'] == '优']
    print('(4) 空气质量为优的天数:', len(good_air_days))


def task2():
    # tushare账户token
    ts.set_token('添加自己的token')
    # 初始化tushare pro接口
    pro = ts.pro_api()
    # 获取000001股票代码的2022年日线数据
    stock_data = pro.daily(ts_code='000001.SZ', start_date='20220101', end_date='20221231')
    # 转换日期列为日期类型
    stock_data['trade_date'] = pd.to_datetime(stock_data['trade_date'])
    # 将日期列设置为索引
    stock_data.set_index('trade_date', inplace=True)
    # 按周汇总计算
    weekly_summary = stock_data.resample('W-Mon').agg({
        'open': 'mean',  # 周一开盘价均值
        'close': 'mean',  # 周五收盘价均值
        'high': 'max',  # 最高价日期
        'low': 'min'  # 最低价日期
    })
    # 重命名列
    weekly_summary.columns = ['monday_open', 'friday_close', 'week_high_date', 'week_low_date']
    # 打印结果
    print(weekly_summary)


if __name__ == '__main__':
    task1()
    task2()

标签:数据分析,10,天数,days,2018,date,data,Pandas
From: https://www.cnblogs.com/IvanKK/p/17936745

相关文章

  • 大数据分析与可视化 之 实验11 Matplotlib绘制图表(一)
    实验11Matplotlib绘制图表(一)实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握Matplotlib的框架及图形属性。掌握Matplotlib绘制图形的步骤。掌握Matplotlib绘制直线、曲线图、折线图。掌握Matplotlib绘制柱形图、条形图、饼图。二、实验要求通过编程实现使用......
  • 大数据分析与可视化 之 实验12 Matplotlib绘制图表(二)
    实验12Matplotlib绘制图表(二)实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握Matplotlib的框架及图形属性。掌握Matplotlib绘制图形的步骤。掌握Matplotlib绘制柱形图、条形图、饼图、折线图。掌握Matplotlib绘制散点图、等高线图、极坐标图、3D图。二、实验......
  • 大数据分析与可视化 之 实验06 Pandas缺失值处理
    实验06Pandas缺失值处理实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握判断缺失值、过滤缺失值、填充缺失缺失值等缺失值处理解决实际数据中的缺失值问题二、实验要求使用常见的缺失值处理函数(如:isnull()、notnull()、fillna()、dropna()函数)等知识在PyCharm......
  • 大数据分析与可视化 之 实验07 Pandas合并与级联
    实验07Pandas合并与级联实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握pandas合并/拼接掌握pandas级联二、实验要求利用pandas合并、拼接和级联等知识在PyCharm中编写程序,实现Python数据处理的相关操作。三、实验内容任务1.现有如下图的两个DataFrame数据......
  • 大数据分析与可视化 之 实验08 Pandas字符串和文本处理
    实验08Pandas字符串和文本处理实验学时:2学时实验类型:验证实验要求:必修一、实验目的学会正确使用常见的字符串函数如:len()、find()、strip()、replace()、contains()函数。解决实际数据中的字符串和文本处理问题。二、实验要求使用常见的字符串函数(如:len()、find()、s......
  • 大数据分析与可视化 之 实验09 Pandas函数应用
    实验09Pandas函数应用实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握pandas函数应用的方法:pipe()、apply()和applymap()。能编写自定义函数。能使用pandas函数应用调用自定义函数解决数据分析实际问题。二、实验要求利用pandas函数应用的方法解决数据分析实......
  • codeforces刷题(1100):1862C_div3
    C、FlowerCityFence跳转原题点击此:该题地址1、题目大意  给你n块长度依次不递增的紧密连接在一起的垂直木板,将它们水平横过来,问其组成的全新n块木板的长度是否与原来的木板长度一致。  注意:这里的长度是指:木板的高度。水平摆放后的木板是左对齐,所以其长度就是各个木板水......
  • 大数据分析与可视化 之 实验02 Numpy创建数组
    实验02Numpy创建数组实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握Numpy创建数组的方法掌握Numpyndarray的属性、运算掌握Numpy迭代数值,修改数组中元素的值掌握Numpy常用函数的使用方法二、实验要求使用Numpy.array的构造函数创建数组,学会使用Numpyndar......
  • 大数据分析与可视化 之 实验03 Numpy实现数据分析
    实验03Numpy实现数据分析实验学时:2学时实验类型:验证实验要求:必修一、实验目的掌握Numpy的字符串函数掌握Numpy统计函数掌握Numpy排序、分组、线性代数函数二、实验要求通过编程实现使用Numpy字符串函数进行文本处理,使用统计函数进行数据分析等常用操作。三、实验内......
  • 大数据分析与可视化 之 实验04 Pandas基础
    实验04Pandas基础实验学时:2学时实验类型:验证实验要求:必修一、实验目的1.掌握pandas系列、数据帧和面板的使用2.掌握pandas基本功能和操作二、实验要求Pandas程序的运行步骤。2.pandas的数据结构3.pandas系列、数据帧和面板pandas基本功能和操作三、实验内容任务1.......