首页 > 其他分享 >数据分析库Pandas

数据分析库Pandas

时间:2024-10-09 21:47:43浏览次数:16  
标签:数据分析 sheet resample excel print csv data Pandas

一、认识Pandas数据分析库

        Pandas是一个功能强大的数据分析库,它提供了丰富的数据结构和函数来处理和分析表格数据。在处理类似您提供的Excel文件时,首先需要导入Pandas库并读取数据,然后进行数据清洗和预处理,最后进行数据分析和可视化。

二、DataFrame基本操作

        是一个二维结构,除了拥有index和value之外,还拥有column

        dataframe由多个series组成,无论是行还是列,单独拆分出来都是一个series

三、时间序列和Resample函数

        resample函数只能操作日期时间序列值

        1、均值

print(data.resample(rule='YE').mean())

        2、计数

print(data.resample(rule='YE').count())

        3、求和

print(data.resample(rule='YE').sum())

        4、求标准差

print(data.resample(rule='YE').std())

        5、求最大值

print(data.resample(rule='YE').std().max())

        6、累乘

print(data.resample(rule='YE').prod())

四、plot快速可视化  

        plot函数是pandas中用于数据可视化的一个重要工具,
        通过plot函数,可以轻松地将DataFrame或Series对象中的数据以图形的形式展示出来。

        plot函数支持多种类型的图形,包括折线图、柱状图、散点图、饼图等,这些不同类型的图形适用于不同的数据分析场景。
        此外,plot函数还支持通过参数设置来调整图形的样式,如颜色、标签、图例等,以满足更加个性化的可视化需求。

        plot函数的参数名称和含义了matplotlib绘图时的参数是类似的,
        如果熟悉matplotlib绘图的话,上手更快。

五、io读取与存储:csv、excel

        1、csv

# 写入数据
data.to_csv('txt.csv')
# 读取数据
data1 = pd.read_csv('txt.csv')
默认情况是对原数据进行覆盖,通过参数设置进行追加
data2 = data.tail()
data2.to_csv('txt.csv',mode='a',header=False)
print(data2)

        2、Excel

data.to_excel('excel.xlsx',sheet_name='a')
# 一次写入多个sheet页
with pd.ExcelWriter('writerExcel.xlsx') as writer:
    data.to_excel(writer, sheet_name='a')
    data.to_excel(writer, sheet_name='b')
    data.to_excel(writer, sheet_name='c')
# 追加新的sheet
with pd.ExcelWriter('writerExcel.xlsx',mode='a',engine='openpyxl') as writer:
    data.to_excel(writer, sheet_name='d')

标签:数据分析,sheet,resample,excel,print,csv,data,Pandas
From: https://blog.csdn.net/m0_75068951/article/details/142797051

相关文章

  • Python酷库之旅-第三方库Pandas(139)
    目录一、用法精讲626、pandas.plotting.scatter_matrix方法626-1、语法626-2、参数626-3、功能626-4、返回值626-5、说明626-6、用法626-6-1、数据准备626-6-2、代码示例626-6-3、结果输出627、pandas.plotting.table方法627-1、语法627-2、参数627-3、功能627......
  • Python酷库之旅-第三方库Pandas(136)
    目录一、用法精讲611、pandas.DataFrame.to_orc方法611-1、语法611-2、参数611-3、功能611-4、返回值611-5、说明611-6、用法611-6-1、数据准备611-6-2、代码示例611-6-3、结果输出612、pandas.DataFrame.to_dict方法612-1、语法612-2、参数612-3、功能612-4、......
  • Pandas时间序列 处理方法
    当然可以,以下是Pandas处理时间序列的常用方法总结,代码和文字说明均使用Markdown格式。1.日期解析将字符串日期转换为Pandas的datetime对象。importpandasaspd#假设有一个包含日期字符串的DataFramedf=pd.DataFrame({'date':['2021-01-01','2021-01-02','2021-01-03......
  • pandas常用数据格式IO性能对比
    前言本文对pandas支持的一些数据格式进行IO(读写)的性能测试,大数据时代以数据为基础,经常会遇到操作大量数据的情景,数据的IO性能尤为重要,本文对常见的数据格式csv、feather、hdf5、jay、parquet、pickle性能进行对比。csvCSV(Comma-SeparatedValues)是一种用于存储表格数据的......
  • Pandas库详细学习要点
    Pandas库是一个基于Python的数据分析库,它提供了丰富的数据结构和数据分析工具,非常适合数据科学和数据分析领域的工作。以下是Pandas库详细学习的一些要点:1.数据结构-Series:一维带标签数组,类似于NumPy中的一维数组,但它可以包含任何数据类型。每个元素都有一个标签(索引)。-D......
  • 基于大数据爬虫+数据可视化与大数据分析的网络电视剧收视率分析系统设计与实现(附源码+
    博主介绍:CSDN毕设辅导第一人、全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围:SpringBoot、Vue、SSM、HLMT、J......
  • python数据分析
    Python是一种非常流行的编程语言,尤其在数据分析领域。Python拥有丰富的库和框架,可以帮助你执行各种数据分析任务。Python常用的数据分析工具之一:NumPy。Numpy用于进行大规模数值和矩阵运算,提供了多维数组对象和一系列操作这些数组的函数。numpy-base:numpy-base是NumPy包的......
  • Pandas 方法总结
    目录Pandas方法总结1.读取写入2.数据查看3.选择过滤4.数据清洗5.数据转换6.数据聚合7.数据合并8.时间序列9.数据处理10数据重塑11.数据导出12.绘图13.其他方法Pandas方法总结Pandas是一个强大的Python数据分析库,它提供了快速、灵活和表达力强的数据结构,旨在使......