首页 > 其他分享 >数据分析库Pandas

数据分析库Pandas

时间:2024-10-09 21:47:43浏览次数:3  
标签:数据分析 sheet resample excel print csv data Pandas

一、认识Pandas数据分析库

        Pandas是一个功能强大的数据分析库,它提供了丰富的数据结构和函数来处理和分析表格数据。在处理类似您提供的Excel文件时,首先需要导入Pandas库并读取数据,然后进行数据清洗和预处理,最后进行数据分析和可视化。

二、DataFrame基本操作

        是一个二维结构,除了拥有index和value之外,还拥有column

        dataframe由多个series组成,无论是行还是列,单独拆分出来都是一个series

三、时间序列和Resample函数

        resample函数只能操作日期时间序列值

        1、均值

print(data.resample(rule='YE').mean())

        2、计数

print(data.resample(rule='YE').count())

        3、求和

print(data.resample(rule='YE').sum())

        4、求标准差

print(data.resample(rule='YE').std())

        5、求最大值

print(data.resample(rule='YE').std().max())

        6、累乘

print(data.resample(rule='YE').prod())

四、plot快速可视化  

        plot函数是pandas中用于数据可视化的一个重要工具,
        通过plot函数,可以轻松地将DataFrame或Series对象中的数据以图形的形式展示出来。

        plot函数支持多种类型的图形,包括折线图、柱状图、散点图、饼图等,这些不同类型的图形适用于不同的数据分析场景。
        此外,plot函数还支持通过参数设置来调整图形的样式,如颜色、标签、图例等,以满足更加个性化的可视化需求。

        plot函数的参数名称和含义了matplotlib绘图时的参数是类似的,
        如果熟悉matplotlib绘图的话,上手更快。

五、io读取与存储:csv、excel

        1、csv

# 写入数据
data.to_csv('txt.csv')
# 读取数据
data1 = pd.read_csv('txt.csv')
默认情况是对原数据进行覆盖,通过参数设置进行追加
data2 = data.tail()
data2.to_csv('txt.csv',mode='a',header=False)
print(data2)

        2、Excel

data.to_excel('excel.xlsx',sheet_name='a')
# 一次写入多个sheet页
with pd.ExcelWriter('writerExcel.xlsx') as writer:
    data.to_excel(writer, sheet_name='a')
    data.to_excel(writer, sheet_name='b')
    data.to_excel(writer, sheet_name='c')
# 追加新的sheet
with pd.ExcelWriter('writerExcel.xlsx',mode='a',engine='openpyxl') as writer:
    data.to_excel(writer, sheet_name='d')

标签:数据分析,sheet,resample,excel,print,csv,data,Pandas
From: https://blog.csdn.net/m0_75068951/article/details/142797051

相关文章

  • Python酷库之旅-第三方库Pandas(139)
    目录一、用法精讲626、pandas.plotting.scatter_matrix方法626-1、语法626-2、参数626-3、功能626-4、返回值626-5、说明626-6、用法626-6-1、数据准备626-6-2、代码示例626-6-3、结果输出627、pandas.plotting.table方法627-1、语法627-2、参数627-3、功能627......
  • Python酷库之旅-第三方库Pandas(136)
    目录一、用法精讲611、pandas.DataFrame.to_orc方法611-1、语法611-2、参数611-3、功能611-4、返回值611-5、说明611-6、用法611-6-1、数据准备611-6-2、代码示例611-6-3、结果输出612、pandas.DataFrame.to_dict方法612-1、语法612-2、参数612-3、功能612-4、......
  • Pandas时间序列 处理方法
    当然可以,以下是Pandas处理时间序列的常用方法总结,代码和文字说明均使用Markdown格式。1.日期解析将字符串日期转换为Pandas的datetime对象。importpandasaspd#假设有一个包含日期字符串的DataFramedf=pd.DataFrame({'date':['2021-01-01','2021-01-02','2021-01-03......
  • pandas常用数据格式IO性能对比
    前言本文对pandas支持的一些数据格式进行IO(读写)的性能测试,大数据时代以数据为基础,经常会遇到操作大量数据的情景,数据的IO性能尤为重要,本文对常见的数据格式csv、feather、hdf5、jay、parquet、pickle性能进行对比。csvCSV(Comma-SeparatedValues)是一种用于存储表格数据的......
  • Pandas库详细学习要点
    Pandas库是一个基于Python的数据分析库,它提供了丰富的数据结构和数据分析工具,非常适合数据科学和数据分析领域的工作。以下是Pandas库详细学习的一些要点:1.数据结构-Series:一维带标签数组,类似于NumPy中的一维数组,但它可以包含任何数据类型。每个元素都有一个标签(索引)。-D......
  • 基于大数据爬虫+数据可视化与大数据分析的网络电视剧收视率分析系统设计与实现(附源码+
    博主介绍:CSDN毕设辅导第一人、全网粉丝50W+,csdn特邀作者、博客专家、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围:SpringBoot、Vue、SSM、HLMT、J......
  • python数据分析
    Python是一种非常流行的编程语言,尤其在数据分析领域。Python拥有丰富的库和框架,可以帮助你执行各种数据分析任务。Python常用的数据分析工具之一:NumPy。Numpy用于进行大规模数值和矩阵运算,提供了多维数组对象和一系列操作这些数组的函数。numpy-base:numpy-base是NumPy包的......
  • [含文档+PPT+源码等]精品大数据项目-基于Django实现的汽车数据分析与可视化系统
    大数据项目——基于Django实现的汽车数据分析与可视化系统背景,可以从以下几个方面进行详细阐述:一、项目背景与意义在数字化和信息化的时代背景下,汽车行业正面临着前所未有的机遇与挑战。随着市场竞争的加剧、消费者需求的多样化以及技术的不断进步,汽车企业需要对市场进行深入......
  • Pandas 方法总结
    目录Pandas方法总结1.读取写入2.数据查看3.选择过滤4.数据清洗5.数据转换6.数据聚合7.数据合并8.时间序列9.数据处理10数据重塑11.数据导出12.绘图13.其他方法Pandas方法总结Pandas是一个强大的Python数据分析库,它提供了快速、灵活和表达力强的数据结构,旨在使......
  • 【干货】数据分析的三个核心维度:描述性、诊断性与预测性分析
    数据分析的本质在于从庞大而复杂的数据中挖掘深层次的规律和机理,进而对未来的可能性进行精准预测。阅读本文,让我们一起深入探索数据分析的三个关键层面:描述性分析、诊断性分析和预测性分析。这三个层面的数据分析引领我们探寻问题背后的原因,最终揭示未来的发展趋势。1.描......