• 2025-01-21Pandas数据分析 【Series | DataFrame】
    pandas数据分析写在前面001List转化为Series002Dict转化为Series003Series转化为pythonlist004Series转化为DataFrame005借助numpy创建Series006转化Series的数据类型007给Series添加新的元素008将Series对象转换为DataFrame对象009使用字典创建DF010给DataFr
  • 2025-01-18Pandas使用笔记
    个人学习笔记日期转换索引日期格式:2023-09-1215:00:00转换为:2023-09-12importpandasaspd#假设你的DataFrame名为df,索引是2023-09-1215:00:00#这里创建一个示例DataFrame用于演示data={'value':[1,2,3]}index=pd.to_datetime(['2023-09-1215:00:
  • 2025-01-17pandas读取和写入excel表格
    读取excel表格pandas.read_excel()函数read_excel()函数用于读取Excel文件并将其转换为Pandas的DataFrame对象。这是处理Excel数据的基础。函数原型如下:pandas.read_excel(io, sheet_name=0, *, header=0, names=None, index_col=None, usecols=None, dtype=None, e
  • 2025-01-16Pandas数据重命名:列名与索引为标题
    目录一、引言二、Pandasrename方法简介三、列名重命名3.1使用字典进行列名重命名3.2使用函数进行列名重命名四、索引重命名4.1使用字典进行索引重命名4.2使用函数进行索引重命名五、同时重命名列名和索引六、原地修改与返回新对象七、处理MultiIndex(多级索引)
  • 2025-01-15Pandas数据合并:concat与merge
    目录一、concat方法1.基本语法2.示例示例1:按行合并(垂直方向)示例2:按列合并(水平方向)示例3:使用join='inner'进行内连接示例4:处理列名冲突二、merge方法1.基本语法2.示例示例1:内连接(InnerJoin)示例2:外连接(OuterJoin)示例3:左连接(LeftJoin)示例4:右连接(RightJoin)
  • 2025-01-153.4 Pandas 数据合并和连接:掌握数据整合的核心技巧
    3.4Pandas数据合并和连接:掌握数据整合的核心技巧在实际的数据分析工作中,数据往往分散在多个数据源中。为了进行全面的分析,我们需要将这些数据合并或连接在一起。Pandas提供了强大的工具来实现数据的合并和连接操作。本文将详细介绍如何使用Pandas进行数据合并和连接,帮
  • 2025-01-12认识Pandas,以及pandas的数据结构Series和DataFrame
    以下是关于pandas数据结构部分的详细讲解和案例:SeriesSeries是pandas中的一种一维数组结构,可以存储任意类型的数据(整数、字符串、浮点数、Python对象等),并且每个数据点都有一个对应的索引标签。创建Series案例:创建一个包含水果数量的Series对象。代码:importpandasa
  • 2025-01-09pandas与sql对应关系【帮助sql使用者快速上手pandas】
    本页旨在提供一些如何使用pandas执行各种SQL操作的示例,来帮助SQL使用者快速上手使用pandas。目录SQL语法一、选择SELECT1、选择2、添加计算列二、连接JOINON1、内连接2、左外连接3、右外连接4、全外连接三、过滤WHERE1、AND2、OR3、ISNULL4、ISNOTNULL5、BETWEEN6
  • 2025-01-06index具有特殊含义的pandas dataframe 如何保存、读取
    在Pandas中,DataFrame的索引(index)可以具有特殊含义,比如时间戳、分类标签或其他对数据有组织和查询意义的标识。为了确保这些特殊的索引在保存和读取过程中不丢失其信息或格式,你可以使用特定的方法来处理。保存DataFrame当你保存一个带有特殊索引的DataFrame时,通常会使用.t
  • 2025-01-06pandas系列----Series简介
    一、Series的构造        Series是pandas库中的一个重要数据结构。它是一种类似于一维数组的数据结构,能够存储各种数据类型(如整数、浮点数、字符串等)。Series对象由两个部分组成:索引(index)和数据(values)。索引用于标识和访问数据中的每个元素,类似于数组的下标,但功能更
  • 2025-01-06用Python进行大数据处理:如何使用pandas和dask处理海量数据
    《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门!解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界随着数据量的爆炸式增长,大数据处理成为现代数据科学和工程领域的核心挑战。Python作为数据分析的重要工具,其生态系统中的pandas和dask库为处理
  • 2025-01-06数据分析numpy/pandas---简介
    1、什么是数据分析?数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。2、使用python做数据分析的常用库1.numpy      基础数值算法2.scipy       科学计算3.matplotlib
  • 2025-01-02Pandas时间序列处理:日期与时间
    一、基础概念1.时间戳(Timestamp)时间戳表示一个具体的时刻,例如2023年1月1日12点整。Pandas中的Timestamp对象可以精确到纳秒级别。2.时间间隔(Timedelta)时间间隔表示两个时间戳之间的差值,例如1小时、5分钟等。Timedelta对象用于表示这种差值。3.周期(Period)周期表示一段时间
  • 2025-01-02【Pandas】pandas Series loc
    Pandas2.2SeriesIndexing,iteration方法描述Series.get()用于根据键(索引标签)从Series中获取值Series.at用于快速访问标量值(单个元素)的访问器Series.iat用于快速访问标量值(单个元素)的访问器Series.loc用于基于标签的索引访问器Series.iloc用于基于整数位置的索引访问器
  • 2025-01-02【Pandas】pandas Series iloc
    Pandas2.2SeriesIndexing,iteration方法描述Series.get()用于根据键(索引标签)从Series中获取值Series.at用于快速访问标量值(单个元素)的访问器Series.iat用于快速访问标量值(单个元素)的访问器Series.loc用于基于标签的索引访问器Series.iloc用于基于整数位置的索引访问器
  • 2025-01-01【Pandas】pandas Series at
    Pandas2.2SeriesIndexing,iteration方法描述Series.get()用于根据键(索引标签)从Series中获取值Series.at用于快速访问标量值(单个元素)的访问器Series.iat用于快速访问标量值(单个元素)的访问器pandas.Series.atpandas.Series.at是pandas库中用于快速访问标量值(单个元
  • 2025-01-01【Pandas】pandas Series iat
    Pandas2.2SeriesIndexing,iteration方法描述Series.get()用于根据键(索引标签)从Series中获取值Series.at用于快速访问标量值(单个元素)的访问器Series.iat用于快速访问标量值(单个元素)的访问器pandas.Series.iatpandas.Series.iat是pandas库中用于快速访问标量值(单个
  • 2024-12-31【数据清洗秘籍】如何避免Pandas中的科学计数法陷阱
    在数据分析的世界里,数据清洗是一项不可或缺的工作。我们经常需要将数据从一种格式转换为另一种格式,以适应分析的需求。然而,在处理数值数据时,一个常见的问题就是数值被自动转换为科学计数法,尤其是当数值非常大时。这不仅影响了数据的可读性,还可能对后续的分析造成影响:譬如无法关联
  • 2024-12-31Pandas-Excel
    #默认读取第一个表单df=pd.read_excel('b.xlsx')print(df)#读取指定表单的内容df=pd.read_excel('b.xlsx',sheet_name='Sheet1')print(df)#读取多个表单,返回一个字典dfs=pd.read_excel('b.xlsx',sheet_name=['Sheet1','Sheet2'])pri
  • 2024-12-30Pandas-DataFrame
    一、Pandas-DataFrame特点 二、特征练习#从列表嵌套字典创建DataFramedata=[{'a':1,'b':2},{'a':5,'b':10,'c':20}]df=pd.DataFrame(data)print(df)print('-----------')#从字典创建DataFramedata={'Na
  • 2024-12-30pandas-Series
     一、Series特点 二、特点练习importpandasaspdimportnumpyasnp#pandas---Series#默认索引从0开始且数组类型数据data=np.array(['张三','李四','王五','赵六'])s=pd.Series(data)print(s)#自定义索引s=pd.Series(data,index=['100','
  • 2024-12-29Python里的pandas库append 方法的替代实现方法
    使用 concat 函数concat 函数可以将多个 DataFrame 连接在一起,通过这种方式可以实现类似 append 的功能。importpandasaspd#创建示例DataFramedf=pd.DataFrame({'col1':[1,2],'col2':[3,4]})#创建要添加的新行,以DataFrame形式new_row=pd.DataF
  • 2024-12-285-pandas常用操作2
    前言一、df.max()计算每列最大值二、df.apply()1.可以传函数代码如下(示例):#lambda匿名函数自定义f=lambdax:x.max()-x.min()#x参数冒号后是返回值df.apply(f)#默认axis=0,所以这里是按列求最大值-最小值2.可以直接写内置函数代码如下(示例):df
  • 2024-12-27Python包管理不再头疼:uv工具快速上手
    Python包管理生态中存在多种工具,如pip、pip-tools、poetry、conda等,各自具备一定功能。而今天介绍的uv是Astral公司推出的一款基于Rust编写的Python包管理工具,旨在成为“Python的Cargo”。它提供了快速、可靠且易用的包管理体验,在性能、兼容性和功能上都有出色表现
  • 2024-12-27【Pandas】pandas Series convert_dtypes
    Pandas2.2SeriesConversion方法描述Series.astype用于将Series对象的数据类型转换为指定类型的方法Series.convert_dtypes用于将Series对象的数据类型智能地转换为最佳可能的数据类型的方法pandas.Series.convert_dtypespandas.Series.convert_dtypes方法是Pandas