首页 > 其他分享 >pandas的读书报告

pandas的读书报告

时间:2023-12-18 20:58:46浏览次数:28  
标签:报告 df DataFrame 数据表 读书 pd pandas 一列

Pandas简介:
表格容器 pandas 是基于NumPy 的一种工具,改工具是为了解决数据分析任务而创建的。
Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。
pandas提供了大量快速便捷地处理数据的函数和方法。使Python成为强大而高效的数据分析环境的重要因素之一。

一、生成数据表 
1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:
import numpy as np
import pandas as pd

 2、导入CSV或者xlsx文件:

df = pd.DataFrame(pd.read_csv('name.csv',header=1))
df = pd.DataFrame(pd.read_excel('name.xlsx'))

   3、用pandas创建数据表:

复制代码
df = pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006], 
 "date":pd.date_range('20130102', periods=6),
  "city":['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '],
 "age":[23,44,54,32,34,32],
 "category":['100-A','100-B','110-A','110-C','210-A','130-F'],
  "price":[1200,np.nan,2133,5433,np.nan,4432]},
  columns =['id','date','city','category','age','price'])
复制代码

二、数据表信息查看

1、维度查看:

df.shape

2、数据表基本信息(维度、列名称、数据格式、所占空间等):

df.info()

3、每一列数据的格式:

df.dtypes

4、某一列格式:

 

df['B'].dtype

 

5、空值:

df.isnull()

6、查看某一列空值:

 

df.isnull()

7、查看某一列的唯一值:

df['B'].unique()

 

标签:报告,df,DataFrame,数据表,读书,pd,pandas,一列
From: https://www.cnblogs.com/haishiyigeren/p/17912213.html

相关文章

  • matplotlib读书报告
    1.Matplotlib简介  Matplotlib是Python的一个2D图形库,能够生成各种格式的图形(诸如折线图,散点图,直方图等等),界面可交互(可以利用鼠标对生成图形进行点击操作),同时该2D图形库跨平台,即既可以在Python脚本中编码操作,也可以在JupyterNotebook中使用,以及其他平台都可以很方便的使用Ma......
  • scipy的读书报告
    SciPy提供了复制的算法及其在NumPy中作为函数的用法。这将分配高级命令和多种多样的类来操作和可视化数据。SciPy将多个小型包整合在一起,每个包都针对单独的科学计算领域。其中的几个子包是linalg(线性代数)、constants(物理和数学常数)和sparse(稀疏矩阵和相关例程) 值得注意......
  • numpy、scipy、pandas、matplotlib的读书报告
    numpy、scipy、pandas、matplotlib的读书报告:一、基本函数的用法numpynumpy是Python中用于进行科学计算的基础模块,它提供了高效的多维数组对象ndarray,以及相关的数学运算和线性代数函数。numpy的主要功能有:创建和操作多维数组,如使用np.array(),np.arange(),np.zeros(),np.ones()......
  • numpy读书报告
    numpy库常见函数的介绍<1>. numpy创建数组1.从已有数据中创建数组a. 将列表转换成ndarray:importnumpyasnpls1=[10,42,0,-17,30]nd1=np.array(ls1)print(nd1)print(type(nd1))运行结果:[10420-1730]<class'numpy.ndarray'>b.......
  • pandas基础
    pandas基础df:任意的PandasDataFrame对象s:任意的PandasSeries对象读写文件读取文件#读入文件filename=""url=""json_string=""pd.read_csv(filename); #从CSV文件导入数据pd.read_table(filename); #从限定分隔符的文本文件导入数据pd.read_ex......
  • Numpy 等函数的读书报告
    importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltplt.rcParams['axes.unicode_minus']=Falseplt.rcParams['font.sans-serif']='SimHei'matplotlib使用里面的函数读取图片,输出图片对应的数组#matplotlib使用里面的函数读取图片,输出图片对应......
  • pytorch——豆瓣读书评价分析
    任务目标基于给定数据集,采用三层bp神经网络方法,编写程序并构建分类模型,通过给定特征实现预测的书籍评分的模型。选取数据在各项指标中,我认为书籍的评分和出版社、评论数量还有作者相关,和其他属性的关系并大。所以,对于出版社,我选取了出版社的平均评分和出版社在这个表格中出现......
  • python123——numpy、scipy、pandas、matplotlib的读书报告
     一、函数的基本用法numpyNumPy(NumericalPython)是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nestedliststructure)结构要高效的多(该结构也可以用来表示矩阵(matrix)),支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的......
  • 零数科技双平台入选2023爱分析·数据要素流通厂商全景报告
    全面近日,国内领先的数字化市场研究咨询机构爱分析正式发布《2023爱分析·数据要素流通厂商全景报告》,零数科技凭借成熟的区块链和隐私计算技术,及系列标杆产品及应用,成功入选数据要素流通代表厂商。图:零数科技入围爱分析数据要素厂商全景地图随着数字经济的崛起,数据成为推动社会生产......
  • 重磅首发|2024音视频技术发展报告
    //11月24日,在LiveVideoStackCon2023深圳站大会上,我们与腾讯云音视频联合首发《2024音视频技术发展报告》。报告通过300+音视频开发者调研,40+专家一线访谈,下沉8大细分技术领域进行全面解读,涵盖音视频编解码/AI编码/多媒体处理框架/媒体传输协议/超低延迟技术/虚拟现实/AIGC/出海等......