首页 > 其他分享 >Pandas 处理CSV 文件

Pandas 处理CSV 文件

时间:2023-08-08 22:08:47浏览次数:40  
标签:文件 non csv ... df null pd CSV Pandas

Pandas CSV 文件

CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。

CSV 是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。

1、读取csv文件

若需要该csv文件,自行下载: nba.csv文件

import pandas as pd
df=pd.read_csv('D:\\浏览器下载内容\\nba.csv')#csv文件路径
print(df)
Name            Team  ...            College     Salary
0    Avery Bradley  Boston Celtics  ...              Texas  7730337.0
1      Jae Crowder  Boston Celtics  ...          Marquette  6796117.0
2     John Holland  Boston Celtics  ...  Boston University        NaN
3      R.J. Hunter  Boston Celtics  ...      Georgia State  1148640.0
4    Jonas Jerebko  Boston Celtics  ...                NaN  5000000.0
..             ...             ...  ...                ...        ...
453   Shelvin Mack       Utah Jazz  ...             Butler  2433333.0
454      Raul Neto       Utah Jazz  ...                NaN   900000.0
455   Tibor Pleiss       Utah Jazz  ...                NaN  2900000.0
456    Jeff Withey       Utah Jazz  ...             Kansas   947276.0
457            NaN             NaN  ...                NaN        NaN
#自动统计行列数
[458 rows x 9 columns]

如果想要显示全数据,就要写成: 会返回 DataFrame 类型的数据

print(df.to_string())

2、写入csv文件

使用 to_csv() 方法将 DataFrame 存储为 csv 文件:

import pandas as pd
   
# 三个字段 name, site, age
nme = ["Google", "Runoob", "Taobao", "Wiki"]
st = ["www.google.com", "www.runoob.com", "www.taobao.com", "www.wikipedia.org"]
ag = [90, 40, 80, 98]
   
# 字典
dict = {'name': nme, 'site': st, 'age': ag}
     
df = pd.DataFrame(dict)#创建DataFrame类型
 
# 保存 dataframe
df.to_csv('site.csv')

3、数据处理

(1)head()

head( n ) 方法用于读取前面的 n 行,如果不填参数 n ,默认返回 5 行。

import pandas as pd

df = pd.read_csv('nba.csv')

print(df.head())#默认读取前5行
print(df.head(10))#读取前10行
(2)tail()

tail( n ) 方法用于读取尾部的 n 行,如果不填参数 n ,默认返回 5 行,空行各个字段的值返回 NaN。

import pandas as pd

df = pd.read_csv('nba.csv')

print(df.tail())#默认读取末尾倒数5行
print(df.tail(10))#读取末尾10行
(3)info()

info() 方法返回表格的一些基本信息:

import pandas as pd

df = pd.read_csv('nba.csv')

print(df.info())
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 458 entries, 0 to 457          # 行数,458 行,第一行编号为 0
Data columns (total 9 columns):            # 列数,9列
 #   Column    Non-Null Count  Dtype       # 各列的数据类型
---  ------    --------------  -----  
 0   Name      457 non-null    object 
 1   Team      457 non-null    object 
 2   Number    457 non-null    float64
 3   Position  457 non-null    object 
 4   Age       457 non-null    float64
 5   Height    457 non-null    object 
 6   Weight    457 non-null    float64
 7   College   373 non-null    object         # non-null,意思为非空的数据    
 8   Salary    446 non-null    float64
dtypes: float64(4), object(5)                 # 类型

标签:文件,non,csv,...,df,null,pd,CSV,Pandas
From: https://blog.51cto.com/u_16200991/7012132

相关文章

  • Pandas学习挑战第三关-数据结构DataFrame
    Pandas数据结构-DataFrameDataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共同用一个索引)。DataFrame构造方法如下:pandas.DataFrame(data,index,column......
  • 文件包含漏洞
    1.基础介绍文件包含漏洞是指代码文件需要包含其他的代码文件而导致的漏洞。业务要求代码实现动态包含,并未对文件名和文件进行校验。文件包含一种是内容包含文件,把内容提取出来,其他文件用代码引用,修改文件只需要修改单独内容。另外一种是函数包含,某一页面用到常用函数功能,但是不需要......
  • - 前后端数据传输的编码格式(contentType) - Ajax朝后端提交文件数据 - Ajax朝后端提
    前后端数据传输的编码格式(contentType)前后端数据传输的请求方式有两种:get、post我们只研究post请求的编码格式三种编码格式urlencodedform-datajson发送post请求的方式form表单Ajaxpostman(第三方工具,需要下载) form表单发送post请求的时候数据的编码格式请求头conten......
  • linux 文件权限和访问控制
    文件权限和访问控制是Linux系统中保护文件和目录安全性的重要部分。以下是一些关于文件权限和访问控制的方法和示例说明:1.**文件权限**:-在Linux中,每个文件和目录都有权限,这些权限决定了谁可以执行哪些操作(读取、写入、执行)。2.**文件权限表示**:-权限通常用三个字母表示,分......
  • linux如何查找nginx使用的配置文件
    1、查找nginx进程ps-aef|grepnginx2、通过进程pid查找程序路径pwdx<pid>3、在上面得到的路径下执行xxx/nginx-t示例如下:......
  • Python中文件操作的详细使用:open()、os.open()和with open()
    前言在编程语言中,文件读写是最常见的IO操作,Python内置了读写文件的函数,其中包括open()函数、os.open()函数以及withopen()语句。本文将详细介绍这三种方法的使用方式、区别和最佳实践。open()open()函数是Python内置的用于打开文件的函数,它接受一个文件路径和打开模式作为参数,并返......
  • java springcloud 大文件分片上传处理
    ​ 在Web应用系统开发中,文件上传和下载功能是非常常用的功能,今天来讲一下JavaWeb中的文件上传和下载功能的实现。先说下要求:PC端全平台支持,要求支持Windows,Mac,Linux支持所有浏览器。支持文件批量上传支持文件夹上传,且要求在服务端保留层级结构。文件夹数量要求支持到10W......
  • 批处理.重命名文件
    批处理,替换指定字符:@echooff::set/pw=请输入文件格式(即扩展名并以回车结束):setw="xlsx"set/pwf=请输入要修改的文字(以回车结束):set/pcb=请输入要改成的文字(若是删除则直接回车,以回车结束):for/f"delims="%%iin('dir/b/a-d"*.%w%"')do(setstr1=......
  • 在windows上使用_netrc文件让Git记住用户名和密码(Linux文件名为.netrc)
    windowsnetrc文件是什么。根据我搜索到的结果,windowsnetrc文件是一种用于保存网络身份验证信息的文件,例如用户名和密码。它可以被一些命令行工具和应用程序使用,比如Git、curl、ftp等。windowsnetrc文件的格式如下:machine<hostname>login<username>password<password>......
  • JavaScript实现文件夹的上传和下载
    ​ASP.NET上传文件用FileUpLoad就可以,但是对文件夹的操作却不能用FileUpLoad来实现。下面这个示例便是使用ASP.NET来实现上传文件夹并对文件夹进行压缩以及解压。ASP.NET页面设计:TextBox和Button按钮。 ​编辑TextBox中需要自己受到输入文件夹的路径(包含文件夹),通过Button......