首页 > 编程语言 >Python之pandas基础

Python之pandas基础

时间:2023-06-15 20:55:46浏览次数:31  
标签:index 20 数据表 Python 基础 df 区县 pd pandas

1.pandas简介:

panel data analysis(多维数据分析)
pandas 中具有两种基本的数据存储结构,存储一维 values 的 Series 和存储二维 values 的 DataFrame;
Series:
Series 一般由四个部分组成,分别是序列的值 data 、索引 index 、存储类型 dtype 、序列的名字 name 。其中,索引也可以指定它的名字,默认为空
dtype = 'object’类型,代表了一种混合类型
DataFrame :
在 Series 的基础上增加了列索引,一个数据框可以由二维的 data 与行列索引来构造:值 data由一维变成了二维,加了一个参数columns,给出了列名

2.读取Excel

import pandas as pd
df = pd.read_excel('demo.xlsx')
# 前20行
df.head(10)
# 后20行
df.tail(10)

3.写入Excel

df = pd.DataFrame({
    'A':range(10,20),
    'B':range(20,30),
    'C':range(30,40),
})

with pd.ExcelWriter('./数据表/output.xlsx') as f:
    df.to_excel(f, index= False)

with open('./数据表/output.csv', 'w', newline = '') as f:
    df.to_csv(f, index= False)

4.数据类型:Series

import pandas as pd
df = pd.read_excel('./数据表/demo.xlsx')
df.columns

type(df['区县'])
df['区县']
df.区县

# 查看序号
df['区县'].index

# 获取值
df['基站IP'].values

# 修改index
df['区县'].index = range(100,151)
df['区县'].index

# 去重
df['区县'].unique()

# 去重
df['区县'].drop_duplicates()

# 查看数据描述
df['区县'].describe()

# 统计数量
df['区县'].value_counts()

# 排序
df['区县'].sort_values()

5.数据类型:DataFrame

# 表格的形状
df.shape
# 表格的列
df.columns
# 表格的行号
df.index

# 获取某一列的值
df['对应中文名称']

# 查看表格全部数据 
df.values 

# 注意数据是一列一列显示的

df.describe()

df.drop_duplicates(['厂家'], keep= 'first')

df.备注

df.fillna(0, inplace = True)
df.备注

# 选择行
df[5:10]

# 选择列
df[['区县', '基站名', '对应中文名称']]

# 选择指定行或者列(按列名)
df.loc[10:20,['基站名', '对应中文名称']]

# 选择指定行或者列(按列名)
df.loc[10:20,'区县':'对应中文名称']

# 选择指定行或者列(按序号)
df.iloc[10:20,0:3]

# 跨行选择
df.iloc[[1,3,5,7],[1,3]]

6.常用操作

# 拆分表格
df_entry = pd.read_excel('./数据表/报名表.xlsx')
df_entry.columns
# 按所属单位拆分表格
for city in df_entry['所属单位(必填)只到州市'].unique():
    df_tmp = df_entry[df_entry['所属单位(必填)只到州市']==city]
    with pd.ExcelWriter('./数据表/州市/' + city + '.xlsx') as f:
        df_tmp.to_excel(f, index =False)
# 合并表格
import os
files = os.listdir('./数据表/州市/')

res = []
for file in files:
    df_tmp = pd.read_excel('./数据表/州市/' + file)
    res.append(df_tmp)

df_res = pd.concat(res, axis = 0)

with pd.ExcelWriter('./数据表/_全省汇总.xlsx') as f:
    df_res.to_excel(f, index= False)

标签:index,20,数据表,Python,基础,df,区县,pd,pandas
From: https://www.cnblogs.com/yds941268778/p/17484082.html

相关文章

  • 【python基础】函数-参数形式
    鉴于函数定义中可能包含多个形参变量,因此函数调用中也可能包含多个实参变量。向函数传递实参变量给形参变量的方式有很多,可使用位置参数,这要求实参变量的顺序与形参变量的顺序相同;也可使用关键字参数,都由变量名和值组成,简称名称-值对;还可使用列表(元组)和字典。1.位置参数调用函数......
  • 在Python中根据字典值寻找键
    问题描述  在处理VOC数据集时,创建的字典如下所示label_map={0:'background',1:'aeroplane',2:'bicycle',3:'bird',4:'boat',5:'bottle',6:'bus',7:'car',8:'cat',9:......
  • python: enforcing type check on function using decorator
     deftypeassert(*ty_args,**ty_kwargs):"""利用装饰器对函数参数强制性类型检查enforcingtypecheckonfunctionusingdecorator:paramty_args::paramty_kwargs::return:"""......
  • Python下载安装
    Python下载的官网:WelcometoPython.org      会出现四个python文件将这个拖到桌面查看Python是否安装好两种方式:1.IDLE编辑器 2.使用运行对话框下载PychamPycham官网:下载PyCharm:JetBrains为专业开发者提供的PythonIDE 安装成功首......
  • Java基础面试笔记(三) _Spring
    1.Spring框架有哪些主要模块?截止到目前Spring框架已集成了20多个模块。这些模块主要被分如下图所示的核心容器、数据访问/集成、Web、AOP(面向切面编程)、工具、消息和测试模块。2.什么是依赖注入?什么是控制反转(IOC)?在Spring中,有几种依赖注入方式?依赖注入是在编译......
  • 通过python封装接口获取淘宝商品页面数据、淘宝商品详情数据
    可以使用GET或POST方法,请求参数中应包含商品详情页面数据、标题、价格、图片、库存、销量等信息。解析返回的response中的HTML页面或JSON格式数据,提取需要的商品信息,如商品标题、价格、评价人数等。使用pandas库将提取的商品信息保存到数据框中,以方便后续处理和分析。......
  • Js基础入门
    [Js基础入门-掘金](https://juejin.cn/post/7244734132322992187)浏览器执行JS简介浏览器分成两大部分渲染引擎和JS引擎渲染引擎:用来解析HTML与CSS,俗称内核,比如chrome浏览器的blink,老版本的webkitJS引擎:也称为JS解释器。用来读取网页中的JavaScript代码,对其处理后......
  • python2安装mysqldb
     yuminstallmariadb-devel 或yuminstallmysql-devel 编辑_mysql.c注释2005行 ......
  • 学习Spring必学的Java基础知识----反射
    引述要学习Spring框架的技术内幕,必须事先掌握一些基本的Java知识,正所谓“登高必自卑,涉远必自迩”。以下几项Java知识和Spring框架息息相关,不可不学(我将通过一个系列分别介绍这些Java基础知识,希望对大家有所帮助。):[1]Java反射知识-->SpringIoC[2]属性编辑器,即PropertyEditor......
  • .Net6基础配置
    NET6App介绍.NET6的CoreApp框架,用来学习.NET6的一些变动和新特性,使用EFCore,等一系列组件的运用.。软件架构分为模型层,服务层,接口层来做测试使用0.如何使用IConfiguration、Environment直接在builder后的主机中使用。builder.Configuration;builder.Environment1.如何使......