首页 > 编程语言 >python操作pandas的笔记

python操作pandas的笔记

时间:2023-03-07 15:58:38浏览次数:44  
标签:loc python URL 笔记 df new print iloc pandas

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 30, 35, 40],
        'gender': ['F', 'M', 'M', 'M']}
df = pd.DataFrame(data)
print(df)
print("=" * 30)
new_df = pd.DataFrame(df.iloc[1]).T  # 选取第几行
new_row = pd.DataFrame(df.loc[3]).T
new_df.reset_index(drop=True, inplace=True)  # 重置下标为从0开始
new_df = new_df.append(new_row, ignore_index=True)  # ignore_index将索引改为从0开始以此往下,否则保留copy过来数据的原索引

print(new_df)

其他操作

import pyarrow.parquet as pq

"""
横向:axis=1,纵向axis=0
"""
#file = "/Users/chennan/Downloads/1.parquet"
file2 = "/Users/chennan/Downloads/2.parquet"

df = pq.read_pandas(file2).to_pandas()
# print(df.T) #行列倒置
# print(df.columns)  # DataFrame的列索引列表
# print(df.values)  # 直接获取其中array的值
# print(df.index)  # DataFrame的行索引列表,修复index的时候不能单独修改。
# print(df.loc[0].URL)
print(df.head(5))  # 显示前5行内容
# print(df.tail(5)) #显示后5行内容
# 删除一些列,让数据更简单些,再去做后面的操作
# data = df.drop(["WIDTH","HEIGHT","similarity","hash","punsafe","pwatermark","aesthetic"], axis=1)
# df.iloc[0, -1] = b"https://cdn.mumsgrapevine.com.au/site/wp-content/uploads/2020/03/First-Easter-Shoes-360x241.jpg"
# loc后面第一部分是条件判断,逗号后面是选取列

# 使用loc:只能指定行列索引的名字
# print(df.loc[0, "URL"])  # 第0行的URL列。
# print(df.loc[1, "URL"])

# 获取前2行,前3列的内容,
# print(df.iloc[:2, :3])

# 获取前2行,前
# print(df.iloc[:2, 0])
# # df.to_parquet(file)
#
#
#
# print(df.shape) #行,列

# 赋值操作
# print(df["URL"])
# 或者
# print(df.URL)
# 这一列都变成1
# df["URL"]=1
# np.all()只要有一个就返回False
# print(np.all(pd.notnull(df)))  # 判断是否有缺失值
# print(np.any(pd.isnull(df))) # 判断是否有缺失值,判断是否是缺失值,是则返回True。
# print(df.iloc[0, 0])
# print(df.iloc[1, 0])
# df.iloc[0, 0] = b"123"
# df.iloc[1, 0] = b"234"
# df.to_parquet(file2)
#print(df.iloc[:8, 0][2])
#print(df.iloc[:8, 0][3])

标签:loc,python,URL,笔记,df,new,print,iloc,pandas
From: https://www.cnblogs.com/c-x-a/p/17188336.html

相关文章

  • 用openpyxl操作excel学习笔记
    课程来源:https://www.bilibili.com/video/BV19p4y1z7rM/?p=3&spm_id_from=pageDriver&vd_source=5c65398a0f1ade31116f35fc9c0cf651fromopenpyxlimportload_workbookwb......
  • Linux使用DataX3.0 ~笔记-持续更新中
     一、Liunx上安装DataX查看当前系统版本查看系统的名称,命令:uname查看具体的系统版本,命令:cat/etc/redhat-release查看是否具备jdk和python环境:查看jdk版本,命......
  • pandas处理Excel数据
    pandas数据转换成numpy数据DataFrame转换成ndarrayarray(data)series转换成ndarrayarr=series.as_matrix()print(type(data))#打印数据类型替换数据中的空值为0da......
  • react业务开发笔记1
    自定义table空数据import{ConfigProvider,Table,}from'antd'//定义空数据展示constrenderEmpty=()=>(<EmptyimageStyle={{he......
  • oracle小笔记
    selectCASEWHENASCIISTR(name)LIKE'%\%'ANDLENGTH(name)=2THEN'*'||SUBSTR......
  • 网络安全实践笔记
    网络安全实践密码学概述通信中的参与者发送者(Alice,爱丽丝):在双方交互中合法的信息发送实体。接受者(Bob,鲍勃):在双方交互中合法的信息接受实体。分析者(Eve,伊夫):破坏接受......
  • Python中Index的用法
    1.Index常用于Python的List数据类型在Python中有一种数据类型叫作List数据类型。程序员口中和中文翻译过来都称之为List数据类型,而Index主要用于List数据类型中。Index......
  • TypeScript 学习笔记 — 交叉类型、条件类型和条件分发(八)
    目录交叉类型条件类型1.直接传入判断的条件2.把条件当成泛型传入3.多重条件判断4.判断接口中的类型extends父子关系(类型等级)条件分发机制实际开发中如何避免?<T,U>判断......
  • 使用Python操作Mysql数据库(进阶)
    #-*-coding:utf-8-*-importloggingimportpymysqlfromrest_framework.responseimportResponselogger=logging.getLogger(__name__)#连接数据库def......
  • Python 内置函数装饰器 classmethod staticmethod
    使用官方的说法:classmethod(function)中文说明:classmethod是用来指定一个类的方法为类方法,没有此参数指定的类的方法为实例方法,使用方法如下:classC:@classmetho......