首页 > 其他分享 >Pandas教程之十一:改变特定列大小写和从特定列获取N个最大值

Pandas教程之十一:改变特定列大小写和从特定列获取N个最大值

时间:2024-11-27 18:57:55浏览次数:7  
标签:DataFrame pandas 特定 大小写 pd csv data Pandas

 

 将大写字母应用于 Pandas DataFrame中的列

分析现实世界的数据有些困难,因为我们需要考虑各种因素。除了从大型数据集中获取有用的数据外,将数据保存为所需的格式也非常重要。

可能会遇到需要将给定DataFrame中任何特定列中的每个字母大写的情况。让我们看看如何将大写字母应用于 Pandas DataFrame中的列。

让我们使用nba.csv创建一个DataFrame 。

# Import pandas package 

import pandas as pd 

    

# making data frame 

data = pd.read_csv("nba.csv") 

    

# calling head() method  

# storing in new variable 

data_top = data.head(10) 

    

# display 

data_top

输出:

我们可以使用某些方法来更改/修改 Pandas DataFrame中列的大小写。让我们看看如何使用方法upper()将大写字母应用于 Pandas DataFrame中的列。

方法 1:

# Import pandas package 

import pandas as pd 

    

# making data frame 

data = pd.read_csv("nba.csv") 

      

# display 

data['Name'] = data['Name'].str.upper()

  

data.head()

输出:
 

方法 #2:使用 lambda 和upper()方法

# Import pandas package 

import pandas as pd 

    

# making data frame 

data = pd.read_csv("nba.csv") 

  

  

# removing null values to avoid errors  

data.dropna(inplace = True)  

  

# Applying upper() method on 'College' column

data['College'].apply(lambda x: x.upper()).head(10)

输出:

从 Pandas DataFrame 中的特定列中获取 n 个最大值

Pandas DataFrame是二维大小可变、可能异构的表格数据结构,带有标记轴(行和列)。

让我们看看如何从 Pandas DataFrame 中的特定列中获取 n 个最大值。

首先观察这个数据集。我们将使用此数据的“年龄”、“体重”和“薪水”列来从Pandas DataFrame 中的特定列中获取n 个最大值。

# importing pandas module 

import pandas as pd 

    

# making data frame 

df = pd.read_csv("nba.csv") 

  

df.head(10)

代码 #1:获取 5 个最大的 Age

# importing pandas module 

import pandas as pd 

    

# making data frame 

df = pd.read_csv("nba.csv") 

  

# five largest values in column age

df.nlargest(5, ['Age'])

输出:
 

代码 #2:获取 10 个最大权重

# importing pandas module 

import pandas as pd 

    

# making data frame 

df = pd.read_csv("nba.csv") 

  

# Ten largest values in column Weight

df.nlargest(10, ['Weight'])

输出:
 

 

代码 #3:获得 10 最高工资

# importing pandas module 

import pandas as pd 

    

# making data frame 

df = pd.read_csv("nba.csv") 

  

# five largest values in column Salary

df.nlargest(5, ['Salary'])

输出:

标签:DataFrame,pandas,特定,大小写,pd,csv,data,Pandas
From: https://blog.csdn.net/xt14327/article/details/144065880

相关文章

  • 一份写给数据工程师的 Polars 迁移指南:将 Pandas 速度提升 20 倍代码重构实践
    在大数据处理领域,性能和效率始终是核心问题。polars作为新一代数据处理框架,通过利用Rust语言的底层实现和现代化的并行计算架构,在处理大规模数据集时展现出显著的性能优势。根据性能测试文章的数据显示,在CSV文件读取操作中,polars的处理速度可达pandas的20倍。这种性能......
  • 05-02-04 满足特定条件的4位数
    任务描述一个四位正整数,满足如下条件:由数字1到数字9组成;各位数字都不相同;从左至右数字降序排列;并且相邻的两个数字前一个不能是后一个的倍数;并且这4位数字不能都是奇数,也不能都是偶数。编程输入两个4位整数a和b,输出区间[a,b]之间符合上述条件的所有数。输入样例:5000......
  • Pandas多层级索引创建
    Pandas多级层索引官方一点的说法:Pandas中的多级索引(MultiIndex)是一种允许在单个轴上拥有多个索引级别的索引对象。这种索引结构在处理具有复杂层次结构的数据时非常有用,因为它能够提供更丰富的数据访问和操作能力。我自己的理解是在excel表格中一个大类里面还有其他子类,子类存......
  • Python酷库之旅-第三方库Pandas(237)
    目录一、用法精讲1116、pandas.tseries.offsets.BusinessHour.is_year_end方法1116-1、语法1116-2、参数1116-3、功能1116-4、返回值1116-5、说明1116-6、用法1116-6-1、数据准备1116-6-2、代码示例1116-6-3、结果输出1117、pandas.tseries.offsets.CustomBusiness......
  • TensorFlow手动更新模型特定变量
    手动更新模型的特定变量是指在训练过程中不通过优化器的自动更新机制,而是直接对某些模型参数进行更新。这通常需要对特定变量的梯度进行处理并应用一个自定义的学习率。下面是如何实现这一操作的示例:手动更新模型特定变量的步骤计算损失和梯度:使用tf.GradientTape()来......
  • 梧桐数据库之查询特定日期的套餐价格
    一、背景说明随着市场竞争的加剧和技术的发展,运营商需要频繁调整其服务套餐的价格以吸引客户或应对成本变化。假设某移动运营商决定对其提供的各种服务套餐(如流量包、语音通话包等)进行价格调整,并记录了每次价格调整的具体日期和新的价格。现在,管理层希望了解2024年9月1日当天所有......
  • 【Mybatis与Spring整合】Java项目中占位符与大小写匹配规范的重要性
    在开发Java项目时,细节决定成败。一次不经意的占位符书写错误或大小写不匹配可能导致项目运行失败。本文基于实际问题,总结了占位符配置规范和解决办法,希望为大家提供参考。一、Spring占位符配置问题在Spring项目中,<context:property-placeholder>标签用于加载外部配置文件并......
  • 在 Windows 域中,管理员可以使用多种工具进行用户和组账户的批量管理,包括 CSVDE、LDIFD
    在Windows域用户与组账户管理中,批量管理用户账户是常见的操作,特别是在需要快速创建、修改或删除多个用户时。为了高效地进行批量管理,Windows提供了多种工具,下面列出这些常见的工具及其功能。1. CSVDE.exe功能:用于批量导入和导出ActiveDirectory中的对象(如用户、组等)。......
  • CSS文本属性:字体、加粗、斜体、对齐方式、下划线、首行缩进、字母大小写、字间距,词间
    1.非常常用!!!字体大小:16px、18pxfont-size:大小;字体颜色:red、green、#ff0000、#f00(两个相同的可以省略一个)coror:颜色;2.字体设置字体:Arial,Verdana,Thoma,sans-serif,simsun.....font-family:字体;3.加粗font-weight:xx;xx:下面的单词或整百数值(100-900)。    nor......
  • 常用Python数据分析开源库:Numpy、Pandas、Matplotlib、Seaborn、Sklearn介绍
    文章目录1.常用Python数据分析开源库介绍1.1Numpy1.2Pandas1.3Matplotlib1.4Seaborn1.5Sklearn1.常用Python数据分析开源库介绍1.1NumpyNumpy(NumericalPython)是Python数据分析必不可少的第三方库,Numpy的出现一定程度上解决了Python运算性能不佳的问题,同......