将大写字母应用于 Pandas DataFrame中的列
分析现实世界的数据有些困难,因为我们需要考虑各种因素。除了从大型数据集中获取有用的数据外,将数据保存为所需的格式也非常重要。
可能会遇到需要将给定DataFrame中任何特定列中的每个字母大写的情况。让我们看看如何将大写字母应用于 Pandas DataFrame中的列。
让我们使用nba.csv创建一个DataFrame 。
# Import pandas package import pandas as pd
# making data frame data = pd.read_csv("nba.csv")
# calling head() method # storing in new variable data_top = data.head(10)
# display data_top |
输出:
我们可以使用某些方法来更改/修改 Pandas DataFrame中列的大小写。让我们看看如何使用方法upper()将大写字母应用于 Pandas DataFrame中的列。
方法 1:
# Import pandas package import pandas as pd
# making data frame data = pd.read_csv("nba.csv")
# display data['Name'] = data['Name'].str.upper()
data.head() |
输出:
方法 #2:使用 lambda 和upper()方法
# Import pandas package import pandas as pd
# making data frame data = pd.read_csv("nba.csv")
# removing null values to avoid errors data.dropna(inplace = True)
# Applying upper() method on 'College' column data['College'].apply(lambda x: x.upper()).head(10) |
输出:
从 Pandas DataFrame 中的特定列中获取 n 个最大值
Pandas DataFrame是二维大小可变、可能异构的表格数据结构,带有标记轴(行和列)。
让我们看看如何从 Pandas DataFrame 中的特定列中获取 n 个最大值。
首先观察这个数据集。我们将使用此数据的“年龄”、“体重”和“薪水”列来从Pandas DataFrame 中的特定列中获取n 个最大值。
# importing pandas module import pandas as pd
# making data frame df = pd.read_csv("nba.csv")
df.head(10) |
代码 #1:获取 5 个最大的 Age
# importing pandas module import pandas as pd
# making data frame df = pd.read_csv("nba.csv")
# five largest values in column age df.nlargest(5, ['Age']) |
输出:
代码 #2:获取 10 个最大权重
# importing pandas module import pandas as pd
# making data frame df = pd.read_csv("nba.csv")
# Ten largest values in column Weight df.nlargest(10, ['Weight']) |
输出:
代码 #3:获得 10 最高工资
# importing pandas module import pandas as pd
# making data frame df = pd.read_csv("nba.csv")
# five largest values in column Salary df.nlargest(5, ['Salary']) |
输出:
标签:DataFrame,pandas,特定,大小写,pd,csv,data,Pandas From: https://blog.csdn.net/xt14327/article/details/144065880