describe()
函数用于生成关于 DataFrame 中数值型列的统计摘要。它提供了各种描述性统计信息,如均值、标准差、最小值、最大值、四分位数等,以帮助我们更好地了解数据的分布情况。
下面是一个示例,说明如何使用 describe()
函数:
import pandas as pd
# 创建一个 DataFrame
data = {
'A': [1, 2, 3, 4, 5],
'B': [4, 5, 6, 7, 8],
'C': [7, 8, 9, 10, 11]
}
df = pd.DataFrame(data)
# 使用 describe() 函数生成 DataFrame 中数值型列的统计摘要
summary = df.describe()
print(summary)
输出结果:
A B C
count 5.0 5.0 5.000000
mean 3.0 6.0 9.000000
std 1.0 1.0 1.581139
min 1.0 4.0 7.000000
25% 2.0 5.0 8.000000
50% 3.0 6.0 9.000000
75% 4.0 7.0 10.000000
max 5.0 8.0 11.000000
在这个示例中,我们创建了一个 DataFrame,并使用 describe()
函数生成了数值型列的统计摘要。输出结果包括了计数、均值、标准差、最小值、25% 分位数、中位数(50% 分位数)、75% 分位数和最大值等统计信息。