Pandas2.2 Series
Attributes
方法 | 描述 |
---|---|
Series.index | 每个数据点的标签或索引 |
Series.array | 对象底层的数据数组 |
Series.values | 以NumPy数组的形式访问Series中的数据值 |
pandas.Series.array
pandas.Series.array
属性是 Pandas 库中的一个功能,它允许你访问 Series 对象底层的数据数组。这个属性在 Pandas 0.24.0 版本中引入,为开发者提供了一种更直接的方式来访问和操作 Series 数据,特别是在需要进行高性能计算或需要特定类型数组(如 NumPy 数组或 Pandas 扩展类型数组)时。
主要特点
- 直接访问底层数据:
Series.array
提供了对 Series 数据底层数组的访问,而无需转换为其他格式。 - 类型保持:如果 Series 包含 Pandas 扩展类型(如整数、浮点数、字符串、布尔值、时间戳、区间、类别、稀疏等),
Series.array
将返回一个与这些类型相对应的 Pandas 扩展数组对象。 - 性能优化:对于需要频繁访问和操作底层数据的场景,使用
Series.array
可以提高性能。
示例 1:访问整数 Series 的底层数组
import pandas as pd
# 创建一个整数 Series
s = pd.Series([1, 2, 3, 4, 5])
# 访问底层数组
array = s.array
print(array)
print(type(array))
结果:
<NumpyExtensionArray>
[1, 2, 3, 4, 5]
Length: 5, dtype: int64
<class 'pandas.core.arrays.numpy_.NumpyExtensionArray'>
示例 2:访问字符串 Series 的底层数组
# 创建一个字符串 Series
s = pd.Series(['a', 'b', 'c', 'd', 'e'])
# 访问底层数组
array = s.array
print(array)
print(type(array))
结果:
<NumpyExtensionArray>
['a', 'b', 'c', 'd', 'e']
Length: 5, dtype: object
<class 'pandas.core.arrays.numpy_.NumpyExtensionArray'>
示例 3:访问时间戳 Series 的底层数组
import pandas as pd
import numpy as np
# 创建一个时间戳 Series
dates = pd.date_range('20230101', periods=5)
s = pd.Series(dates)
# 访问底层数组
array = s.array
print(array)
print(type(array))
结果:
<DatetimeArray>
['2023-01-01 00:00:00', '2023-01-02 00:00:00', '2023-01-03 00:00:00',
'2023-01-04 00:00:00', '2023-01-05 00:00:00']
Length: 5, dtype: datetime64[ns]
<class 'pandas.core.arrays.datetimes.DatetimeArray'>
标签:00,Series,访问,数组,array,Pandas,底层
From: https://blog.csdn.net/weixin_39648905/article/details/144577039