iterrows()
是 Pandas 库中 DataFrame 对象的一个方法,它允许你迭代 DataFrame 的行。当你有一个 DataFrame 并且想要逐行访问数据(或者基于每一行的数据做一些操作)时,iterrows()
会非常有用。
这个方法返回一个迭代器,产生索引和行数据作为成对的值。对于每一对值,第一个元素是行的索引(index),第二个元素是包含该行数据的 Series 对象。
以下是一个简单的例子来说明如何使用 iterrows()
:
import pandas as pd # 创建一个简单的 DataFrame data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'Country': ['USA', 'UK', 'Canada'] } df = pd.DataFrame(data) # 使用 iterrows() 迭代 DataFrame 的行 for index, row in df.iterrows(): print(f"Index: {index}, Name: {row['Name']}, Age: {row['Age']}, Country: {row['Country']}")
输出:
Index: 0, Name: Alice, Age: 25, Country: USA Index: 1, Name: Bob, Age: 30, Country: UK Index: 2, Name: Charlie, Age: 35, Country: Canada
注意:虽然 iterrows()
提供了逐行访问数据的能力,但在大型 DataFrame 上使用它可能会导致性能问题,因为它不是为高效迭代设计的。对于大型数据集,更推荐使用向量化操作,这些操作可以在整个 DataFrame 或 Series 上一次性应用,而无需逐行迭代。