如果你需要从Excel文件的第二行开始读取数据,并且假设第二行是列名,你可以使用skiprows
参数来跳过文件的第一行。以下是如何操作的示例:
python
import pandas as pd
# 读取Excel文件,跳过第一行,假设第二行是列名
df = pd.read_excel('your_file.xlsx', sheet_name='Sheet1', skiprows=1)
# 现在可以直接基于列名操作,比如找到'国际唯一编码'列的不重复行
unique_rows = df.drop_duplicates(subset='国际唯一编码')
# 打印不重复的行
print(unique_rows)
# 保存到新的Excel文件
unique_rows.to_excel('unique_rows.xlsx', index=False)
这段代码中,skiprows=1
告诉Pandas跳过文件的第一行,这样第二行就会被视为列名。之后,你可以正常地使用列名来访问和操作数据,包括找到'国际唯一编码'
列的不重复行。