pandas.parser.CParserError：标记数据时出错

时间：2024-07-21 06:36:53浏览次数：13

标签：python csv pandas

我正在尝试使用 pandas 操作 .csv 文件，但收到此错误：

pandas.parser.CParserError：标记数据时出错。 C 错误：第 3 行应有 2 个字段，看到 12

我尝试阅读 pandas 文档，但什么也没找到。

我的代码很简单：

path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)

如何解决这个问题？我应该使用 csv 模块还是其他语言？

pandas 中的“CParserError: Error tokenizing data”错误消息表示 pandas 无法解析你的 CSV 文件，因为它在预期位置找不到预期数量的字段。在这种情况下，你的代码的第 3 行有 12 个字段，而它应该只有 2 个。

以下是导致此错误的一些最常见原因以及如何解决这些问题：

分隔符问题： pandas 默认使用逗号 (,) 作为分隔符。如果你的 CSV 文件使用不同的分隔符（例如制表符、分号或空格），则 pandas 会将整行解释为一个字段。

解决方案： 在 read_csv() 函数中明确指定分隔符。例如，如果你的文件使用制表符作为分隔符，你可以使用：

python data = pd.read_csv(path, sep='\t')
标题行中的引号： 如果你的标题行包含用引号括起来的字段，而数据行未包含用引号括起来的字段，则可能会导致此错误。

解决方案： 使用 header 参数指定哪一行包含标题，或者使用 skiprows 参数跳过标题行。例如，如果你的标题在第一行：

python data = pd.read_csv(path, header=0)

或者，如果要跳过前三行：

python data = pd.read_csv(path, skiprows=3)
数据行中的引号或分隔符： 如果你的数据字段包含分隔符或引号，则需要使用 quotechar 参数正确解析它们。

解决方案： 使用 quotechar 参数指定用于括起数据的字符。例如，如果你的数据使用双引号 (") 作为引号字符：

python data = pd.read_csv(path, quotechar='"')
文件编码： 如果你的 CSV 文件使用与 pandas 默认编码 (UTF-8) 不同的编码，则可能会导致此错误。

解决方案： 尝试使用 encoding 参数指定文件的正确编码。例如，如果你的文件使用 latin-1 编码：

python data = pd.read_csv(path, encoding='latin-1')
文件损坏： 在某些情况下，你的 CSV 文件可能已损坏。

解决方案： 尝试使用文本编辑器打开该文件，以查看是否有任何明显的损坏。你还可以尝试重新生成该文件，以查看问题是否仍然存在。

要排除故障，请使用 open(path).read() 打印 CSV 文件的内容，并仔细检查分隔符、引号和任何潜在问题。完成上述步骤后，你应该能够解决该错误并使用 pandas 成功读取 CSV 文件。

标签：python,csv,pandas
From： 18039057

Python Pandas - 读取 CSV 或 Excel
我允许用户上传CSV或Excel文件。我正在使用pandas读取文件并创建数据框。由于我无法预测用户将上传哪种文件类型，因此我将pd.read_csv()和pd.read_excel()包装在try/except块中。ifform.validate_on_submit():input_filename=secure_filename(form.file.da......
如何在 python 脚本中调用 robocopy 来批量复制多个文件夹？
我正在尝试在网络驱动器之间移动多个大文件夹（>10Gb、>100个子文件夹、>2000个文件）。我尝试过在python中使用Shutil.copytree命令，它工作得很好，只是由于不同的原因它无法复制一小部分（<1%的文件）。我相信robocopy对我来说是最好的选择，因为我可以创建一个记录传输过......
如何在Python中使用装饰器动态创建类方法？
我正在开发一个Python项目，我需要在运行时动态地为类创建方法。我想使用装饰器根据一些外部配置将这些方法添加到类中。要求是：装饰器应该从外部配置（例如字典）读取方法定义。装饰器应该动态地将这些方法添加到类中。每个生成的方法都应具有配置中指定的自己唯一的实现。以......
python 中的可扩展视频文件完整性验证
我的目录包含约100万个视频文件，嵌套在100个子目录下。我想编写一个python脚本来验证这些文件没有损坏，然后删除损坏的文件。做到这一点最有效的方法是什么？它运行的机器有64个cpu核心。当然，以下是如何在Python中构建可扩展视频文件完整性验证器的步骤，该验证器可以......
除了curses之外，是否有一个python包可以轻松控制终端的输出？
我现在正在处理一些小项目，我对GUI的偏好是终端中漂亮的文本界面。我宁愿不强迫用户处理Windowscurses二进制文件，所以我正在寻找不同的选项。我已经发现了asciimatics，但我想考虑所有可能的选择。如果有人有任何经验或知道解决此用例的包，我将不胜感激。谢谢你说的没错......
当值来自函数 python unittest 时，如何模拟全局变量
我必须在python中模拟全局变量，但变量值来自另一个函数。当我导入文件时，这个函数正在运行，但我想要那里的模拟值。secrets.pyimporttracebackimportloggingimportboto3importosimportjsonlogger=logging.getLogger()logger.setLevel(logging.INFO)secret_......
使用 python print 和 gdb 时出现 BrokenPipeError
我正在尝试在Linux中运行应用程序并使用Python生成输入：python3-c'print(".....")'|./someapp但出现下一个错误：Exceptionignoredin:<_io.TextIOWrappername='<stdout>'mode='w'encoding='utf-8'>BrokenPipeError:......
python 舰队容器
我正在尝试使用容器在flet中制作一个菜单，它应该是半透明的，但其中的项目不是。我尝试将opacity=1分配给元素，但没有成功-它们与容器一样透明感谢任何帮助我的代码：nickname=ft.TextField(label="xxx",hint_text="xxx")column=ft.Column(controls=[nickname......
Python应用程序跨子包共享的配置文件
我正在构建一个应用程序来控制一些硬件。我在包中实现了不同类型的硬件：电机和测量设备。我的文件结构如下：name_of_my_app/__init__.pymain.pyconfig.iniCONFIG.pymotors/__init__.pyone_kind_of_motor.pymeasurement_devices/......

pandas.parser.CParserError：标记数据时出错

相关文章

赞助商

阅读排行