忽略 CSV 文件开头的文本

时间：2024-07-20 20:08:21浏览次数：11

标签：python dataframe csv

我正在尝试从网络下载 CSV 文件。但是，前 20 行是列定义，数据从第 24 行开始（中间的行是空白）。

我的代码是： data = pd.read_csv(fileURL, skiprows=[23], on_bad_lines='skip')

返回的是作为两列数据框的列定义， 20k 行数据被忽略

如果没有 - on_bad_lines - 我收到错误，因为初始文本是两列宽度，而数据是 18 列

skiprows[23] - 不跳过列定义两个开关的顺序没有区别。

skiprows 本身会引发“错误标记数据”错误

有什么建议吗？

可以使用 skiprows 参数跳过行，并使用 header 参数指定标题所在的行。在本例中，要跳过前 23 行，并将第 24 行设为标题。

以下是更新后的代码：

data = pd.read_csv(fileURL, skiprows=23, header=0, on_bad_lines='skip')

这将跳过前 23 行，使用第 24 行作为标题，并使用其余行作为数据。 on_bad_lines='skip' 参数将跳过任何格式错误的行，这在处理包含错误数据的 CSV 文件时很有用。

如果这不起作用，还可以尝试使用 engine='python' 参数，这将使用 Python 的内置 CSV 解析器而不是 C 引擎。Python 引擎通常更灵活，可以处理更多类型的格式错误。

data = pd.read_csv(fileURL, skiprows=23, header=0, on_bad_lines='skip', engine='python')

如果仍然有问题，请分享的 CSV 文件示例，以便我可以提供更具体的帮助。

标签：python,dataframe,csv
From： 78772700

python查看某个包的当前安装版本以及最新版本
方法1：使用pip和--outdated参数你可以使用piplist--outdated命令来查看哪些包有更新版本可用。这个命令会列出所有安装的包以及它们在PyPI上的最新版本。piplist--outdated这将输出一个包列表，包含当前版本和最新版本，例如：PackageVersionLatestTyp......
【python】错误 SyntaxError: invalid syntax的解决方法总结
【python】错误SyntaxError:invalidsyntax的解决方法总结在Python编程中，SyntaxError:invalidsyntax是一个常见的错误，通常表示Python解释器在尝试解析代码时遇到了语法错误。这种错误可能由多种原因引起，包括拼写错误、缺少关键字、不恰当的缩进等。本文将深入探讨......
MiniQMT国债逆回购策略Python代码全解析
文章目录......
python—爬虫的初步了解
Python爬虫（WebScraping）是一种自动化从网站上提取数据的技术。Python由于其简洁的语法、丰富的库和强大的社区支持，成为了实现网络爬虫的首选语言之一。下面是一些Python爬虫的基本概念和步骤：1.爬虫的基本概念请求（Request）：爬虫向服务器发送的请求，通常包括URL、HTTP方法（如......
Python集合的概念与使用
在Python中，集合（set）是一种无序且不包含重复元素的数据结构。集合对象由一组大括号或函数创建，但请注意，大括号在没有元素的情况下会创建一个空字典，而不是空集合。因此，当你想创建一个空集合时，应该使用 set()函数而不是 set{}集合的特点无序：集合中的元素没有特定的......
python——面向对象（2）继承与多态
文章目录继承的基本语法继承的特点继承的类型多态在Python中，继承是一种基于已存在的类来创建新类的方式。这种机制允许我们定义一个通用的类，然后基于这个类来定义一些特定的类，这些特定的类将继承通用类的属性和方法，同时也可以添加或覆盖一些新的属性和方法。这种方式......
Python 更换 pip 源详细指南
目录前言pip国内源临时换源方法一：添加参数方法二：设置环境变量永久换源方法三：修改配置方法四：pip命令修改总结前言在我们使用Python3时，pip是一个不可或缺的工具，它用于安装和管理第三方库。然而，有时我们可能会遇到Python库下载速度慢的问题，这是因为默认的pi......
使用Python的Turtle库绘制中国火箭模型，点燃航天梦！
引言在编程教育中，turtle模块是一个非常受欢迎的图形化编程工具，尤其适合初学者学习和实践。它允许我们通过控制一个可以在屏幕上移动的“小乌龟”来绘制各种形状和图案，从而让编程变得直观且有趣。Turtle库简介turtle是Python标准库的一部分，它提供了一个简单而强大的绘图环......
用Python调整图片尺寸教程【附源码】
就像我们学习数学一样，多做题多练习，才会熟能生巧。更多项目源码，实战案例，文件夹领取方式在文末学习Python也是一样，练习才是学好Python的最优解。只有不停的敲代码，不断练习，才能不断进步。实操练习你是否遇到过上传照片有大小要求？不管是上传证件照报名参赛，总会有一个不要......
干货 |Python中的循环结构
应用场景我们在写程序的时候，一定会遇到需要重复执行某条或某些指令的场景。例如用程序控制机器人踢足球，如果机器人持球而且还没有进入射门范围，那么我们就要一直发出让机器人向球门方向移动的指令。在这个场景中，让机器人向球门方向移动就是一个需要重复的动作，当然这里还会......

忽略 CSV 文件开头的文本

相关文章

赞助商

阅读排行