首页 > 编程语言 >在 Python 中将具有不同标题的多个 CSV 文件合并到一个文件中

在 Python 中将具有不同标题的多个 CSV 文件合并到一个文件中

时间:2022-09-01 08:24:55浏览次数:96  
标签:文件 csv Python 导入 CSV 安装

在 Python 中将具有不同标题的多个 CSV 文件合并到一个文件中

在使用 CSV 文件进行数据分析时,我们可能需要处理大型数据集。在这些情况下,我们必须将所有数据合并到一个 CSV 文件中。按照下面给出的示例,我们将学习如何使用 Python 连接 CSV 文件。

先决条件

如果您的计算机上还没有最新版本的 Python,请下载并安装它。

下载链接: https://www.python.org/downloads/

安装成功后,我们必须安装pandas包。

安装熊猫

打开终端并使用以下命令安装 pandas。

 点安装熊猫

现在让我们假设您有一个包含各种标题的 CSV 文件。然后必须合并标题名称。

例子

第一个 CSV

第二个 CSV

第三个 CSV

例如,您需要提取下面列出的标头值。

CompanyType、companySize、域、成立、tagLine、网站

导入所有需要的包。

 从 csv 导入 DictReader  
 导入全局  
 进口我们  
 将熊猫导入为 pd

获取 CSV 文件夹路径。

 路径 = os.getcwd()  
 csv_files = glob.glob(os.path.join(path, "*.csv"))

定义输出 CSV 标头。

 modifiedHeaders = ['CompanyType', 'companySize', 'domain', 'founded', 'tagLine,website']

从指定文件夹读取 CSV 文件并将它们写入单个文件。

完整的脚本

带有所选标头的 formatted.csv 文件将包含最终输出。

结论

我希望它对您有很大帮助,并为您节省大量时间。请关注我的页面并对我的帖子发表评论。

谢谢 !!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/7568/13300108

标签:文件,csv,Python,导入,CSV,安装
From: https://www.cnblogs.com/amboke/p/16645184.html

相关文章

  • 用 Python 编写傅立叶级数机器人(第 2 部分——为什么选择 Python?)
    用Python编写傅立叶级数机器人(第2部分——为什么选择Python?)自然,在编写傅立叶级数机器人时可能会问一个问题,“我应该使用哪种编码语言?”,在我看来,唯一的答案是Python......
  • 构建自定义镜像并优化dockerfile文件
    目录一.系统环境二.前言三.镜像构建步骤四.dockerfile文件常用指令4.1dockerfile文件常用指令4.2RUN、CMD、ENTRYPOINT的区别五.构建centos镜像5.1构建一个可以使用ifco......
  • 2022 年要知道的 10 大秘密 Python 编码技巧
    2022年要知道的10大秘密Python编码技巧编码最新消息Python顶级列表TOP10SECRETPYTHONCODINGTIPSTOKNOWIN2022有经验的程序员也发现在发现新技巧方面还......
  • python学习Day57
    Day57今日内容概要静态文件及相关配置请求方法request对象方法pycharm连接MySQLdjango连接MySQLdjangoorm简介orm基本操作语法数据库迁移字段增删改查记录......
  • 2022 年学习 Python 的 5 个理由
    2022年学习Python的5个理由Python在2022年非常流行,原因有几个什么是Python,我为什么要关心?Python可用于几乎任何软件开发领域,包括Web开发、数据科学、数据......
  • python + VS code + Docker
    目录1.安装docker2.构建映像3.启动docker4.安装VisualStudioCode并配置5.参考在python项目开发中,经常需要安装依赖包,还要考虑版本兼容问题。尤其是,升级一个python版本,......
  • 静态文件、请求方法、request对象、连接数据库、ORM
    目录静态文件及相关配置一、编写登录功能二、访问资源三、静态文件1.定义:2.位置:3.static文件夹:4.针对静态文件资源的访问也需要提前开设相应的接口5.接口前缀6.动态解析请......
  • python numpy.stack()
    numpy.stack()这个函数的功能就是堆叠array,就是对矩阵升维。但是比较头疼的就是stack()中的axis的理解。我找到了一篇比较好的博客,直接转载到这里了numpy.stack最通俗......
  • Go文件读写
    Go中的文件和目录操作文件的读取通过os.Open方法读取文件funcmain(){ //读取文件方法1 file,err:=os.Open("./main/test.txt") //关闭文件流 deferfile.Cl......
  • python相关知识点
    1.enumerate用于将可迭代对象拆包成元组比如list、dic、rangelist=[0,1,2,3]dic={'a':1,'b':2,'c':3}forainenumerate(list):print(a)#输出为(0,0)......