首页 > 编程问答 >Python:比较 csv 文件并打印相似之处

Python:比较 csv 文件并打印相似之处

时间:2024-07-30 06:13:38浏览次数:16  
标签:python list csv graph spyder

我需要比较两个 csv 文件并打印出它们的相似之处。第一个文件有名称和浓度,第二个文件就像只有名称的“最佳”列表,我需要绘制相似性图表。

例如,这就是我的列表的样子:

file1-old_file.csv

name_id,   conc_test1,  conc_test2
name1,     #### ,        ####
name2,     ####,        ####
...

等等..

file2-best_choice_file.csv

name_id
name1
name2
...

我知道这不是最好的方法,但这就是我尝试的方法:

file1 = pd.read_csv('old_file.csv')
file2 = pd.read_csv('best_choice_file.csv')
common_rows = pd.merge(file1, file2)
print("common rows:")
print(common_rows)

这会导致合并错误。 如果有人可以帮助我,我将非常感激!


合并错误是由于尝试合并的 DataFrame 中没有公共列导致的。虽然文件共享“name_id”,但 pandas 并不知道应该根据这些列进行合并。

以下是如何更正的代码以比较两个 CSV 文件并打印出相似之处的方法:

import pandas as pd

# 从 CSV 文件中读取数据
file1 = pd.read_csv('old_file.csv')
file2 = pd.read_csv('best_choice_file.csv')

# 使用 'name_id' 作为连接键合并文件
common_rows = pd.merge(file1, file2, on='name_id')

# 打印常见行
print("Common rows:")
print(common_rows)

# 如果只想绘制常见名称列表,可以使用以下内容:
common_names = file1['name_id'].isin(file2['name_id']).sum()
print(f"\nNumber of common names: {common_names}")

此代码首先从两个 CSV 文件中读取数据到 pandas DataFrame 中。然后,它使用 merge() 函数根据“name_id”列合并两个 DataFrame。 on='name_id' 参数告诉 pandas 使用此列作为连接键。

最后,它打印包含两个文件中都存在的名称及其相应浓度的共同行。它还打印文件中存在的常见名称的数量。

此代码将为提供两个文件中存在的常见名称及其浓度的更清晰的表示。

标签:python,list,csv,graph,spyder
From: 78808730

相关文章

  • Python 类交叉引用
    我用Python创建了一个数独游戏。我有一个:单元格类-“保存”数字可能性单元格组-保存单元格类实例我使用这些组在数独中运行行、列和正方形功能。每个单元格包含所有组,他属于classCell:def__init__(groups):self.groups=groupscla......
  • 如何修复我的 Python Azure Function DevOps Pipeline 上的“找到 1 个函数(自定义)加载
    我正在尝试使用AzureDevOps构建管道将PythonAzureFunction部署到Azure门户。由于某种原因,代码被部署到服务器,但我在尝试访问端点时收到404错误。我收到一个错误,显示1functionsfound(Custom)0functionsloaded,以及在服务器上显示ModuleNotFound......
  • 使用 kivy 从 python 脚本的 buildozer 构建 android apk 时出错
    我想从使用kivy包构建的Python脚本构建apk为此,我使用googlecollab.这里是main.py脚本:importyoutube_dlfromkivy.appimportAppfromkivy.uix.boxlayoutimportBoxLayoutfromkivy.uix.buttonimportButtonfromkivy.uix.tex......
  • 自动解码并检索 S/MIME 加密电子邮件的正文 (python)
    我如何:用python代码连接我的邮件收件箱以自动获取未读电子邮件的加密内容;解码S/MIME加密电子邮件(我有密钥);检索电子邮件正文纯文本;检查正文(或主题)是否与某个关键字(现在为“test”)匹配,并在匹配时打印一些内容;在树莓派上使用此代码,无需手动......
  • Python 3 写入 DBF(带有 Memo 的 dBase IV)
    我需要在Python3中写入带有备注字段的dBaseIVdbf文件,但找不到合适的模块来执行此操作。我尝试过的包:Simpledbf-只读dbf-不支持dBaseIVdbfpy-不支持Python3dbfpy3-不支持dBaseIVYDbf-不支持备注字段pyshp-无法仅使用dbf文件......
  • Robin-Stocks Python 中的 order_buy_fractional_by_price 问题
    我在Robin-StocksPython包中的order_buy_fractional_by_price函数中遇到问题。在正常市场交易时间内下达以美元为基础的买入订单时,该订单被错误地设置为限价订单。对我来说看起来有问题的代码似乎是导致此问题的原因。我尝试在包管理器中本地修改或删除有问题的代码,但遇......
  • 在python中使用turtle绘制图案(带点)
    我正在尝试使用python中的海龟制作一幅赫斯特画(点图案)。我设法实现了它。Hirst_painting_dot_pattern但是我的for循环没有按照我预期的方式工作。它省略了最后一次迭代。在下面的代码中,我的for循环没有生成最后一个点。因此,我在循环末尾添加了一行来制作最后......
  • 使用 Python 进行 QuantLib Vanilla 掉期定价 - 错误
    我真的需要帮助...我有一个使用QuantLib构建自己的VanillaSwapPricer的项目。我想根据ois掉期的市场价格进行计算以进行贴现,并根据Euribor6M掉期+FRA进行预测固定。总而言之,我的目标是尽可能接近彭博社对标准Euribor6M掉期的定价(贴现ois)-fwdEuribor6M)。......
  • 我正在制作一个可以打开wav文件的python程序,我想知道wav文件的格式是什么
    因此,我已经通过此网站的研究编写了验证并读取wav标头的代码。但我想知道,data段中的数据是如何存储的?它们位于16位部分中,彼此相邻放置。我认为在Audacity中制作440hz正弦波,然后导出它,会显示一些结果,并且字节确实看起来更整齐,但仍然像废话一样接缝。相信我,我已经......
  • python - 面板库 - PasswordInput 不会对回车做出反应
    我试图避免需要提交按钮。以下代码当前正在远程jupyter实验室运行。仅当光标焦点从密码小部件中移除后,才会打印该消息。我想要回车来触发消息打印。有什么线索吗?frompanel.widgetsimportPasswordInput,TextInputpn.extension()defon_enter(event=None):message_p......