首页 > 编程问答 >如何从具有不同长度的列表字典创建汇总表?

如何从具有不同长度的列表字典创建汇总表?

时间:2024-07-23 04:35:36浏览次数:14  
标签:python pandas

我的输入是这个字典:

response = {
    'A': ['CATEGORY 2'],
    'B': ['CATEGORY 1', 'CATEGORY 2'],
    'C': [],
    'D': ['CATEGORY 3'],
}

我正在尝试制作这种数据框:

|  ITEM  |  CATEGORY 1  |  CATEGORY 2  |  CATEGORY 3  |
|   A    |              |      x       |              |
|   B    |      x       |      x       |              |
|   C    |              |              |              |
|   D    |              |              |      x       |

为此我编写了下面的代码,但结果非常出乎意料。

df = pd.DataFrame.from_dict(response, orient='index').fillna('x')

df = df.reset_index()

df = df.rename(columns={'index': 'ITEM'})

print(df)

  ITEM           0           1
0    A  CATEGORY 2           x
1    B  CATEGORY 1  CATEGORY 2
2    C           x           x
3    D  CATEGORY 3           x

你们有解决方案吗?我愿意接受任何建议。


的问题在于,正在尝试将字典直接转换为数据框,而字典的值具有不同长度的列表。这就是的代码无法按预期工作的原因。

可以使用以下方法来获得所需的数据框:

import pandas as pd

response = {
    'A': ['CATEGORY 2'],
    'B': ['CATEGORY 1', 'CATEGORY 2'],
    'C': [],
    'D': ['CATEGORY 3'],
}

# 创建一个空的字典来存储结果
data = {}

# 遍历响应字典
for item, categories in response.items():
    data[item] = {category: 1 for category in categories}

# 使用 from_dict 方法从字典创建数据框
df = pd.DataFrame.from_dict(data, orient='index').fillna(0).astype(int)

# 将列名重命名为所需的格式
df = df.rename(columns=lambda x: x.replace("CATEGORY ", "CATEGORY_"))

# 添加 ITEM 列
df = df.reset_index().rename(columns={'index': 'ITEM'})

print(df)

说明:

  1. 我们首先创建一个空的字典 data 来存储结果。
  2. 然后,我们遍历 response 字典。对于每个项目及其类别,我们创建一个内部字典,其中类别作为键,值为 1(表示存在)。
  3. 我们使用 from_dict 方法使用 data 字典创建一个数据框,并将其方向设置为 index
  4. 我们使用 fillna(0) 将缺失值替换为 0,并使用 astype(int) 将所有值转换为整数。
  5. 我们使用 rename 方法将列名重命名为所需的格式。
  6. 最后,我们使用 reset_index 方法添加 ITEM 列并将索引重置。

这将为提供所需的数据框输出:

   ITEM  CATEGORY_1  CATEGORY_2  CATEGORY_3
0    A           0           1           0
1    B           1           1           0
2    C           0           0           0
3    D           0           0           1

标签:python,pandas
From: 78335778

相关文章

  • 无法在 python 中安装 pip install expliot - bluepy 的 Building Wheel (pyproject.t
    在此处输入图像描述当我尝试在Windows计算机中通过cmd安装pipinstallexpliot包时,我收到2个错误名称×Buildingwheelforbluepy(pyproject.toml)didnotrunsuccessfully.│exitcode:1**AND**opt=self.warn_dash_deprecation......
  • python 用单斜杠-反斜杠替换url字符串中的双斜杠
    我的URL包含错误的双斜杠(“//”),我需要将其转换为单斜杠。不用说,我想保持“https:”后面的双斜杠不变。可以在字符串中进行此更改的最短Python代码是什么?我一直在尝试使用re.sub,带有冒号否定的正则表达式(即,[^:](//)),但它想要替换整个匹配项(包括前面......
  • 如何使用 Selenium Python 搜索 Excel 文件中的文本
    我有一些数据在Excel文件中。我想要转到Excel文件,然后搜索文本(取自网站表),然后获取该行的所有数据,这些数据将用于在浏览器中填充表格。示例:我希望selenium搜索ST0003然后获取名称,该学生ID的父亲姓名,以便我可以在大学网站中填写此信息。我想我会从网站......
  • Python 套接字请求在很多情况下都会失败
    我在python中尝试了超过5种不同的方法,尽管人们说它在其他论坛上有效,但所有这些方法都惨遭失败。importsocketmessage="test"clientsocket=socket.socket(socket.AF_INET,socket.SOCK_STREAM)clientsocket.connect(('1.1.1.1',80))clientsocket.send(mes......
  • Python 网络套接字
    我一直尝试通过Python访问该网站的websocket,但是需要绕过CloudFlare,现在我尝试通过cookie进行绕过,但是这不起作用。我已经尝试在没有cookie的情况下执行此操作,但这也不起作用。importwebsocketimportbase64importosdriver=selenium.webdriver.Firefox()driver.ge......
  • Python:添加异常上下文
    假设我想提出一个异常并提供额外的处理信息;最好的做法是什么?我想出了以下方法,但对我来说有点可疑:definternal_function():raiseValueError("smellysocks!")defcontext_function():try:internal_function()exceptExceptionase:......
  • 【视频】Python遗传算法GA优化SVR、ANFIS预测证券指数ISE数据-CSDN博客
    全文链接:https://tecdat.cn/?p=37060本文旨在通过应用多种机器学习技术,对交易所的历史数据进行深入分析和预测。我们帮助客户使用了遗传算法GA优化的支持向量回归(SVR)、自适应神经模糊推理系统(ANFIS)等方法,对数据进行了特征选择、数据预处理、模型训练与评估。实验结果表明,这些方法......
  • Python学习笔记42:游戏篇之外星人入侵(三)
    前言在之前我们已经创建好了目录,并且编写好了游戏入口的模块。今天的内容主要是讲讲需求的分析以及项目各模块的代码初步编写。在正式编写代码前,碎碎念几句。在正式编写一个项目代码之前,实际是有很多工作要做的。就项目而言,简单的定项,需求对齐,项目架构设计,实际的代码编写,......
  • Python入门知识点 5--流程控制语句
    先来分享一个pycharm使用小技巧   红色波浪线:提醒可能报错   黄色波浪线:提醒书写不规范,ctrl+alt+l去掉黄线   code--Reformatcode,就可以去掉黄线,调整代码格式1、程序三大执行流程(1)顺序执行        程序执行时,代码从上往下,从左往右执行,中间......