如何从具有不同长度的列表字典创建汇总表？

时间：2024-07-23 04:35:36浏览次数：14

标签：python pandas

我的输入是这个字典：

response = {
    'A': ['CATEGORY 2'],
    'B': ['CATEGORY 1', 'CATEGORY 2'],
    'C': [],
    'D': ['CATEGORY 3'],
}

我正在尝试制作这种数据框：

|  ITEM  |  CATEGORY 1  |  CATEGORY 2  |  CATEGORY 3  |
|   A    |              |      x       |              |
|   B    |      x       |      x       |              |
|   C    |              |              |              |
|   D    |              |              |      x       |

为此我编写了下面的代码，但结果非常出乎意料。

df = pd.DataFrame.from_dict(response, orient='index').fillna('x')

df = df.reset_index()

df = df.rename(columns={'index': 'ITEM'})

print(df)

  ITEM           0           1
0    A  CATEGORY 2           x
1    B  CATEGORY 1  CATEGORY 2
2    C           x           x
3    D  CATEGORY 3           x

你们有解决方案吗？我愿意接受任何建议。

的问题在于，正在尝试将字典直接转换为数据框，而字典的值具有不同长度的列表。这就是的代码无法按预期工作的原因。

可以使用以下方法来获得所需的数据框：

import pandas as pd

response = {
    'A': ['CATEGORY 2'],
    'B': ['CATEGORY 1', 'CATEGORY 2'],
    'C': [],
    'D': ['CATEGORY 3'],
}

# 创建一个空的字典来存储结果
data = {}

# 遍历响应字典
for item, categories in response.items():
    data[item] = {category: 1 for category in categories}

# 使用 from_dict 方法从字典创建数据框
df = pd.DataFrame.from_dict(data, orient='index').fillna(0).astype(int)

# 将列名重命名为所需的格式
df = df.rename(columns=lambda x: x.replace("CATEGORY ", "CATEGORY_"))

# 添加 ITEM 列
df = df.reset_index().rename(columns={'index': 'ITEM'})

print(df)

说明：

我们首先创建一个空的字典 data 来存储结果。
然后，我们遍历 response 字典。对于每个项目及其类别，我们创建一个内部字典，其中类别作为键，值为 1（表示存在）。
我们使用 from_dict 方法使用 data 字典创建一个数据框，并将其方向设置为 index 。
我们使用 fillna(0) 将缺失值替换为 0，并使用 astype(int) 将所有值转换为整数。
我们使用 rename 方法将列名重命名为所需的格式。
最后，我们使用 reset_index 方法添加 ITEM 列并将索引重置。

这将为提供所需的数据框输出：

   ITEM  CATEGORY_1  CATEGORY_2  CATEGORY_3
0    A           0           1           0
1    B           1           1           0
2    C           0           0           0
3    D           0           0           1

标签：python,pandas
From： 78335778

无法在 python 中安装 pip install expliot - bluepy 的 Building Wheel (pyproject.t
在此处输入图像描述当我尝试在Windows计算机中通过cmd安装pipinstallexpliot包时，我收到2个错误名称×Buildingwheelforbluepy(pyproject.toml)didnotrunsuccessfully.│exitcode:1**AND**opt=self.warn_dash_deprecation......
python 用单斜杠-反斜杠替换url字符串中的双斜杠
我的URL包含错误的双斜杠（“//”），我需要将其转换为单斜杠。不用说，我想保持“https:”后面的双斜杠不变。可以在字符串中进行此更改的最短Python代码是什么？我一直在尝试使用re.sub，带有冒号否定的正则表达式（即，[^:](//)），但它想要替换整个匹配项（包括前面......
如何使用 Selenium Python 搜索 Excel 文件中的文本
我有一些数据在Excel文件中。我想要转到Excel文件，然后搜索文本（取自网站表），然后获取该行的所有数据，这些数据将用于在浏览器中填充表格。示例：我希望selenium搜索ST0003然后获取名称，该学生ID的父亲姓名，以便我可以在大学网站中填写此信息。我想我会从网站......
Python 套接字请求在很多情况下都会失败
我在python中尝试了超过5种不同的方法，尽管人们说它在其他论坛上有效，但所有这些方法都惨遭失败。importsocketmessage="test"clientsocket=socket.socket(socket.AF_INET,socket.SOCK_STREAM)clientsocket.connect(('1.1.1.1',80))clientsocket.send(mes......
Python 网络套接字
我一直尝试通过Python访问该网站的websocket，但是需要绕过CloudFlare，现在我尝试通过cookie进行绕过，但是这不起作用。我已经尝试在没有cookie的情况下执行此操作，但这也不起作用。importwebsocketimportbase64importosdriver=selenium.webdriver.Firefox()driver.ge......
Python：添加异常上下文
假设我想提出一个异常并提供额外的处理信息；最好的做法是什么？我想出了以下方法，但对我来说有点可疑：definternal_function():raiseValueError("smellysocks!")defcontext_function():try:internal_function()exceptExceptionase:......
【视频】Python遗传算法GA优化SVR、ANFIS预测证券指数ISE数据-CSDN博客
全文链接：https://tecdat.cn/?p=37060本文旨在通过应用多种机器学习技术，对交易所的历史数据进行深入分析和预测。我们帮助客户使用了遗传算法GA优化的支持向量回归（SVR）、自适应神经模糊推理系统（ANFIS）等方法，对数据进行了特征选择、数据预处理、模型训练与评估。实验结果表明，这些方法......
Python学习笔记42：游戏篇之外星人入侵(三)
前言在之前我们已经创建好了目录，并且编写好了游戏入口的模块。今天的内容主要是讲讲需求的分析以及项目各模块的代码初步编写。在正式编写代码前，碎碎念几句。在正式编写一个项目代码之前，实际是有很多工作要做的。就项目而言，简单的定项，需求对齐，项目架构设计，实际的代码编写，......
Python入门知识点 5--流程控制语句
先来分享一个pycharm使用小技巧红色波浪线:提醒可能报错黄色波浪线:提醒书写不规范，ctrl+alt+l去掉黄线 code--Reformatcode,就可以去掉黄线,调整代码格式1、程序三大执行流程（1）顺序执行程序执行时,代码从上往下,从左往右执行,中间......

如何从具有不同长度的列表字典创建汇总表？

相关文章

赞助商

阅读排行