pandas df分段(cut)后交叉(crosstab)数据标签缺失的补充

时间：2022-11-06 14:13:29浏览次数：58

标签：index cut crosstab df label columns pd bins

数值数据分类后交叉,但是数据量少,或者划分标准不科学
导致分类的类别有缺失,交叉后会丧失类别,数据不齐整

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(100,2))
bins = np.arange(0,1.3,0.1)
bins_label =[str(i)[:3]+'_~' for i in bins[:-1]]

df[3] = pd.cut(df[0],bins=bins,labels=bins_label)
df[4] = pd.cut(df[1],bins=bins,labels=bins_label)

data = pd.crosstab(index=df[3],columns=df[4])  # 填充前

def df填充框架(df: pd.DataFrame, index: list, columns: list):
    df2 = pd.DataFrame(index = index,columns = columns)
    df2.update(df)
    df2 = df2.fillna(0)
    return df2

data = df填充框架(data,index=bins_label,columns=bins_label)  # 填充后

标签：index,cut,crosstab,df,label,columns,pd,bins
From： https://www.cnblogs.com/meizhengchao/p/16862480.html

计算机系统概论第三版电子书 pdf
《IntroductiontoComputingSystems:FromBits&GatestoC/C++&Beyond,3rdEdition》作者:YalePatt/SanjayPate出版社:McGraw-HillEducation副标题:From......
JAVA8-Lambda-FindFirst（获取列表中出现的第一条记录）
寻找列表中的第一个元素描述：代码示例中list列表存在三条记录，findFirst是找出第一个出现的记录信息。publicstaticvoidmain(String[]args){ArrayList<Stu......
第2-1-2章传统方式安装FastDFS-附FastDFS常用命令
目录3安装配置3.1安装GCC3.2安装libevent3.3安装libfastcommon3.4安装FastDFS3.5安装fastdfs-nginx-module3.5安装Nginx3.6配置FastDFSTracker3.5.1配置Tracker3......
开始使用AspectJ-@AfterThrowing ,@After ,@Pointcut 定义切入点（比较重要）
开始使用AspectJ（接下来的作为了解就行）1.[了解]@AfterThrowing异常通知-注解中有throwing属性在目标方法抛出异常后执行。该注解的throwing属性用于指定所发生的异......
套汇问题 Python实现，算法设计，DFS深度遍历
#P67#套汇问题可以理解为一个有向图找出环的问题，#要想有盈利，需要所有的汇率乘积大于1#在贪心条件下，找到一个环路径上的乘积大于1就有套汇的可能性"""#输入一......
ROS2(Galactic) URDF教程
从零开始构建视觉机器人模型在本教程中，我们将构建一个机器人的视觉模型，该模型看起来很像R2D2。在后面的教程中，您将学习如何清晰地表达模型，添加一些物理属性，并使用xacro生......
Codeforces Round #826 (Div. 3) D. Masha and a Beautiful Tree(树+dfs)
D.MashaandaBeautifulTree题目大意：给定一颗满二叉树的叶子节点，让我们更换子树位置，从而让叶子节点排序为升序求最小操作数，如果不能移动成那样的话，直接输出-1.in......
ES 查询时提示：all shards failed [type=search_phase_execution_exception]
我的情况和解决方案这种错误大概率是ES的查询语句语法错误，比如我当时是，时间筛选的条件的格式写错了，导致ES查询时解析错误，从而报了allshardsfailed[type=search_pha......
数学动规滑动窗口 HashMap里放数组 dfs 暴力
1比特与2比特字符intn=bits.length;inti=0;因为，如果最后一个字符必须是一个一比特字符，那么，一定可以跳到最会一个位置。也就是n-1这个位置。所以不能遍......
DFS
概念其过程简要来说是对每一个可能的分支路径深入到不能再深入为止，而且每个节点只能访问一次.百度实现思想无向图通过转换为一个临界矩阵，其实就是遍历临界矩阵如上图......

pandas df分段(cut)后交叉(crosstab)数据标签缺失的补充

相关文章

赞助商

阅读排行