首页 > 其他分享 >【Kaggle | Pandas】练习5:数据类型和缺失值

【Kaggle | Pandas】练习5:数据类型和缺失值

时间:2024-11-01 21:20:07浏览次数:3  
标签:missing dtype price 数据类型 Kaggle reviews isnull Pandas

文章目录

1. 获取列数据类型.dtype / .dypes

数据集中points列的数据类型是什么?

# Your code here
dtype = reviews.points.dtype

2. 转换数据类型.astype()

从points列中的条目创建一个系列,但将条目转换为字符串。提示:字符串在本机 Python 中是str

point_strings = reviews.points.astype(str)

3. 获取数据为空的列 .isnull()

有时价格列为空。数据集中有多少评论缺少价格?

missing_price_reviews = reviews[reviews.price.isnull()]
n_missing_prices = len(missing_price_reviews)
# Cute alternative solution: if we sum a boolean series, True is treated as 1 and False as 0
n_missing_prices = reviews.price.isnull().sum()
# or equivalently:
n_missing_prices = pd.isnull(reviews.price).sum()

4. 将缺少值替换并且排序.fillna(),.sort_values()

最常见的葡萄酒产区有哪些?创建一个系列,计算每个值在region_1字段中出现的次数。该字段经常缺少数据,因此将缺少的值替换为Unknown 。按降序排列。你的输出应该是这样的:
在这里插入图片描述


reviews_per_region = reviews.region_1.fillna('Unknown').value_counts().sort_values(ascending = False)

标签:missing,dtype,price,数据类型,Kaggle,reviews,isnull,Pandas
From: https://blog.csdn.net/qq_38473254/article/details/143416854

相关文章

  • JavaScript语法基础——变量,数据类型,运算符和程序控制语句(小白友好篇,手把手教你学会!)
     一、JavaScript概述JavaScript是一种高级编程语言,常用于网页开发和服务器端应用程序。它是一种动态类型语言,可以在浏览器中直接解释执行,而不需要编译。脚本(Script)是一种与计算机程序相关的指令集或代码块,用于执行特定的任务或操作。脚本通常用于自动化重复性的任务或进行特......
  • python的基本数据类型有哪些
    摘要:PYTHON的基本数据类型主要包括:1、数字类型2、字符串类型3、列表类型4、元组类型5、集合类型6、字典类型。数字类型是最常见的数据类型,涉及整数、浮点数、复数等。数字类型在数据科学、机器学习等领域尤为重要,其包含了整形(Int)、浮点型(Float)和复数(Complex)等子类型。它们分......
  • C++范型三:数据类型表
    类的数据类型成员C++中,在类模板中用typedef定义的数据类型称为内嵌类型nestedtypetemplate<typenameT>classMyTraits{public:typedefTmytype;};如下,使用内嵌类型在类外定义变量typenameMyTraits<int>::mytypen;可知,类外引用类模板的公有类型成员和引用类静......
  • Python工具箱系列:Pandas 数据清洗与预处理详解
    目录一、数据清洗与预处理的重要性二、Pandas简介三、Pandas数据清洗与预处理技巧1.读取数据2.查看数据3.处理缺失值4.处理重复值5.处理异常值6.处理数据类型不一致7.处理数据格式不一致8.数据标准化和归一化9.数据编码四、案例:使用Pandas进行数据清......
  • Python数据类型之自定义类型——Class与面向对象编程详解
    目录引言一、面向对象编程基础二、类的定义与对象的创建三、封装性四、继承性五、多态性六、特殊方法与数据类七、使用dataclass装饰器八、面向对象编程的优势结论引言Python是一门功能强大的编程语言,其面向对象编程(OOP)的特性更是为开发者提供了极大的灵活性和......
  • 数据类型
    java:buteshortintlongmysql: tinyint(m) --m:限定拆线呢的时候的宽度tinyint--->byte tingintunsigned无符号  0-255tingint(1)--->booleanofalse1ture常用2个整数类型bigint(m)->java中long类型时间毫秒数int(5)zerofill:以0填充7.2浮点类型folat......
  • 关于Web前端使用JavaScript常见的数据类型处理小技巧
    1.1获取字符串长度  如果想获取这个字符串的长度,也就是它里面有多少个字符,可以使用 length 属性:consts="HelloWorld";console.log(s.length)1.2 转换大小写toUpperCase() 方法可以将字母全部大写consts="HelloWorld";console.log(s.toLowerCase());......
  • Python数据分析NumPy和pandas(十七、pandas 二进制格式文件处理)
    以二进制格式存储(或序列化)数据的一种简单方法是使用Python的内置pickle模块。同时,pandas构造的对象都有一个to_pickle方法,该方法以pickle格式将数据写入磁盘。我们先把之前示例用到的ex1.csv文件加载到pandas对象中,然后将数据以二进制pickle格式写入examples/frame_p......
  • Python数据分析NumPy和pandas(十六、文本格式数据的读取与存储:csv、json、xml和html)
    一、分段读取文本文件在处理非常大的文件时,未找到合适的数据处理方法前,我们一般希望只读取文件的一小部分或遍历文件的较小块来做预处理或参考。这种情况可以采用分段读取文本文件的方式。我们加载一个10000行的ex6.csv文件,其内容如下:一般情况下,对于pandas读取大文件数据时......
  • 获取数据类型js
    functiongetFieldType(field){if(field===null){return'null';}switch(typeoffield){case'undefined':return'undefined';case'string':return&......