首页 > 编程语言 >python 数据清洗

python 数据清洗

时间:2025-01-20 22:54:08浏览次数:1  
标签:python RHU df pd 清洗 csv 数据

数据清洗,清洗“RHU”列为999999的数据

#!/usr/bin/python3
# -*- coding: utf-8 -*-
"""
@Time : 2025/1/20 22:50
@Author : Suyue
@Email : 1493117872@qq.com
@File : cloud_area.py
@Project : untitled4
"""
import pandas as pd
import numpy as np

# 读取CSV文件到DataFrame
df = pd.read_csv('D:/探空数据计算/tankong-2020-50527_with_final_times_lat_lon.csv')

df = pd.DataFrame(df)

# 清洗“RHU”列中值为999999的数据,将其设置为NaN
df.loc[df['RHU'] == 999999, 'RHU'] = np.float('nan')

# # 查看清洗后的数据
# print("\n清洗后的数据:")
# print(df)

# 将清洗后的数据保存到一个新的CSV文件中
df.to_csv('D:/探空数据计算/tankong-2020-50527_with_final_times_lat_lon_cleaned_data.csv', index=False)

解释

  1. 读取数据:使用pd.read_csv函数读取CSV文件到一个Pandas DataFrame中。
  2. 查看数据:使用df.head()函数查看数据的前几行,以确认数据的格式和需要清洗的列。
  3. 清洗数据:
    • 使用df.loc函数选择“RHU”列中值为999999的行,并将这些值替换为pd.NA(Pandas中的缺失值表示)。你也可以选择替换为其他特定的值,比如-1。
  4. 再次查看数据:再次使用df.head()函数查看数据的前几行,以确认清洗结果。
  5. 保存数据:如果需要,使用df.to_csv函数将清洗后的数据保存回CSV文件。

标签:python,RHU,df,pd,清洗,csv,数据
From: https://www.cnblogs.com/shirleysu90/p/18682638

相关文章

  • python 探空数据根据“纬度”“经度”“纬度偏移量”“经度偏移量”列,纬度、经度、偏
    在Python中,如果您有包含“纬度”、“经度”、“纬度偏移量”和“经度偏移量”的DataFrame,并且这些值都是浮点数,可以使用这些值来计算新的、具体的经纬度。通常,这些偏移量是基于某种单位(如米、公里等)在地球表面上的距离转换而来的。由于地球是一个近似椭球体,计算精确的偏移后的经纬......
  • Python毕业设计 django培训机构教辅课后作业系统
    文章目录具体实现截图项目技术介绍设计思路核心代码部分展示运行指导论文写作思路django项目示例源码/演示视频获取方式具体实现截图起点树艺术培训机构系统是为满足当代艺术教育需求而设计的综合性管理平台,该系统主要功能包括学员管理、教师管理、培训课程管理、学......
  • 《如何用代码提升财务分析能力》第1章 Python基础知识
    第1章Python基础知识1.1初识Python1.1.1Python简介Python发展历史Python由GuidovanRossum于1989年圣诞节期间开始开发,1991年发布第一个版本。它的名字来源于Guido喜欢的英国喜剧团体MontyPython。Python的发展经历了几个重要阶段:Python1.0(1994年):引入lambda、......
  • 实践:MNIST 数据集的使用注意事项之——为什么测试集准确率高,手写准确率低?(MNIST 数据集
    使用MNIST数据集训练手写数字识别模型,作为机器学习的入门是绝大多数初学者的选择(事实上确实是个很好的练习)。然而,这里面事实上有个比较容易犯的错误。错误表现由于手写数字识别这个任务非常的实用并且很容易看出效果来——手写一个数字不就行了?所以一定有一部分初学者像......
  • Excel 技巧13 - 如何使用计算带单位的数据(★★★),神奇的Ctrl+E 都能干什么?(合并数据,拆
    本文讲了如何在Excel中计算带单位的数据。然后还讲了神奇的快捷键Ctrl+E的功能。目录1,如何统计带单位的数据1-1,先用一个替代1-2,Ctrl+E按相同规则提取所有数据1-3,替换掉多余的替代-S2,Ctrl+E快捷键都能干什么?2-1,合并数据2-2,拆分数据2-3,提取数据2-4,数据格式化2-5......
  • 机器视觉在肺癌筛查中的应用:数据驱动的肺结节检测与良恶性判断
    导语:肺癌,作为全球癌症死亡的主要原因之一,其早期筛查对于提高患者生存率至关重要。随着大数据时代的到来,机器视觉技术在医疗影像分析中发挥着越来越重要的作用。本文将深入探讨机器视觉在肺癌筛查中的应用,特别是如何利用大量数据来提高肺结节检测和良恶性判断的准确性。一、肺......
  • 01 序论(数据结构实战)
    计算机的发展与用途:早期的计算机:最初,计算机主要是用来进行数学运算,像是加减乘除这种“数值计算”。它们主要用在科学研究、工程计算等需要大量数字计算的领域。现在的计算机:现代的计算机用途广泛,已经不仅仅局限于处理数字。它们还处理许多其他类型的数据,比如文字、表格、图片......
  • 【数据库】详解MySQL数据库索引
    目录1.介绍2.索引概述2.1.优缺点3.索引结构3.1.B+Tree索引3.2.Hash索引4.索引分类5.索引语法5.1.创建索引5.2.查看索引5.3.删除索引6.SQL性能分析6.1.慢查询日志6.2.profile详情6.3.explain执行计划7.索引使用7.1索引使用原则7.1.1.最左前缀法则7.1.2.索引......
  • 基于深度学习的推荐系统构建:Movielens 数据集
    基于深度学习的推荐系统构建:Movielens数据集依赖环境代码语言:python3.11.5开发平台:pycharmtensorflow版本:2.18.0MovieLen1M数据及简介MovieLens1M数据集包含包含6000个用户在近4000部电影上的100万条评分,也包括电影元数据信息和用户属性信息。下载地址为:http://f......
  • 写了一个在线执行python的小工具,实现手机编写python代码后运行。
    为了初学者验证一些简单的python代码,写了一个小程序,能在线运行一些基础的python代码,还给了一些例子,后续会新增更多用例。简单首页后续更新其他基础知识在线编程页面里主要是一个输入框,和一些代码例子,点击即可自动导入,点击运行代码后,后端会执行相应运行。运行结果......