首页 > 其他分享 >【Pandas】pandas Series convert_dtypes

【Pandas】pandas Series convert_dtypes

时间:2024-12-27 10:29:44浏览次数:9  
标签:convert Series 数据类型 dtypes bool True Pandas

Pandas2.2 Series

Conversion

方法描述
Series.astype用于将Series对象的数据类型转换为指定类型的方法
Series.convert_dtypes用于将 Series 对象的数据类型智能地转换为最佳可能的数据类型的方法

pandas.Series.convert_dtypes

pandas.Series.convert_dtypes 方法是 Pandas 库中用于将 Series 对象的数据类型智能地转换为最佳可能的数据类型的方法。以下是对该方法的详细介绍,包括语法、参数、示例及结果。

一、语法
    def convert_dtypes(
        self,
        infer_objects: bool_t = True,
        convert_string: bool_t = True,
        convert_integer: bool_t = True,
        convert_boolean: bool_t = True,
        convert_floating: bool_t = True,
        dtype_backend: DtypeBackend = "numpy_nullable",
    ) -> Self:
        ...
参数
  • infer_objects:bool 类型,默认为 True。是否应将 object 数据类型转换为最佳可能的类型。
  • convert_string:bool 类型,默认为 True。是否应将 object 数据类型转换为 string[python] 类型(即 Pandas 的字符串扩展类型,支持空值 pd.NA)。
  • convert_integer:bool 类型,默认为 True。是否应将其转换为整数扩展类型(如 Int32, Int64 等)。
  • convert_boolean:bool 类型,默认为 True。是否应将 object 数据类型转换为布尔扩展类型(boolean)。
  • convert_floating:bool 类型,默认为 True。是否应将其转换为浮点扩展类型(如 Float32, Float64 等)。如果 convert_integer 也为 True,则如果可以将浮点数忠实地转换为整数,则将优先选择整数扩展类型。
  • dtype_backend:{‘numpy_nullable’, ‘pyarrow’},默认为 ‘numpy_nullable’。应用于结果数据帧的后端数据类型。‘numpy_nullable’ 返回支持 nullable-dtype 的数据帧(默认值),‘pyarrow’ 返回支持 nullable arrow-dtype 的 pyarrow-backed 数据帧。
返回值

返回一个新的 Series 对象,其中数据类型已经被转换为最佳可能的数据类型。

示例及结果

以下是一个使用 pandas.Series.convert_dtypes 方法的示例:

import pandas as pd
import numpy as np

s = pd.Series(["a", "b", np.nan])
# 使用 convert_dtypes 方法进行数据类型转换
s_converted = s.convert_dtypes()

# 打印转换前后的 Series 对象和数据类型
print("原始 Series 对象:")
print(s)
print("原始数据类型:")
print(s.dtypes)

print("\n转换后的 Series 对象:")
print(s_converted)
print("转换后的数据类型:")
print(s_converted.dtypes)

输出结果(根据 Pandas 版本和内部实现的不同可能有所差异):

原始 Series 对象:
0      a
1      b
2    NaN
dtype: object
原始数据类型:
object

转换后的 Series 对象:
0       a
1       b
2    <NA>
dtype: string
转换后的数据类型:
string

标签:convert,Series,数据类型,dtypes,bool,True,Pandas
From: https://blog.csdn.net/weixin_39648905/article/details/144760189

相关文章

  • pandas常用方法
    删:df2.dropna()df2.dropna(subset=['消费','姓名'])数据填充:df.fillna(0)填充0df.fillna({'客单价':666,'支付金额':df['支付金额'].min()})df.drop_duplicates()//去重删除所有行df.drop_duplicates(subset='流量级别')//从下往上删df.dr......
  • Python数据分析_Pandas_数据分析入门_3
    文章目录今日内容大纲介绍1.DataFrame-保存数据到文件2.DataFrame-读取文件数据3.DataFrame-数据分析入门4.DataFrame-分组聚合计算5.Pandas-基本绘图6.Pandas-常用排序方法7.Pandas案例-链家数据分析7.Pandas案例-链家数据分析_GIF_demo了解数据df1.info()df1.describ......
  • Pandas 知识点全攻略:数据处理与分析的必备指南
    一、Pandas简介定义Pandas是一个开源的、用于数据处理和分析的Python库。它建立在NumPy之上,提供了高效的数据结构和数据分析工具,使得在Python中处理和分析结构化数据变得更加容易。它主要有两个核心数据结构:Series和DataFrame。Series是一种类似于一维数组的数据结构,它可以......
  • pandas 数据库操作
    importpandasaspdfromsqlalchemyimportcreate_engine#username="root"password="@WSX3edc"host="127.0.0.1"port=3306database="test"engine=create_engine("mysql+pymysql://{username}:{password}@{hos......
  • 用pandas导入含嵌套字典的json文件至mysql数据库
    需要导入的文件格式如下,要把data-diff数组里的所有元素导进去,对于某些json文件还需要添加日期字段。{"rc":0, "rt":6, "data":{ "total":197, "diff":[ { "f1":1, "f2":295.5, "f3":{"f4":......
  • Pandas教程之三十七:使用Pandas数据可视化
    使用Pandas进行数据可视化使用Pandas进行数据可视化是以图形格式呈现数据。它通过以简单易懂的格式总结和呈现大量数据来帮助人们理解数据的重要性,并有助于清晰有效地传达信息。在本教程中,我们将探讨如何利用Pandas创建各种类型的图表,使您的数据分析更加直观和富有洞察力......
  • python pandas 优化内存占用(一)
            最近我用python处理excel,使用的是pandas库,我发现pandas库非常占用内存,一直想研究下如何优化pandas的内存占用,但一直没腾出空来,最近终于有时间研究一把了,我先把优化方法写上,如果你想了解更多的内容,可以看一下XX这篇文章,我优化的思路来源https://www.sohu.com......
  • 时间序列预测论文讲解-[ICLR 2024]TIMEMIXER: DECOMPOSABLE MULTISCALE MIXING FOR TI
    [ICLR2024]TIMEMIXER:DECOMPOSABLEMULTISCALEMIXINGFORTIMESERIESFORECASTING研究背景与动机模型和方法多尺度混合架构Past-Decomposable-Mixing(PDM)块Future-Multipredictor-Mixing(FMM)块代码思考参考文献:图片来源:代码来源:研究背景与动机现有方法的......
  • Pandas教程之三十五:XlsxWriter使用详解(2)
    Python|使用Pandas和XlsxWriter|集合–2PythonPandas是一个数据分析库。它可以读取、过滤和重新排列小型和大型数据集,并以包括Excel在内的多种格式输出它们。Pandas使用XlsxWriter模块写入Excel文件。XlsxWriter是一个用于以XLSX文件格式写入文件的Pyth......
  • 用pandas读取MRPC数据库时报错:pandas.errors.ParserError: Error tokenizing data. C
    读取的代码很简单,如下:data_path='MRPC/msr_paraphrase_test.txt'df=pd.read_csv(data_path,sep='\t',encoding='utf-8')困扰了一下午,最后本来不打算解决了。想着直接跳过错误,即:df=pd.read_csv(data_path,sep='\t',encoding='utf-8',on_......