首页 > 编程问答 >极地截去小数

极地截去小数

时间:2024-07-24 12:33:11浏览次数:4  
标签:python dataframe precision python-polars

我正在尝试将 DataFrame 中的浮点数截断为所需的小数位数。我发现这可以使用 Pandas 和 NumPy here 来完成,但我也发现使用 polars.Config.set_float_precision 也可以。

下面是我当前的方法,但我认为我可能会采取额外的措施。

import polars as pl

data = {
    "name": ["Alice", "Bob", "Charlie"],
    "grade": [90.23456, 80.98765, 85.12345],
}

df = pl.DataFrame(data)

(
    df
    # Convert to string
    .with_columns(
        pl.col("grade").map_elements(
            lambda x: f"{x:.5f}", 
            return_dtype=pl.String
        ).alias("formatted_grade")
    )
    # Slice to get desired decimals
    .with_columns(
        pl.col("formatted_grade").str.slice(0, length = 4)
    )
    # Convert back to Float
    .with_columns(
        pl.col("formatted_grade").cast(pl.Float64)
    )
)

你对使用 Polars 截断浮点数的小数位数想得太多了。虽然你的方法有效,但 Polars 提供了一种更直接的方法来实现这一点,而无需转换为字符串。

你可以使用 round() 函数或 .apply() round() 来实现。以下是如何操作的:

import polars as pl

data = {
    "name": ["Alice", "Bob", "Charlie"],
    "grade": [90.23456, 80.98765, 85.12345],
}

df = pl.DataFrame(data)

# 使用 round() 函数
df.with_columns(
    pl.col("grade").round(2).alias("rounded_grade")
)

# 或者使用 .apply() 和 round()
df.with_columns(
    pl.col("grade").apply(lambda x: round(x, 2)).alias("rounded_grade")
)

这两种方法都将“grade”列中的值四舍五入到小数点后两位。

让我们来分解一下为什么这种方法比你的初始方法更好:

  • 简洁性: 它需要更少的步骤,使你的代码更易于阅读和理解。
  • 效率: 在大型数据集上,直接处理数值类型通常比转换类型更快。

通常情况下,在 Polars 中,如果你正在寻找执行特定操作的方法,通常有一个简洁而高效的内置函数可以完成这项工作。在这种情况下, round() 函数被证明是截断浮点数小数位数的完美解决方案。

标签:python,dataframe,precision,python-polars
From: 78692959

相关文章

  • 【Dison夏令营 Day 28】用 Python 创建恐龙游戏
    谁没有玩过谷歌著名的“恐龙游戏”?也许每个人都玩过这个游戏。今天,在这篇文章中,我们将帮助你用Python开发一个恐龙游戏。本教程将深入讲解每一行代码,并提供参考资料。我们将尽力让读者详细、透彻地理解这个项目。Python版恐龙游戏的任务记录包括图片文档和Python资料......
  • Python 无法 pickle 自定义类型
    我正在尝试在ProcessPool中运行一个函数,该函数将通过读取python文件并运行生成的类中的方法来加载一些自定义类。我遇到的错误是TypeError:cannotpickle'generator'object该方法需要返回一个生成器。我该如何解决这个问题,谢谢。我用谷歌搜索但没有运气。......
  • python 语法无效?
    我试图编写一些Python代码,但由于某些奇怪的原因,它重复了无效的语法,我不知道最大的问题是什么。这些行是文件中唯一的代码行。Age=int(input("Howoldareyou?:"))ifAge>=18:print("YouareaAdult!")我尝试更改行,因为这似乎是我的生气,但它没有做任何帮......
  • 如何在Python的matplotlib中将条形标签绘制到右侧并为条形标签添加标题?
    我已经在python中的matplotlib中创建了一个图表,但是以下代码中的最后一行不允许在图表之外对齐条形标签。importmatplotlib.pyplotaspltg=df.plot.barh(x=name,y=days)g.set_title("Dayspeopleshowedup")g.bar_label(g.containers[0],label_type='edge')我得......
  • 19、Python之容器:快来数一数,24678?Counter能数得更好
    引言关于数据的分组计数,前面的文章中已经涉及了很多次。眼下要进行分组计数,我们可用的方法有:1、直接使用dict进行计数,需要对首次出现的键进行判断初始化的操作;2、使用dict的setdefault()方法进行计数,代码可以简化一些,虽然方法名有点怪;3、defaultdict进行计数,可以设置自动......
  • 如何使用 C# 检查用户是否安装了最低 Python 版本并且可以访问我的代码?
    我正在开发一个C#程序,该程序必须为一项特定任务运行一些Python代码。(Python代码很复杂,是由另一个团队开发的。无法在C#中重现其功能。)我正在尝试更新我的程序的安装程序文件以解决此问题:我希望它检查用户是否(谁正在安装我的程序)已安装Python并且它满足我的最低版......
  • 如何优雅地将复杂的Python对象和SQLAlchemy对象模型类结合起来?
    我有一个相当复杂的类,具有从提供的df到init计算的复杂属性,这些属性可能是最终可以序列化为字符串的其他类类型。在Python中,我想处理对象而不是原始类型,但也想使用SQLAlchemy与数据库交互。表中的列与许多类属性相同,如何优雅地组合这两个类?我可以使用组合并将数据......
  • Python Match Case:检查未知长度的可迭代内部的类型
    我想使用匹配大小写检查一个未知长度的迭代(假设为list)仅包含给定类型(假设为float)(还有其他情况,只有这个给我带来了问题)。case[*elems]ifall([isinstance(elem,float)foreleminelems]):returnnum这个似乎可行,但确实很不Pythony。看来应该有更简单的方法。......
  • Python实现excel数据的读取和写入
    1.安装说到前面的话,实现excel文件数据的读取和写入,在python中还有其它方法,比如说pandas。鉴于最近粉丝朋友问到上面的“xlrd”和“xlwt”,那么笔者下面将通过这两个方法,来实现excel文件数据的读取和写入。首先,我们先需要提前安装好对应的库。需要注意的是,xlrd从2.0版本开始,只......
  • python_进程与线程_多线程
    一、程序与进程的概念1、进程:指启动后的程序,系统会为进程分配内存空间二、创建进程的方式1、第一种创建进程的方式process(group=None,target,name,args,kwargs)group:表示分组,实际上不使用,默认为None即可target:表示子进程要执行的任务,支持函数名name:表示子进程的......