• 2024-08-17Polars简明基础教程十二:可视化(二)
     设置绘图后端我们可以使用hv.extension更改绘图后端。但是,我们不在此处运行此单元格,因为它会导致下面的Matplotlib/Seaborn图表无法渲染。注释:hvPlot利用HoloViews库来构建图表,并且可以使用多个后端进行渲染,包括Bokeh(默认)和Matplotlib。hv.extension是一个函数
  • 2024-08-17Polars简明基础教程十三:可视化(三)
     (示例中用到的csv数据文件可在CSDN免费下载:“泰坦尼克号生还者数据集”):importpolarsasplimporthvplotashvimportmatplotlib.pyplotaspltimportseabornassnsimportplotly.expressaspximportaltairasaltimportvegafusionasvfcsv_file=r"..\da
  • 2024-08-15Polars简明基础教程七:Series 和 DataFrame 以及它们之间的转换_A
    在听完这次讲座之后,您将能够:初步认识Series和DataFrame的一些特性。在Series和DataFrame列之间进行转换。在Python的lists(列表)、dicts(字典)与Series和DataFrames之间来回转换。Series在Polars中,Series是一个非常重要的数据结构,它类似于NumPy的数组或Pa
  • 2024-08-15Polars简明基础教程八:Series 和 DataFrame 以及它们之间的转换_B
    在Series和DataFrame列之间进行转换我们先使用方括号从DataFrame的列中创建一个Series(    df["age"]    .head(3))请注意,Series有一个名称(age)和一个数据类型(64位浮点数)。我们还可以使用to_series从单列的DataFrame中创建一个Series(我们将在本课程的下一节中
  • 2024-07-21从 Pandas 到 Polars 二十三:如果你的数据已经排序,Polars可以为你提供助力
    Polars针对处理已排序的数据进行了优化。要访问这些优化,你需要使用set_sorted标志告诉Polars数据已经排序。set_sorted主要用于以下两种情况:标记单个或多个列已排序:当你知道DataFrame的某个或某些列是按升序或降序排列时,你可以使用set_sorted来标记这些列。这将告诉P
  • 2024-07-19从 Pandas 到 Polars 十八:数据科学 2025,对未来几年内数据科学领域发展的预测或展望
    我在2021年底开始使用Polars和DuckDB。我立刻意识到这些库很快就会成为数据科学生态系统的核心。自那时起,这些库的受欢迎程度呈指数级增长。在这篇文章中,我做出了一些关于未来几年数据科学领域的发展方向和原因的预测。这篇文章旨在检验我的预测能力。但我也写这篇文章是为
  • 2024-07-13从 Pandas 到 Polars 十四:在Polars中拟合线性模型
    ​线性模型是数据科学和机器学习的基石。它们易于理解且拟合速度快。有了这个出色的新Polars插件,你现在可以直接在Polars中拟合线性模型,包括Lasso回归和Ridge回归。这项工作是由AmzyRajab在这个github仓库中完成的。如果你想跟着学习,第一步是安装这个插件。你可以通过以下命
  • 2024-07-05从Pandas到Polars
    这里展示了如何将一些熟悉的Pandas命令转换为Polars。另外也介绍Pandas和Polars之间一些根本区别。在以下示例中,将Polarsv0.20.10与Pandasv2.2.0进行比较。首先在Polars中创建一个样本数据集importpolarsasplimportpolars.selectorsascsimportpandasaspdim