• 2024-02-0210个Pandas的高级技巧
    Pandas是我们最常用的数据处理Python库之一。尽管您可能已经与它共事多年,但可能还有许多您尚未探索的实用方法。我将向您展示一些可能未曾听说但在数据整理方面非常实用的方法。我目前日常使用的是pandas2.2.0,这是本文时可用的最新版本。https://avoid.overfit.cn/post/2baf15
  • 2023-12-16https://avoid.overfit.cn/post/979f42aebee34d8cab04bf591e58d782
    在本文中,我将介绍matplotlib一个非常有价值的用于管理子图的函数——subplot_mosaic()。如果你想处理多个图的,那么subplot_mosaic()将成为最佳解决方案。我们将用四个不同的图实现不同的布局。首先使用Importmatplotlib行导入必要的库。https://avoid.overfit.cn/post/979f42a
  • 2023-12-08https://avoid.overfit.cn/post/548ad625830a4645beba60a37a2b59d6
    本文从数据科学家的角度来研究检索增强生成(retrieve-augmentedGeneration,RAG)管道。讨论潜在的“超参数”,这些参数都可以通过实验来提高RAG管道的性能。与本文还将介绍可以应用的不同策略,这些策略虽然不是超参数,但对性能也会产生很大的影响。本文将介绍以下索引阶段的“超