• 2024-07-24检测 Pandas 列中特征漂移的矢量化方法是什么?
    我正在研究非常大的熊猫数据框,这些数据框保存具有显着特征漂移的时间序列。漂移通常是突然的(例如,特征将比之前几个时期大1.5-2.0倍)。我找到了几种检测“概念漂移”的解决方案。一种方便的选择是河流然而,该解决方案不是矢量化的。显然,矢量化方法要快得多-最
  • 2024-07-24创建具有标量特征和 N 维坐标向量特征的机器学习 Numpy 数组
    我正在尝试为ML程序格式化我的数据。有33,000个事件,每个事件有3个我想考虑的东西:质量、能量、坐标。质量的形状为(33000,),看起来像:[188.9189.0125.7...127.4201.0210.1]。能量也是(33000,)并且看起来相同:[123...8910]。然后,我还有一个形状为(33000,