• 2023-08-25总结
    1.针对"common_ts"的数据处理:common_ts是“时间戳”格式的特征列信息,挖掘数据语义:①拆分:针对年、月、日等更小的时间梯度进行新的特征划分,并将其加入特征内部;②挖掘数据内涵:时间信息是否具备更深层、更实际的时间语义:如:时间戳数据是否集中在特定的星期几;③连续性特
  • 2023-08-25AI学习——新增用户预测
    总结这次是最后一次打卡了进行一个总结本次内容为梳理与最后的automl部分本次比赛过程我使用了决策树随机森林lgbxgbcatboostautoml进行训练最终决策树到达分数——》0.79automl到达分数——》0.79lgbxgbcatboost到达分数——》0.63随机森林由于调参问题只能到达可怜的0.
  • 2023-08-18机器学习实践:用户新增预测
    开始分析根据海量的应用数据作为训练样本,基于提供的样本构建模型,预测用户的新增情况。赛题数据由约62万条训练集、20万条测试集数据组成,共包含13个字段。其中uuid为样本唯一标识,eid为访问行为ID,udmap为行为属性,其中的key1到key9表示不同的行为属性,如项目名、项目id等相关字段,common