机器学习上分技巧
内容解析
subtask是并列的,并且取最优,那么只需要针对最优进行优化
转化为回归问题是否会更加准确
数据分析和特征工程是非常关键的部分
数据探索性分析(EDA):
- 数据集大小,字段类型
- 缺失值情况
- 特征是否冗余
- 是否存在时间信息
- 标签的分布
- 训练集测试集的分布
- 单变量/多变量分布
特征工程
- 过滤法
- 封装法
- 嵌入法
模型融合
交叉
权重选择
标签:特征,笔记,直播,Datawhale,20230805,最优 From: https://www.cnblogs.com/zzqdeco/p/20230805-datawhale-di-yi-ci-zhi-bo-bi-ji.html