标签:4.1 步骤 学习 3.2 3.1 2.3 机器 2.1 数据
1. 提出问题
2. 理解数据
2.1 数据清洗
2.2 导入数据
2.3 查看数据集信息
2.3.1 Describe() 描述统计信息
2.3.2 info() 发现缺失数据
3. 数据清洗
3.1 数据预处理
3.1.1 缺失值填充 fillna
3.1.2 删除缺失值 dropna
3.2 特征工程
3.2.1 特征提取
3.2.1.1 one-hot独热编码 (get_dummies)
3.2.1.2 map函数 (series)
3.2.2 特征选择
3.2.2.1 相关系数方法 corr()
4. 模型构建
4.1 训练数据和测试数据拆分
4.1.1 train_test_split
4.1.2 机器学习算法
4.1.2.1 sklearn
5. 模型评估
5.1 score
6. 方案实施
6.1 提交结果
6.2 分析报告撰写
标签:4.1,
步骤,
学习,
3.2,
3.1,
2.3,
机器,
2.1,
数据
From: https://www.cnblogs.com/fghjktgbijn/p/16894532.html