首页 > 其他分享 >Scikit-learn

Scikit-learn

时间:2022-11-22 13:31:51浏览次数:41  
标签:填充 特征 Scikit 算法 learn 文本 数据 预处理


Scikit-learn_导包

Scikit-learn_数据预处理_02

项目过程

​导包——加载数据——数据预处理——选择算法训练数据——测试数据——将测试结果导入.csv中​

Scikit-learn_数据预处理_03

数据预处理

  • 删除无关特征:如用户ID,训练集和测试集都要删除
  • 将文本数据进行数值化:数据包含很多文本信息,需要将其转换成模型需要的类型
  • 填充缺失值:unknown样本需要填充
  • 进行特征与预测结果的探索性分析:查看各个特征对最后的预测结果影响,进而对特征进行选择

算法选择

二分类算法包括:逻辑回归、SVM、KNN、决策树、集成方法

集成方法精度更高,在此基础上可以研究GBDT,XGBoost,LightGBM等方法,或者深度学习

Scikit-learn_Scikit-learn_04


标签:填充,特征,Scikit,算法,learn,文本,数据,预处理
From: https://blog.51cto.com/u_13875041/5877871

相关文章