1.转换器
**想一下之前做的特征工程的步骤?
1、实例化 (实例化的是一个转换器类(Transformer))
2、调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)
**
标准化:
(x-mean)/std
fit_transform()
fit() 计算每一列的平均值
transform() (x-mean)/std 进行最终的转换
我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式
fit_transform
fit
transform
2.估计器
在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
1、用于分类的估计器:
sklearn.neighbors k-近邻算法
sklearn.naive_bayes 贝叶斯
sklearn.linear_model.LogisticRegression 逻辑回归
sklearn.tree 决策树与随机森林
2、用于回归的估计器:
sklearn.linear_model.LinearRegression 线性回归
sklearn.linear_model.Ridge 岭回归
3、用于无监督学习的估计器
sklearn.cluster.KMeans 聚类
通用流程:
预估器(estimator)
1.实例化一个estimator
2.estimator.fit(x_train,y_train) 计算
--调用完毕,模型生成
3.模型评估:
1)直接比对真实值和预测值
y_predict=estimator.predict(x_test)#测试集
y_test== y_predict
2)计算准确率
accuracy=estimator.score(x_test,y_test)
工作流程