一、概述

pipeline实现了对特征处理与机器学习的封装流程化管理，期间处理的参数可以很方便的在测试集和未来数据上反复使用。

Pipeline都是执行各学习器中对应的方法，如果该学习器没有该方法，则报错
假设该pipeline有n个学习器
fit依次对前n-1的学习器执行fit和transform方法，并且对最后一个学习器执行fit方法
predict先对n-1学习器执行transform方法，然后执行最后一个学习器的predict方法
score先对n-1学习器执行transform方法，然后执行最后一个学习器的score方法

二、代码展示

from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import Ridge
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_boston
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import PolynomialFeatures
import warnings
warnings.filterwarnings("ignore")


X,y = load_boston(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=1)


pipe_lr = Pipeline([
    ('pf', PolynomialFeatures(degree=3,include_bias=False,interaction_only=False)),
    ('sc', StandardScaler()),
    ('clf', Ridge(alpha=0.8))])



# fit依次对前n-1的学习器执行fit和transform方法，并且对最后一个学习器执行fit方法
pipe_lr.fit(X_train, y_train)
# score依次对前n-1的学习器执行transform方法，并且对最后一个学习器执行score方法
print(f'Train score: {pipe_lr.score(X_train, y_train):.5%},Test score: {pipe_lr.score(X_test, y_test):.5%},')


#  pip实现的就是下面代码的功能

X,y = load_boston(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=1)

pf = PolynomialFeatures(degree=3,include_bias=False,interaction_only=False)
X_train = pf.fit_transform(X_train)
X_test = pf.transform(X_test)

sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

clf = Ridge(alpha=0.8)
clf.fit(X_train, y_train)
print(f'Train score: {clf.score(X_train, y_train):.5%},Test score: {clf.score(X_test, y_test):.5%},')

标签：Pipeline,score,fit,transform,工作,train,test,import
From： https://www.cnblogs.com/qianslup/p/16972565.html

SpringBoot 阅读源码之RandomValuePropertySource 是如何工作的
最近在极客时间上面学习丁雪丰老师的《玩转Spring全家桶》，看到一个在application.properties里面生成随机数的例子，觉得很厉害，带着崇拜的心情去阅读了一下Spring的源码，总......
HTTP工作原理、请求方法、请求/响应步骤、Request/Response示例
HTTP简单介绍HTTP是超文本传输协议，定义了客户端与服务器端之间文本传输的规范。HTTP默认使用80端口，这个端口指的是服务端的端口，而客户端使用的端口是动态分配的。当我们没有......
工作流管理系统参考模型简介
在阐述工作流引擎之前，我们来了解一下工作流技术的基本知识。早在几年前，为了建立工作流管理系统的相关标准，国际上成立了一个称为“工作流管理联盟”（简称WFMC）的国际组织。她提......
【小技巧】MATLAB中的使用Git的工作流程
Git集成已经成为MATLAB的一部分很长时间了。从R2021b开始，MATLABOnline也提供了对基本Git工作流的支持：可以clone,commit,pull,pushandfetchfiles到MATLABD......
Visual Studio的调试选项卡的工作目录和环境设置
https://blog.csdn.net/a_Treasure/article/details/83867465vs的“属性页”设置让初学者很是头疼，记录一下“配置属性”的“常规”和“调试”选项卡的设置方法。1.常规......
OS@页面置换算法@抖动@工作集
文章目录页面置换算法页面算法评价最佳置换算法OPT例先进先出算法FIFO最近最久未使用算法LRU时钟置换算法(CLOCK/NRU......
按行数拆分工作表
问题：300行数据，按行数拆分，每个工作表30行，共拆成10个工作表。解决：第一步，添加辅助列（I列），I1:I30中输入数字1 第二步，I31输入=I1+1，下拉至I300第三步，数据》拆分表格》工作表......
Transformers 库pipeline组件
目录pipeline组件基本用法pipeline组件基本用法Transformers库将目前的NLP任务归纳为以下几类：文本分类：例如情感分析、句子对关系判断等；对文本中的词语进行分类：例如词......
vue3项目，记录我是如何用1h实现产品预估1天工作量的界面需求
最近在编写前端界面，硬是一人一周时间加班加点写完了一个项目的前端界面（一级菜单有12个页面+一个控制台大屏，二三级界面有N个），之前预估前端界面的编写需要一个月，我是自己......
前端知识学习案例-浏览器得工作原理
......

Pipeline工作流

一、概述

二、代码展示

相关文章

赞助商

阅读排行