一、概述

1.1 为什么用网格搜索与交叉验证

在机器学习中，有大量的超参数需要指定；如果超参数指定不合适，则会出现过拟合和欠拟合。

而指定超参数，一种方法是凭经验；一种方法是穷举。

网格搜索可以尝试制定的每一种超参数，表现最好的参数就是最终的结果。但是比较耗时。

二、网格搜索

2.1 estimator中未嵌套estimator

类似笛卡尔积一样，将所有参数进行组合一遍。

import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import GridSearchCV


'''
制作样本数据，产生的结果为一个简单的样本数据集，用于可视化聚类算法和分类算法
1. n_samples : 整数型, 可选，默认为100 总的产生的样本点的数量
2. shuffle : 布尔型，可选填 (默认为True) 是否对样本进行重新洗牌
3. noise : 浮点型 or None型 (默认为None) 加到数据里面的高斯噪声的标准差
'''

X, y = datasets.make_moons(n_samples=1000, shuffle=True, noise=0.3, random_state=2)

plt.scatter(X[y == 0, 0], X[y == 0, 1])
plt.scatter(X[y == 1, 0], X[y == 1, 1])
# plt.show()
# 划分数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=2)


dt_clf = DecisionTreeClassifier()
para_grid = {'max_depth': [3, 4, 5, 6],'min_samples_leaf': [2, 3, 4, 5, 6],'random_state': [2]}
gc = GridSearchCV(estimator=dt_clf, param_grid=para_grid, cv=3)
gc.fit(X_train, y_train)

print(gc.best_params_)
print(gc.best_score_)

以上面的决策树为例，超参数有：

para_grid = {'max_depth': [3, 4, 5, 6],'min_samples_leaf': [2, 3, 4, 5, 6],'random_state': [2]}

max_depth有4个参数

min_samples_leaf有5个参数

random_state有1个参数。

那么就有4*5*1=20中组合方式。

会对着20中组合分别进行训练求解，然后算出最优的解。

2.1 estimator中嵌套estimator

import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.ensemble import BaggingClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import GridSearchCV

X, y = datasets.make_moons(n_samples=1000, shuffle=True, noise=0.3, random_state=2)
plt.scatter(X[y == 0, 0], X[y == 0, 1])
plt.scatter(X[y == 1, 0], X[y == 1, 1])
# plt.show()
# 划分数据
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=2)
# 注意参数书写模式，带base_estimator__是DecisionTreeClassifier()，不带base_estimator__是GridSearchCV()参数
param_grid = {'base_estimator__max_depth': [3, 4], 'base_estimator__min_samples_leaf': [2, 3],
              'base_estimator__random_state': [2], 'n_estimators':[50,100,150,200]}

dt_clf = DecisionTreeClassifier()
gc_clf = GridSearchCV(BaggingClassifier(DecisionTreeClassifier()),param_grid=param_grid)
gc_clf.fit(X_train, y_train)
print(f'最佳模型与最优参数:{gc_clf.best_estimator_}')
print(f'最佳分数：{gc_clf.best_score_}')

BaggingClassifier(DecisionTreeClassifier()) BaggingClassifier中嵌套了DecisionTreeClassifier，那么param_grid中就需要指出两种参数的不同，

带base_estimator__是DecisionTreeClassifier()，不带base_estimator__是GridSearchCV()参数

三、交叉验证

gc = GridSearchCV(estimator=dt_clf, param_grid=para_grid, cv=3)

参数cv即为折数。

四、参数

五、常用属性

标签：交叉,验证,网格,train,grid,estimator,test,import,参数
From： https://www.cnblogs.com/qianslup/p/16972367.html

java验证码组件Jcaptcha
Jcaptcha验证码生成组件用法1.创建项目JcaptchaDemo2.引入相关.jar文件jcaptcha-1.0-all.jar；commons-logging-1.0.4.jar；commons-collections-2.1.1.jar3.创建GMailEngine，仿......
通过requests登录店小秘解决验证码问题
登录常用手段就是:request.post请求selenium等自动化工具这里讲一下使用requests实现自动登录网站现在网站登录基本上都有验证码，requests登录的难点在于将验证码......
通过requests登录店小秘ERP解决验证码问题
登录常用手段就是:request.post请求selenium等自动化工具这里讲一下使用requests实现自动登录现在网站登录基本上都有验证码，requests登录的难点在于将验证码与账......
微软出品自动化神器【Playwright+Java】系列（七）之元素的可操作性验证
前言昨天在某平台发表了一篇这系列的文章，结果不但提示说有违禁词（java也算？），然后文章审核通过后，文章还找不到，不到去哪了，表示很郁闷，去反应未果，确实有点尴尬了。元素的可操作性......
微软出品自动化神器【Playwright+Java】系列（七）之元素的可操作性验证
前言昨天在某平台发表了一篇这系列的文章，结果不但提示说有违禁词（java也算？），然后文章审核通过后，文章还找不到，不到去哪了，表示很郁闷，去反应未果，确实有点尴尬了。元素的可操作......
损失函数：均方误和交叉熵，激活函数的作用
损失函数通过损失函数求解进行模型评估损失函数（lossfunction）或代价函数（costfunction）是将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损......
Selenium21--验证码测试
验证码简介有些网站需要验证码通过后方可进入网页,目的很简单,就是区分是自然人访问还是计算机程序访问。验证码：简称为captcha一种随机生成的信息（数字、字母、汉字、......
(Matlab)基于网格搜素优化的支持向量机实现电力负荷预测
目录摘要：1.支持向量机介绍及核函数选取：(1)支持向量机(SupportVectorMachine,SVM)(2)支持向量机的核函数选取2.SVM构建与网格搜索优......
.NET 6 实现滑动验证码（五）、验证码设置与缓存
这一节，我们在Constant目录中，定义两个类CaptchaOptions.cs与CaptchaTypeConstant。目的是设置验证码的类型与其他一些属性。然后在Storage目录中，设置验证码的缓存数据。上......
验证码案列的代码实现和细节处理
代码实现：login.jsp<%@pagecontentType="text/html;charset=UTF-8"language="java"%><html><head><title>login</title><script>window.onload......

交叉验证与网格搜索

一、概述

1.1 为什么用网格搜索与交叉验证

二、网格搜索

2.1 estimator中未嵌套estimator

2.1 estimator中嵌套estimator

三、交叉验证

四、参数

五、常用属性

相关文章

赞助商

阅读排行

交叉验证与网格搜索

一、概述

1.1 为什么用网格搜索与交叉验证

二、 网格搜索

2.1 estimator中未嵌套estimator

2.1 estimator中嵌套estimator

三、 交叉验证

四、参数

五、常用属性

相关文章

赞助商

阅读排行

二、网格搜索

三、交叉验证