scikit-learn入门级学习_day1

时间：2023-02-14 14:22:19浏览次数：55

标签：iris data scikit day1 names learn 数据

安装

法1: 在终端输入

pip install scikit-learn

补充：

pip uninstall scikit-learn #卸载 
pip install -U scikit-learn #升级

法2: Anaconda环境下，可以使用conda

conda install scimitar-learn

简介

scikit-learn是基于python语言的机器学习库，广泛应用于数据统计分析和机器学习建模等数据科学领域。它具有各种分类，回归和聚类算法，包括支持向量机，随机森林，梯度提升，k均值和DBSCAN，可以实现数据预处理、分类、回归、降维、模型选择等常用的机器学习算法, Scikit-learn与许多其他Python库很好地集成在一起，例如matplotlib和plotly用于绘图，NumPy用于数组矢量化，pandas 数据帧，SciPy等。

六个任务模块和一个引入模块

有监督学习的分类任务
有监督学习的回归任务
无监督学习的聚类任务
无监督学习的数据降维任务
数据预处理任务
模型选择任务
数据引入

具体流程

自带数据集

引入数据集的方法

小数据：load_dataname()

大数据：fetch_dataname()

构造随机数据：make_dataname()

#引入数据法一
from sklearn import datasets
iris=datasets.load_iris()
iris.keys()

#法二
from sklearn.datasets import load_iris
iris=load_iris()
iris.keys()

iris.target_names

键里的名词解释

data：特征值 (数组)

target：标签值 (数组)

target_names：标签 (列表)

DESCR：数据集描述

feature_names：特征 (列表)

filename：iris.csv 文件路径

将数据集转化成DataFrame

import pandas as pd
iris_data = pd.DataFrame(iris.data,columns=iris.feature_names)#feature_name:特征列表
iris_data['species'] = iris.target_names[iris.target]
iris_data.head(5).append(iris_data.tail(5))

可视化seaborn

import seaborn as sns
sns.pairplot(iris_data, hue='species', palette='husl')

标签：iris,data,scikit,day1,names,learn,数据
From： https://www.cnblogs.com/tingcc/p/17119015.html

联邦学习论文阅读笔记08 A Survey of Incentive Mechanism Design for Federated Lear
问题：现有联邦学习研究集中在提高模型精度和完成时间-------准确率与效率，即又快又好。然而实际中客户不愿意投入到无回报的FL中。 1前言：机器学习的......
决战圣地玛丽乔亚Day10--kafka学习
概念上kafka和RocketMQ的结构很类似。除了Broker、Producer、Consumer、Topic。多了一个分区的概念Partition。对于NameServer的概念，kafka用的是zookeeper来保存信息。包......
算法随想Day11【栈与队列】| LC239-滑动窗口最大值、LC347-前 K 个高频元素
LC239.滑动窗口最大值思路分析：1、暴力出奇迹，对n个元素各遍历k次，记录最大值，复杂度O(n*k)2、如果存在一种数据结构，能模拟滑动串口，且能提供pop()、push()、getMaxValue(......
「考试总结」2023-02-13 联合省选模拟赛 – Day1
爆搜$\texttt{(dfs)}$$\texttt{Statement}$给定一个$n$个点$m$条边的简单无向图，你需要对所有匹配$S$，把$c^{|S|}$求和，其中$|S|$是匹配......
《分布式技术原理与算法解析》学习笔记Day10
调度框架：单体调度什么是调度？分布式系统架构的目的是将多个服务器资源管理起来，对外提供服务。调度是指为用户任务寻找合适的服务器的过程，它是分布式系统中一个非常重要的......
深度强化学习 Deep Reinforcement Learning（DRL））
深度强化学习(DeepReinforcement Learning，DRL)本质上属于采用神经网络作为值函数估计器的一类方法，其主要优势在于它能够利用深度神经网络对状态特征进行自动抽取，避免了人......
代码随想录算法训练营Day12 栈与队列
代码随想录算法训练营代码随想录算法训练营Day12栈与队列|239.滑动窗口最大值 347.前K个高频元素总结239.滑动窗口最大值给定一个数组nums，有一个大小为 k......
代码随想录算法训练营Day12 栈与队列
代码随想录算法训练营代码随想录算法训练营Day12栈与队列|239.滑动窗口最大值 347.前K个高频元素总结239.滑动窗口最大值给定一个数组nums，有一个大小为 k......
联邦学习论文阅读笔记07 Collaborative Fairness in Federated Learning
这篇论文提出CFFL框架，根据参与者的声誉收敛到不同模型，实现联邦学习公平协作参考笔记：https://zhuanlan.zhihu.com/p/600343559 ......
联邦学习论文阅读笔记06 Fair Resource Allocation in Federated Learning
参考链接：https://www.zhihu.com/people/hidisan/posts 本文提出q-FFL优化算法，在模型准确率不变的情况下，引入q参数化的权重，使损失大的参与者权重更......

scikit-learn入门级学习_day1

相关文章

赞助商

阅读排行