机器学习 day1

时间：2023-05-27 17:34:32浏览次数：35

标签：lf 机器 day1 学习 preprocessing print import data axis

import pandas as pd
import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
import seaborn as sns

#data = np.array([[3, -1.5, 2, -5.4], [0, 4, -0.3, 2.1], [1, 3.3, -1.9, -4.3]])
#对数据的预处理 求均值 标准差 标准化
'''   
print(data)
print("Mean: ",data.mean(axis = 0))  #main函数用于返回 算数平均数
#axis声明了函数计算所作用的数据轴 (0表示列， 1表示行)
print("Standard Deviation: ",data.std(axis = 0))  #std用于返回标准差
data_standardized = preprocessing.scale(data)
#scale 函数对数据进行标准化操作 即:以均值为中心点，并调整大小得到单位方差
print("Mean: ",data_standardized.mean(axis = 0))
print("Standard Deviation: ",data_standardized.std(axis = 0))
'''
#数据缩放
#先看看未缩放前:
'''
print("Min: ", data.min(axis = 0))
print("Max: ", data.max(axis = 0))
data_scaler = preprocessing.MinMaxScaler(feature_range = (0, 1))
data_scaled = data_scaler.fit_transform(data)
#这里是缩放之后的:
print("Min: ", data_scaled.min(axis = 0))
print("Max: ", data_scaled.max(axis = 0))
print(data_scaled)
'''
#归一化(失败了)
'''
data_normalized = preprocessing.normalize(data, axis = 0)
#书上代码是这样 但这样会报错……
data_normalized = preprocessing.normalize(data, norm = '11', axis = 0)
print(data_normalized)
#校验数组各列数据总和是否为1
data_norm_abs = np.abs(data_normalized)
print(data_norm_abs.sum(axis = 0))
'''
#二值化(用于数字图像处理领域)
'''
data_binarized = preprocessing.Binarizer(threshold = 1.4).transform(data)
print(data_binarized)
'''
#one-hot编码(用于稀疏的数据)
'''
data = np.array([[1, 1, 2], [0, 2, 3], [1, 0, 1], [0, 1, 0]])
print(data)
encoder = preprocessing.OneHotEncoder()
encoder.fit(data)
encoded_vector = encoder.transform([[1, 2, 3]]).toarray()
print(encoded_vector)
'''
#读取csv后缀的文件
'''
data = pd.read_csv('VehiclesItaly.csv')
data.head()
data.info()

x = data[['x']]
y = data[['y']]

lf = LinearRegression()
lf.fit(x,y)
print(lf.coef_)
print(lf.intercept_)

pred = pd.DataFrame(lf.predict(x))
print(pred.columns.values)
sns.relplot(x='x',y='y',data=data)
sns.lineplot(x=data['x'],y=pred[0])
'''

标签：lf,机器,day1,学习,preprocessing,print,import,data,axis
From： https://www.cnblogs.com/fighting-huihui/p/17437066.html

SVN 学习笔记
SVN简介和安装SVN是什么？代码版本管理工具它能记住你每次的修改恢复到任何历史版本恢复已经删除的文件SVN跟Git相比，有什么优势？使用简单，上手快目录级权限控制，企业安全必备子目录Checkout，减少不必要的文件检出SVN主要应用开发人员用来做代码的版本管理用来存储一......
SA后缀数组学习笔记
什么是后缀数组后缀数组主要是用来处理字符串的，分为两种方法：倍增法以及DC3，但由于倍增法通俗易懂，码量小，常数小，所以今天这篇文章我就只介绍倍增法（不可能是因为我不会DC3）前缀知识No.1基数排序跟桶排序差不了多少，思想就是：将整数按位数切割成不同的数字，然后按每个位数分别比较。......
花朵识别系统Python实现，基于深度学习卷积神经网络算法
一、背景花朵识别系统，基于Python实现，深度学习卷积神经网络，通过TensorFlow搭建卷积神经网络算法模型，并对数据集进行训练最后得到训练好的模型文件，并基于Django搭建可视化操作平台。在当今信息化社会，图像识别技术在各种领域都展现出了重要的应用价值，包括医学影像分析、自动驾驶、人脸......
Git 学习笔记
笔记来源视频链接：黑马程序员Git全套教程，完整的git项目管理工具教程，一套精通git_哔哩哔哩_bilibiliGit基础命令操作（本地仓库）配置用户名和Email右键打开GitBash：gitconfig--globaluser.name"用户名"gitconfig--globaluser.email"邮箱地址"Git结构1.创建本地......
最小生成树学习笔记
什么是最小生成树一个图中可能存在多条相连的边,我们从一个图中挑出一些边生成一棵树（树就是指一个无向连通图不包含回路(连通图中不存在环)）。这仅仅是生成一棵树,还未满足最小,当图中每条边都存在权重时,这时候我们从图中生成一棵树(n-1条边)时,生成这棵树的总代价就是每条边......
Lupin的linux学习路（ubuntu)
Lupin的linux的学习路（Ubuntu)安装Ubuntu双系统制做一个系统引导u盘（到Ubuntu官网下载镜像，使用rufus镜像写入软件将镜像写入到u盘中,写入成功后，引导u盘制做完成）。在Windows系统中分出200G的空余磁盘空间安装Ubuntu系统。电脑关机，插上引导u盘，进入电脑引导选项，进入Ubuntu安......
markdown学习
一级标题阿打算二级标题三级标题四级标题字体helloworldhelloworld~helloworld~helloworld引用引用内容1111分割线列表列表1列表2列表四列表列表列表列表列表第一第二tasktasktask制表符tables项目价格数量计算器12......
人工智能导论——机器人自动走迷宫&强化学习
一、问题重述强化学习是机器学习中重要的学习方法之一，与监督学习和非监督学习不同，强化学习并不依赖于数据，并不是数据驱动的学习方法，其旨在与发挥智能体(Agent)的主观能动性，在当前的状态(state)下，通过与环境的交互，通过对应的策略，采用对应的行动(action)，获得一定的奖赏(reward)......
基于GoogleNet深度学习网络的人员身份识别系统Matlab仿真
1.算法仿真效果matlab2022a仿真结果如下： 2.算法涉及理论知识概要深度学习（DL，DeepLearning）是机器学习（ML，MachineLearning）领域中一个新的研究方向，它被引入机器学习使其更接近于最初的目标——人工智能（AI，ArtificialIntelligence）。[1深度学习是学习样本数据......
基于GoogleNet深度学习网络的人员身份识别系统Matlab仿真
1.算法仿真效果matlab2022a仿真结果如下：2.算法涉及理论知识概要深度学习（DL，DeepLearning）是机器学习（ML，MachineLearning）领域中一个新的研究方向，它被引入机器学习使其更接近于最初的目标——人工智能（AI，ArtificialIntelligence）。[1深度学习是学习样本数据的内在规律和表示层次，这......

机器学习 day1

相关文章

赞助商

阅读排行