首页 > 其他分享 >机器学习-线性回归-样本归一化处理-05

机器学习-线性回归-样本归一化处理-05

时间:2023-12-11 21:11:06浏览次数:33  
标签:theta2 scaler 05 样本 归一化 print data

目录

1. 为什么要对样本进行 归一化

样本之间的数量级是千差万别 有量纲的 例如:

theta1 >> theta2

数值小的 theta2 反而能快速的 收敛
数值大的 theta1 收敛较慢

出现 theta2 等待 theta1 收敛的情况

2. 归一化的方式一 最大最小值

min-max scaling

求出列的 最大值与最小值

import numpy as np
from sklearn.preprocessing import MinMaxScaler

scaler = MinMaxScaler()
data = np.array([1, 2, 3, 5, 5])

ret = scaler.fit_transform(data.reshape(-1, 1))
print(ret)

3. 归一化的方式二 标准归一化

样本数据映射到均值为0 方差为1 的标准正态分布上

from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
data = [[1], [2], [3], [5], [5001]]
scaler.fit(data)

print(scaler.mean_)
print(scaler.var_)

print(scaler.transform(data))

# 虽然 5001 是一个 坏样本  但是归一化之后也不会相差 太多

标签:theta2,scaler,05,样本,归一化,print,data
From: https://www.cnblogs.com/cavalier-chen/p/17895560.html

相关文章

  • 基于AidLux的工业视觉少样本缺陷检测实战
    1.引言工业视觉缺陷检测系统是一种利用计算机视觉技术,通过分析生产过程中的图像和视频数据,来检测工业产品是否存在缺陷或质量问题的系统。有幸参加Aidlux的11月份的训练营<<工业视觉少样本缺陷检测实战>>,在这个过程中我收获到了很多之前没有接触到的算法和实践。本次课程利用Unet......
  • 工业视觉少样本缺陷检测实战应用
    工业视觉少样本缺陷检测实战应用1.AidLux介绍AidLux能广泛应用在智能工业、AI教育、智慧人居、智慧城市、智慧物流、智慧交通、智慧零售和机器人等诸多场景中。集成国际主流AI框架和多种开发环境、后台服务程序、编译器及图形开发组件,无须配置开箱即用,极大地简化了开发步骤;自......
  • 定时器训练(UAV2101~UAV2105)
    例子001、51单片机定时器训练下面是一份基本的51定时器控制代码#include<reg52.h>//8051头文件//定义时钟频率为12MHz#defineFOSC12000000UL//定义波特率为9600#defineBAUDRATE9600//定义定时器重装值#defineTIMER_RELOAD_VALUE65535-50000+1sbitLE......
  • 0x80070570文件或目录损坏且无法读取解决方法
    第一种解决方法:命令提示符修复。1、首先按下“Win标+R”键,打开运行。 2、然后如果你要修复的文件在E盘,那就输入:chkdske:/f,h盘就是:chkdskh:/f,反正你是哪个盘就把中间的字幕改成那个盘的字符。 3、命令运行完成后会出现下面的代码,之后重新进入硬盘,就可以正常的打开了。......
  • 2023-2024-1 20231405《计算机基础与程序设计》第十一周学习总结
    2023-2024-120231405《计算机基础与程序设计》第十一周学习总结作业信息作业属于哪个课程https://edu.cnblogs.com/campus/besti/2023-2024-1-CFAP作业要求在哪里https://edu.cnblogs.com/campus/besti/2023-2024-1-CFAP/homework/13009作业的目标自学《......
  • 聚合支付项目-05
    4基础技术栈总结Nacos用来干什么?Nacos是阿里巴巴公司开源的项目,它用来实现配置中心和服务注册中心。什么是服务发现?在微服务架构中一个业务流程需要多个微服务通过网络接口调用完成业务处理,服务消费方从服务注册中心获取服务提供方的地址,从而进行远程调用,这个过程叫做服务发现。......
  • 7. 2023-11-20 12:29:32,542 [tornado.general :456 ][WARNING ][3052] Got events f
     这个警告表明Tornado检测到了有事件(events)被发送到一个已经关闭的流(stream)。在Tornado中,一个流代表一个请求或响应的数据流。这个警告可能意味着在请求处理的过程中,尝试向已经关闭的流发送了事件。可能的原因和解决方法:异步操作处理不当:在Tornado中,当你处理异步请求时,需......
  • 读程序员的README笔记05_日志、监控与配置
    1. 行为准则2. 日志分级2.1. 日志框架设有日志级别,它可以让运维人员根据重要性过滤消息2.2. 编程语言有精良的日志类库,让运维人员对要记录的内容和时间有更多的控制2.3. TRACE2.3.1. 一个极其精细的日志级别2.3.2. 对特定的包或类开放2.3.3. 在开发阶段之外很少......
  • 【scikit-learn基础】--『数据加载』之样本生成器
    除了内置的数据集,scikit-learn还提供了随机样本的生成器。通过这些生成器函数,可以生成具有特定特性和分布的随机数据集,以帮助进行机器学习算法的研究、测试和比较。目前,scikit-learn库(v1.3.0版)中有20个不同的生成样本的函数。本篇重点介绍其中几个具有代表性的函数。1.分类聚类......
  • 05_实验五_物理存储器与进程逻辑地址空间管理
    物理存储器与进程逻辑地址空间管理实验目的通过查看物理存储器的使用情况,并练习分配和回收物理内存,从而掌握物理存储器的管理方法。通过查看进程逻辑地址空间的使用情况,并练习分配和回收虚拟内存,从而掌握进程逻辑地址空间的管理方法。预备知识物理存储器的管理方式EOS......