首页 > 其他分享 >吴恩达机器学习

吴恩达机器学习

时间:2024-04-10 10:24:36浏览次数:21  
标签:吴恩达 机器 函数 回归 逻辑 学习 正则 拟合 代价

吴恩达机器学习-第三周

学习视频参考b站:吴恩达机器学习
本文是参照视频学习的随手笔记,便于后续回顾

分类(Classification)

分类回顾

输出结果y能分为两大类true or false
image

线性回归并不适合分类

癌症探测: 线性函数所得结果值大于0.5判定为yes,小于0.5判定为no(蓝色线)
若但在右侧多加一个数据,会导致决策边界(Decision Boundary)右移,预测的不准确(绿色线)
image

逻辑回归(Logistic Regression -- for Classification!)

用到下图的sigmoid函数(逻辑函数logistic function),得到0~1之间的阈值,来分类
z是横坐标,z=wx(向量) + b
image
image
癌症探测模型及式子的一些解释:
右边式子意思为,输入为x,参数为w,b时,y为1的可能性值
image

决策边界(Decision Boundary--z=wx(向量) + b = 0

设计一个阈值(threshold)来分类,判定是1还是0,一步一步推,到最后发现wx+b>=0,那么y=1,反之y=0
image

非线性决策边界(Non-linear decision boundaries)

两个输入时,如下图,在决策边界左边y为0,右边y为1
image
或者如下图决策边界为圆,在圆外时y为1,圆内为0,等等其他函数
image
image

逻辑回归中的代价函数(Cost Function for logistic Regression

逻辑回购模型示例:
image

平方误差成本函数不是很适合逻辑回归

线性回归所用的损失函数不是很适合逻辑回归,会导致出现很多局部最小值,是非凸函数
image

逻辑损失函数(Logistic loss function)

log函数只取到了定义域0~1之间的值
当y为1时,如果函数f的值越接近1说明损失越小越接近0说明损失越大
image
当y为0时,如果函数f的值越接近0说明损失越小越接近1说明损失越大
示例:如果模型预测有99.9%的概率是恶性的,但事实上不是,就会用非常高的损失值惩罚模型
image

简化代价函数(Simplified Cost Function)

通过标签值为1或0来选择用哪个损失函数(方框内为简化损失函数)
image

得到逻辑归回的代价函数

image

逻辑回归实现梯度下降(Gradient Descent Implementation

准备逻辑回归函数,然后训练获得所对应标签的概率,像是y=1的概率
image
通过代价函数,递归w,b参数,实现梯度下降
image
可以通过之前讲过的方法判断函数是否收敛、矢量化和特征放缩(具体见第二周随笔
image

过拟合(The Problem of Overfitting)

什么是过拟合

房价预估模型:
使用一个特征值输入(图一),导致欠拟合(Underfit),具有高偏差(high bias)
使用两个特征值输入(图二),比较适合模型,恰到好处(just right)
使用四个特征值输入(图三),完美通过所有训练集,但是导致过拟合(Overfit),具有高方差(high variance)
image

分类的过拟合

如下图示例欠拟合(图一),适合(图二),过拟合(图三)
image

如何解决过拟合(Addressing Overfitting)

Method1: 使用更大的数据集来训练模型(可能实际并没有这么多数据,而且花费时间长,所以不总是合适的)
image
Method2: 使用更少的特征输入来训练模型
缺点:会丢弃一些信息(之后会讲其他方法解决这个问题)
image
Method3: 正则化(Regularization),通过使参数值接近于0来使参数对模型的影响不是那么大
也可以正则化b,但没太大区别
image
总结
image

使用正则化的代价函数(Cost Function with Regularization

如下图,如果想降低w3和w4的影响,就给代价函数中加w3和w4,并且乘一个很大的系数,这样就会导致代价函数很大来惩罚模型,然后w3,w4参数就会变很小,然后对代价函数中w3,w4乘系数这个部分的值就会变小,影响也变小
简述: 想不要哪个参数就给他乘一个很大的数,然后这个参数就会变很小,然后对代价函数的影响也会变小(一步一步迭代逐渐影响变小)
image
通常你不知道惩罚哪一个参数,所以一般所有参数都惩罚,引入正则化参数λ
一般也不会惩罚b,没什么区别
image
正则化参数λ取不同值的区别
λ为0时过拟合,λ为很大时欠拟合
image

用于线性回归的正则化方法(Regularization Linear Regression

image
正则化的具体工作原理:像是下面的wj(1-α*λ/m),wj每次都乘一个小于1的数,这就起到wj的收缩作用(shrink)
image

用于逻辑回归的正则化方法(Regularization Logistic Regression

逻辑回归的代价函数
image
逻辑回归的梯度下降
image

Summary

这周主要学习了以下内容:
1.线性回归不适合分类,引入了逻辑回归和sigmoid函数(for Classification)
2.决策边界是什么,线性决策边界(不适合分类)和非线性决策边界(适合分类)
3.逻辑回归中的代价函数,线性回归的平方误差成本函数不适合回归--->逻辑损失函数(Loss Function)
4.逻辑回归实现梯度下降
5.欠拟合、过拟合是什么,=解决过拟合的三种方法==
6.具体说明正则化方法,使用正则化的代价函数,和分别用于线性回归逻辑回归的正则化方法

标签:吴恩达,机器,函数,回归,逻辑,学习,正则,拟合,代价
From: https://www.cnblogs.com/Mmbhcyt/p/18122819

相关文章

  • 20240410sql查询学习_1
    需求:查看合同信息表里面有多少合同编号是重复的SELECT合同编号,COUNT(*)FROM合同信息表GROUPBY合同编号HAVINGCOUNT(*)>1;结果:数量太多需求:列数太多,怎样看具体有多少个SELECTCOUNT(*)AStotalFROM(SELECT合同编号,COUNT(*)ASduplicate_count......
  • 论文解读:吴恩达来信AI Agent技巧—利用自我反馈的迭代细化技术
    《自我完善:利用自我反馈的迭代细化技术》https://arxiv.org/pdf/2303.17651.pdf摘要Largelanguagemodels(LLMs)经常无法在一次尝试中生成最佳输出。受人类在修改书面文本时所表现出的迭代精炼过程的启发,我们提出了SELF-REFINE,一种通过迭代反馈和精炼来改进大型语言模......
  • 打造个性化聊天机器人:用Ollama和Open WebUI搭建你的私有ChatGPT!
    一简介Ollama官网:https://github.com/ollama/ollamaOllama是一个开源的人工智能(AI)和机器学习(ML)工具平台,特别设计用于简化大型语言模型(LLM)的部署和使用流程。用户可以通过Ollama在本地环境中便捷地运行各种大型语言模型,比如Llama2和其他开源模型。该工具的主要优势和特......
  • OneFlow深度学习框架介绍
    OneFlow深度学习框架介绍OneFlow是一个高性能、易用的深度学习框架,由中国初创公司OneFlow开发。它旨在提供一个统一的深度学习平台,支持各种不同的硬件和部署环境。OneFlow的主要特点高性能:OneFlow采用了独特的设计,可以充分利用现代硬件的计算能力,实现高效的并行计......
  • CAD学习日志-005
    自学过程很苦恼,遇到什么问题都要去搜索,生怕自己误入歧途,求解有什么学习的心态。以下是一些摸索的很基础很常见的一些操作。一、CAD图案填充1.英文输入法下H+空格出现图案填充界面如下;2.选好填充样式,然后直接选拾取点过去会出现一片白,如下;3.但是放大后,还是可以看出图案的,......
  • 模型压缩与部署-书生浦语大模型实战营学习笔记&大语言模型7
    大语言模型-7.模型压缩与部署书生浦语大模型实战营学习笔记4-模型压缩与部署本文包括第二期实战营的第5课内容,介绍关于模型压缩的相关内容,主要包括、模型量化和模型部署的相关内容。模型部署定义:在软件工程中,部署通常指的是将开发完毕的软件投入使用的过程。在人工智能领域,模......
  • 前端小白的学习之路(Vue2 二)
    提示:学习vue2的第二天,笔记记录:自定义指令,事件修饰符,属性计算,属性监听,属性过滤目录一、自定义指令1.全局注册2.局部注册二、事件修饰符 1.常用事件修饰符1)事件相关修饰符2)键盘事件相关修饰符3)鼠标事件相关修饰符三、属性计算四、属性监听五、属性过滤一、自定......
  • spikingjelly学习-训练网络
    【MNIST数据集包含若干尺寸为28*28的8位灰度图像,总共有0~9共10个类别。以MNIST的分类为例,一个简单的单层ANN网络如下我们也可以用完全类似结构的SNN来进行分类任务。就这个网络而言,只需要先去掉所有的激活函数,再将尖峰神经元添加到原来激活函数的位置,这里我们选择的是LIF神......
  • npm(Node Package Manager) 学习记录
    一、npm是什么npm是Node.js包管理器。是一个命令行工具,用于安装和管理Node.js项目中的代码库和工具。npm允许从npm注册表(一个大型的软件包数据库)中搜索、安装、更新和删除软件包,并处理这些软件包的依赖关系。npm已经成为Node.js生态系统中不可或缺的一部分,通......
  • 使用阿里云试用Elasticsearch学习:3.7 处理人类语言——拼写错误
    我们期望在类似时间和价格的结构化数据上执行一个查询来返回精确匹配的文档。然而,好的全文检索不应该是完全相同的限定逻辑。相反,我们可以扩大范围以包括可能的匹配,而根据相关性得分将更好的匹配推到结果集的顶部。事实上,只能完全匹配的全文搜索可能会困扰你的用户。......