首页 > 其他分享 >二、神经网络基础(逻辑回归和向量化)

二、神经网络基础(逻辑回归和向量化)

时间:2024-09-14 10:36:24浏览次数:8  
标签:输出 逻辑 函数 梯度 回归 损失 神经网络 参数 量化

1、二分类

  logistic回归是一个用于二分类(Binary Classification)的算法。二分类就是输出结果y只有0和1两个标签(也有-1和1的情况)。以一个图像识别为例,例如识别猫,1代表猫,0代表不是猫。用y表示输出的结果标签。

  在二分类问题中,目标是训练一个分类器,它以图片的特征向量x为输入,预测输出的结果标签y是0还是1。

2、logisitic回归

  接下来介绍如何使用逻辑回归来解决二分类问题。逻辑回归中,表示y为1的概率,取值范围是(0,1)之间。

  逻辑回归的线性预测输出可以写成如上形式,已知的特征输入向量x可能是n_x维度,logistic回归的参数w也是n_x维的向量,而b就是一个实数。所以已知输入x和参数w和b,

  值得注意的是,在很多其他机器学习资料中,可能把常数b当做w0处理,并引入x0=1。这样从维度来看,x和w都会增加一维。但是在本课程中,为了简化计算和便于理解,多使用上式的形式,将w和b分开比较好。

  注意到上式的线性输出区间为整个实数范围,而逻辑回归要求输出范围在[0,1]之间,所以需要进行转换。引入Sigmiod函数(神经网络激活函数),让输出限定在[0,1]之间。

3、logistic回归损失函数

  逻辑回归中,w和b都是未知参数,需要反复训练优化得的。为了训练logistic回归模型的参数w以及b,需要定义一个成本函数(cost function)。它是关于未知参数w和b的函数,我们的目标是在训练模型时,要找到合适的w和b,让成本函数J尽可能的小。

  Loss(error) function:损失函数(误差函数),可以用来衡量算法的运行情况。这个的直观理解就是我们通过定义这个损失函数L来衡量你的预测输出值y帽和y的实际值有多接近。

  • 可以定义损失函数为y帽和y的差的平方,或者它们差的平方的1/2,但是这样做的话,会发现之后讨论的优化问题,会变成非凸的,最后会得到很多个局部最优解,梯度下降法可能找不到全局最优解。

  在logistic回归中,我们会定义一个不同的损失函数它有和误差平方相似的作用,这些会给我们一个凸的优化问题。一般而言,我们偏向研究凸函数问题。

  • 对于这个损失函数,我们也想让它尽可能的小。
  • 损失函数是在单个训练样本中定义的,它衡量了在单个训练样本上的表现。

  下面定义一个成本函数,它衡量的是在全体训练样本上的表现。成本函数J是根据之前得到的两个参数w和b,J(w,b)=损失函数求和/m.,即所有m个训练样本的损失函数和的平均。

4、梯度下降法(Gradient Descent)

  损失函数是衡量单一训练样例的效果,成本函数用来衡量在全部训练集上参数w和b的效果。下面我们讨论如何使用梯度下降法来训练或学习训练集上的参数w和b。

  我们希望找到使成本函数J(w,b)尽可能小的w和b。

  • 通过上式不断的更新迭代w。

  由于J(w,b)是凸函数,梯度下降算法(Gradient Descent)是先随机选组一组参数w和b值,然后每次迭代的过程中分别沿着w和b的梯度(偏导数)的反方向前进一小步,不断修正w和b。每次迭代更新w和b后,都能让J(w,b)更接近全局最小值。

  梯度下降算法每次迭代更新,w和b的修正表达式为:

  • alpha是学习因子(learning rate),表示梯度下降的步进长度,其值越大,w和b每次更新的“步伐”更大一些;越小,更新“步伐”更小一些。在程序代码中,我们通常使用dw来表示。

  一个神经网络的计算过程是通过正向传播(Forward Propagation)反向传播(Back Propagation)过程来实现的,首先计算出神经网络的输出,紧接着进行一个反向传输操作,后者我们用来计算出对应的梯度或者函数。

 

标签:输出,逻辑,函数,梯度,回归,损失,神经网络,参数,量化
From: https://www.cnblogs.com/pgl6/p/18413352

相关文章

  • 无需代码,通过逻辑引擎简单几步配置,实现邮件自动化发送
    无论是在个人生活中还是在工作场景中,发送邮件是一个常见的需求。通常在业务系统中有这样的场景:新增数据的时候动态取一些信息然后发送邮件给客户开户发送密钥邮件等那么在JVS低代码逻辑引擎中,我们可以通过配置【发送邮件】节点来实现配置说明发送邮件,需要有一个邮件传输协议服务器......
  • 股票api接口程序化报备,程序化交易监管对个人量化交易者有何影响
    炒股自动化:申请官方API接口,散户也可以python炒股自动化(0),申请券商API接口python炒股自动化(1),量化交易接口区别Python炒股自动化(2):获取股票实时数据和历史数据Python炒股自动化(3):分析取回的实时数据和历史数据Python炒股自动化(4):通过接口向交易所发送订单Python炒股自动化(5):......
  • 为何视频监控AI分析逐渐融入摄像头?浅述背后的必然逻辑
    视频监控的应用领域极为广泛,它已成为现代社会中各行各业不可或缺的信息化基石。从工业生产到日常生活,视频监控无处不在,其重要性不言而喻。传统上,视频监控仅局限于通过摄像头捕捉并储存图像,以此辅助我们的工作与生活。然而,随着人工智能技术的蓬勃发展,人们开始追求更高层次的视频监......
  • 基于卷积神经网络的图像去噪研究 毕业设计(案例展示)
    开发一种基于卷积神经网络(CNN)的高效图像去噪技术。图像去噪是图像处理领域的一个关键挑战,对于图像质量的提升、目标检测、目标跟踪以及图像分析等研究领域至关重要。CNN因其在图像识别和处理任务中的卓越性能而成为本研究的核心工具。研究内容包括分析图像去噪的重要性、评述当......
  • 神经网络的学习--深度学习
    本章的主题是神经网络的学习。这里所说的“学习”是指从训练数据中自动获取最优权重参数的过程。本章中,为了使神经网络能进行学习,将导入损失函数这一指标。而学习的目的就是以该损失函数为基准,找出能使它的值达到最小的权重参数。为了找出尽可能小的损失函数的值,本章我们将......
  • AI新时代揭幕 会“思考解题逻辑”的OpenAI推理大模型登场
    北京时间周五凌晨1时许,AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。OpenAI在官网发布公告称,开始向全体订阅用户开始推送OpenAIo1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示,对于复杂推理任务而言,新模型代表着人工智能能力的崭......
  • 深度神经网络DNN、RNN、RCNN及多种机器学习金融交易策略研究|附数据代码
    全文链接:https://tecdat.cn/?p=37668原文出处:拓端数据部落公众号 分析师:AijunZhang 在当今的金融领域,量化交易正凭借其科学性和高效性逐渐成为主流投资方式之一。随着大数据技术的蓬勃发展,量化交易借助先进的数学模型和计算机分析能力,摒弃了人的主观判断,通过挖掘海量历史数......
  • 《深度学习》—— 神经网络基本结构
    前言深度学习是一种基于神经网络的机器学习算法,其核心在于构建由多层神经元组成的人工神经网络,这些层次能够捕捉数据中的复杂结构和抽象特征。神经网络通过调整连接各层的权重,从大量数据中自动学习并提取特征,进而实现预测或分类等任务。一、神经网络结构神经网络的基本组......
  • 成长的底层逻辑:why-how-what 思考顺序
    为什么明明知道,却改不了?为什么别人听不明白我说的啥?如何让自己的成长更快速,而非像网游里打怪攒经验线性升级。why、how、what的思考方式,让我在这些问题上看到了答案。不仅如此,使用了这个思考方式之后,我对阳明心学、西方个人发展类书籍也有了更深层次的理解。我认为它是非常强......
  • C++中的基本运算符----逻辑运算符(&&、||、!)的实例讲解
    在C++中,逻辑运算符用于处理布尔值(true和false),并用于复合条件的判断。主要的逻辑运算符包括:目录1.逻辑与运算符(&&):2.逻辑或运算符(||):3.逻辑非运算符(!):1.逻辑与运算符(&&):当且仅当两个操作数都为true时,结果才为true。示例:if(a>0&&b>0)下面......