首页 > 其他分享 >datawhale深度学习入门:task1学习笔记

datawhale深度学习入门:task1学习笔记

时间:2024-08-27 22:53:25浏览次数:5  
标签:task1 函数 误差 模型 datawhale 学习 算法 参数

机器学习是一种人工智能的分支,它主要涉及通过经验和数据来训练计算机模型以自动处理任务或进行预测。这些模型可以利用算法和数学模型来分析和学习数据,然后使用这些知识来执行特定的任务,如图像识别、语音识别、自然语言处理、数据分类、趋势预测等。深度学习是人工智能 (AI) 中的一种方法,它通过建立起一个复杂的神经网络模型,教会计算机以受人脑启发的方式处理数据。深度学习模型可以识别图片、文本、声音和其他数据中的复杂模式,从而产生准确的见解和预测。

回归分析是一种统计学方法,用于确定一个或多个因变量和一个或多个自变量之间的定量关系,然后用它们来预测未知数据的值。回归分析可分为一元回归和多元回归,简单回归和多重回归,线性回归和非线性回归。分类任务要让机器做选择题。人类先准备好一些选项,这些选项称为类别(class),现在要找的函数的输出就是从设定好的选项里面选择一个当作输出,该任务称为分类。假设模型y = b + w ∗ x1中, b 跟 w 是未知的参数(parameter)。带有未知的参数(parameter)的函数称为模型(model)。特征(feature) x1 是这个函数里面已知的,w 称为权重(weight),b 称为偏置(bias)。损失函数在机器学习中用来衡量模型预测结果与实际结果之间差异的函数。其值越小,代表模型预测结果越接近实际结果。在训练模型时,需要通过不断调整模型参数来最小化损失函数的值。常见的损失函数包括均方误差、交叉熵等。平均绝对误差一种常用的预测精度评估指标,又称平均绝对百分误差,用于衡量预测值与真实值之间的误差程度,以百分比的形式表示。MAE的计算公式为:将所有绝对误差的和除以样本量。均方误差一种评估模型预测结果与真实值之间误差大小的指标。它是指预测值与真实值之差的平方值的平均数。MSE越小,说明模型的预测结果越准确。它通常用于评估回归模型的性能。

交叉熵是Shannon信息论中一个重要概念,主要用于度量两个概率分布间的差异性信息。 人工智能语境下,指多类别分类问题中对 Log 损失函数的推广。交叉熵量化两个概率分布之间的区别,用于度量两个概率分布间的差异性信息。语言模型的性能也通常用交叉熵和复杂度来衡量,将交叉熵引入计算语言学消歧领域。

误差表面表示模型误差的超曲面,它描述了模型权重参数与模型误差之间的关系。这个超曲面的每个点都对应模型在特定权重下的误差值。通过分析误差表面,可以更好地选择和调整训练算法及参数,从而找到全局最优解或可接受的局部最优解。这对提升模型的泛化能力和预测精度至关重要。误差表面是一个重要的概念,它揭示了模型参数与其误差之间的关系,并指导我们如何通过优化方法找到最佳的参数值,以提升模型的性能。

“梯度下降”是一个常用的优化算法,用于求解目标函数的最优解或局部最优解。它通过不断调整模型参数的值,使目标函数的值逐渐下降。具体来讲,每次迭代时,它计算目标函数的梯度(即函数在当前点处的斜率),并朝着梯度的反方向更新参数值,以使函数值下降。这个过程一直持续到目标函数的值收敛(即不再变化或变化极小),此时,算法得到的参数值就是目标函数的最优解或近似最优解。学习率是机器学习算法中的一个参数,用来控制模型在每次迭代中对数据学习的速率。它表示模型每次更新参数时改变的量的大小。学习率越小,模型对数据的学习速度越慢,但可以降低其过拟合的风险;学习率越大,模型对数据的学习速度越快,但容易导致过拟合或者不稳定。

超参数是机器学习算法中的一种参数,它通常是在算法运行之前设置的。与模型学习时自动获得的参数不同,超参数在运行模型之前必须由数据科学家或开发者选择并设置。一些常见的超参数包括学习率、正则化参数、分类器种类等。超参数的选择往往会影响模型的性能和准确度,因此需要进行反复的试验和调整。

全局最小值是指在机器学习中,通过梯度下降算法优化的误差表面中,最低的点或区域,它代表了模型最优的参数设置,可以使得损失函数取得最小值。它对应于模型最佳性能的状态,即在训练数据集上达到最低的预测误差。在实际应用中,找到全局最小值往往面临许多挑战,因为误差表面可能非常复杂,有时甚至难以判断一个最小值是全局的还是局部的。局部最小值是指在梯度下降算法中,模型参数更新到某个点时,该点的梯度为零,且在该点附近的小范围内,该点的函数值小于或等于其他点的函数值。然而,它并非整个函数范围内的最小值点。

 

标签:task1,函数,误差,模型,datawhale,学习,算法,参数
From: https://www.cnblogs.com/fyxxjj/p/18383697

相关文章

  • 2024吴恩达机器学习
    一、机器学习的应用1.监督学习(回归与分类)2.无监督学习(聚类、异常检测、降维)3.线性回归模型f(x)=wx+b代价函数costfunction: objective minimizeJ(w,b)4.梯度下降w=w-@d/dwJ(w,b)b=b-@d/dbJ(w,b) 学习率@的影响toosmall toobig 4.线性回归中的梯度......
  • Datawhale X 李宏毅苹果书 AI夏令营 Task1.2 笔记
    《深度学习详解》3.2节中关于批量和动量的主要内容总结: 批量的概念:在深度学习训练过程中,数据不是一次性全部用于计算梯度,而是被分成多个小批量(batch),每个批量包含一定数量的数据。每个批量的损失函数用于计算梯度并更新模型参数。批量大小对梯度下降法的影响:两种极端情况:......
  • Datawhale X 李宏毅苹果书 AI夏令营:task1通过案例了解机器学习
    隐藏任务:①:找出本篇中形如回归(regression)加粗字体的术语,并用自己的话进行解释,列成表格,与学习群的其他小伙伴讨论你的理解和搜索到的相关案例。②:整理出本篇中所有的公式,手动摘录,并尝试理解。③:找出机器学习找函数的3个步骤!并查找资料,交叉佐证这些步骤。④:归纳梯度下降的步骤。......
  • Datawhale X 李宏毅苹果书 AI夏令营(Task2)
     一、学前概览        任务内容:criticalpoint并不一定是训练神经网络遇到的最大的阻碍,还有一种叫AdaptiveLearningRate的技术。        任务目的:了解掌握LearningRate和分类损失的计算。        本节出现术语:自适应学习率(rootmeansquare、RM......
  • Linux firewalld防火墙学习总结
    实践环境CentOS-7-x86_64-DVD-2009简介Firewalld是一种简单的、有状态的、基于区域(zone-based)的防火墙。策略和区域用于组织防火墙规则。网络在逻辑上被划分为多个区域,它们之间的流量可以通过策略进行管理。查看防火墙状态#servicefirewalldstatus或者#systemctls......
  • 数组学习
    1.概念数组是相同类型数据的有序集合每一个数据都称为数组元素2.数组的使用1.声明一个数组:可以在类型后加[](首选)或者在名称后加[](为了方便c和c++语言而设计)2.创建一个数组,并设置内存3.给数组赋值总览3.使用数组长度来计算数组总和如果想计算数组里的数的总和,可......
  • 聚焦超声换能器基本知识的学习
    聚焦超声换能器结构的学习记录学习目的:为了对换能器的材料、结构、特性进行学习,对换能器的制造进行更加深入的了解和学习进行学习的记录,同时也为了督促自己可以认真的在工作之余保持学习的热情.主要了解PZT(钴钛酸铅)和1-3型压电复合材料这两种换能器的结构和制造工艺。其中......
  • 聚焦超声换能器结构学习的回顾和目标-1
    回顾:聚焦超声换能器的主要核心元器件主要为三个分别是:匹配层、压电陶瓷换能器片、背衬。通过有方向和周期切换的电压施加在换能器片的两端,使其振荡;匹配层进行匹配(声阻抗的计算匹配方式等下再说),保证高效的声传播;背衬的作用就是吸声且减少脉冲持续时间(就是振荡衰减过程)。我不......
  • 软工学习1
    这个作业属于哪个课程https://edu.cnblogs.com/campus/gdgy/CSGrade22-34这个作业要求在哪里https://edu.cnblogs.com/campus/gdgy/CSGrade22-34/homework/13228这个作业的目标创建并学会使用博客园和githut,根据要求作自我介绍并提出5个相关问题一、自我介绍......
  • 数据结构学习笔记
    李超线段树学习笔记模板传送门从模板题就能看出来嗷,李超线段树非常牛逼。\bx从名字中就能看出来嗷,这玩意儿是个线段树。那么考虑在线段树上维护一堆线(一次函数)。对于每个点,存所有线中,使这个线段$mid$的点的线。对于加入一个点,根节点递归,扫到一个点时,若这个点在$mid$......