首页 > 其他分享 >Datawhale AI+X 深度学习入门(一)

Datawhale AI+X 深度学习入门(一)

时间:2024-08-27 09:26:10浏览次数:3  
标签:机器 入门 AI Datawhale 学习 参数 损失 未知 函数

一.机器学习的定义和核心

1.机器学习就是让机器具备找一个函数的能力。机器具备找函数的能力以后,它可以做很多事。

2.在机器学习领域里面,除了回归跟分类以外,还有结构化学习(structured learning)。机器不只是要做选择题或输出一个数字,而是产生一个有结构的物体,比如让机器画一张图,写一篇文章。这种叫机器产生有结构的东西的问题称为结构化学习。

3.机器学习找函数的过程,分成 3 个步骤。第一个步骤是写出一个带有未知参数的函数 f,其能预测未来观看次数。比如将函数写成

其中,y 是准备要预测的东西,y 跟 x1 都是数值,b 跟 w 是未知的参数,它是准备要通过数据去找出来的,w 跟 b 是未知的,只是隐约地猜测。猜测往往来自于对这个问题本质上的了解,即领域知识(domain knowledge)。机器学习就需要一些领域知识。总之,y = b + w ∗ x1,而 b 跟 w 是未知的。带有未知的参数(parameter)的函数称为模型(model)。模型在机器学习里面,就是一个带有未知的参数的函数,特征(feature) x1 是这个函数里面已知的而 w 跟 b 是未知的参数。w 称为权重(weight),b 称为偏置(bias)。这个是第一个步骤。

第 2 个步骤是定义损失(loss),损失也是一个函数。这个函数的输入是模型里面的参数,模型是 y = b + w ∗ x1,而 b 跟 w 是未知的,损失是函数 L(b, w),其输入是模型参数 b 跟w。损失函数输出的值代表,现在如果把这一组未知的参数,设定某一个数值的时候,这笔数值好还是不好。举一个具体的例子,假设未知的参数的设定是 b = 500,w = 1,预测未来的观看次数的函数就变成 y = 500 + x1。

估测的值跟实际的值之间的差距,其实有不同的计算方法,计算 y 与 yˆ 之间绝对值的差距,称为平均绝对误差(Mean Absolute Error,MAE)。如果算 y 与 yˆ 之间平方的差距,则称为均方误差(Mean SquaredError,MSE)。

有一些任务中 y 和 yˆ 都是概率分布,这个时候可能会选择交叉熵(cross entropy),这个是机器学习的第 2 步。

接下来进入机器学习的第 3 步:解一个最优化的问题。找一个 w 跟 b,把未知的参数找一个数值出来,看代哪一个数值进去可以让损失 L 的值最小,就是要找的 w 跟 b,这个可以让损失最小的 w 跟 b 称为 w∗ 跟 b∗ 代表它们是最好的一组 w 跟 b,可以让损失的值最小。梯度下降(gradient descent)是经常会使用优化的方法。为了要简化起见,先假设只有一个未知的参数 w,b 是已知的。w 代不同的数值的时候,就会得到不同的损失,这一条曲线就是误差表面。这一步的步伐的大小取决于两件事情:
(a)第一件事情是这个地方的斜率,斜率大步伐就跨大一点,斜率小步伐就跨小一点。
(b)另外,学习率(learning rate)η 也会影响步伐大小。学习率是自己设定的,如果 η 设大一点,每次参数更新就会量大,学习可能就比较快。如果 η 设小一点,参数更新就很慢,每次只会改变一点点参数的数值。这种在做机器学习,需要自己设定,不是机器自己找出来的,称为超参数(hyperparameter)。

梯度下降有一个很大的问题,没有找到真正最好的解,没有找到可以让损失最小的 w。图示如下:

右侧红点这个位置是真的可以让损失最小的地方,称为全局最小值(global minima),而 wT 这个地方称为局部最小值(local minima),其左右两边都比这个地方的损失还要高一点,但是它不是整个误差表面上面的最低点。所以常常可能会听到有人讲到梯度下降不是个好方法,这个方法会有局部最小值的问题,无法真的找到全局最小值。事实上局部最小值是一个假问题,在做梯度下降的时候,真正面对的难题不是局部最小值。有两个参数的情况下使用梯度下降,其实跟刚才一个参数没有什么不同。如果一个参数没有问题的话,可以很快的推广到两个参数。

在深度学习框架里面,比如 PyTorch 里面,算微分都是程序自动帮计算的。就是反复同样的步骤,就不断的更新 w 跟 b,期待最后,可以找到一个最好的 w,w∗ 跟最好的 b∗。

标签:机器,入门,AI,Datawhale,学习,参数,损失,未知,函数
From: https://www.cnblogs.com/CuckooAI/p/18382004

相关文章

  • python aiohttp创建很多线程的问题及解决例子解析
    在使用aiohttp进行异步HTTP请求时,创建大量线程可能会导致性能问题。根据搜索结果,这个问题通常与DNS查询有关,因为默认情况下,每次发送请求时aiohttp.ClientSession都会进行DNS查询,这是一个阻塞操作,会为每次查询创建一个新线程。为了解决这个问题,可以通过指定一个AsyncR......
  • 智能科技的浪潮:AI、ML、DL和CV的探索之旅
    智能科技的浪潮:AI、ML、DL和CV的探索之旅前言人工智能:智能科技的基石从专用到通用:AI的分类与演进机器学习:数据中的智慧算法的力量:经典与创新深度学习:解锁复杂性之门神经网络的深度:基础与应用计算机视觉:赋予机器“看”的能力从看到理解:CV的挑战与应用未来展望:技术的融合与......
  • 浅谈AI--我们为什么要学会用AI
    为什么要用AI人工成本低、为工作提高效率。了解AIAI入门工具要数ChatGPT,无奈在国内打不开,要用它得通过科学上网或者调用代理商接口。但是今年3月份,百度也发布了免费产品——文心一言,对标ChatGPT3.5。虽然刚开始文心一言给的问答效果不如人意,尤其是答非所问的情况比较多,而且......
  • AI生成视频实现:从理论到实践的全面指南
    目录引言1.1什么是AI生成视频?1.2AI生成视频的应用领域1.3本文结构概览AI生成视频的基本原理2.1深度学习简介2.2卷积神经网络(CNN)2.3生成对抗网络(GANs)2.3.1GAN的基本结构2.3.2判别器与生成器的作用2.3.3GAN的优化与训练数学基础与公式推导3.1......
  • 【Git保姆级使用教程】Git从入门到精通超级详细的使用教程,一套教程带你搞定Git(高见龙
    目录Git下载与安装设置GitGit的用户设置使用Git新增初始Repository将文件交给Git管控(将文件加入暂存区)查看Git文件记录查找commit记录更改提交commit的记录撤销提交commit将某些文件取消Git版控Git中删除或更改文件名Git查看某个文件的某一行代码是谁写的.git目录中......
  • 人工智能(AI)在各行各业的深度应用,快来看看有没有你的行业~
    大家好,我是老六哥(mywechat:he_lao_6),我正在共享使用AI提高工作效率的技巧。欢迎关注我,共同提高使用AI的技能,让AI成功你的个人助理。 随着chatGPT的出现,和国内越来越多基于大模型应用的出现,很多企业已经开始意识到要拥抱AI,正在在掌握AI、普及AI、借助AI提升效率等方......
  • 语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场
    前言 就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了!欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读......
  • vue-cli中chainWebpack的使用
    前言在项目开发中我们难免碰到需要对webpack配置更改的情况,今天就主要来讲一下在vue.config.js中对一些配置的更改,简单介绍一下loader的使用;用configureWebpack简单的配置;用chainWebpack做高级配置;包括对loader的添加,修改;以及插件的配置1、首先简单介绍一下webpack中loader的简......
  • Transformer作者预警:只卖模型玩不过OpenAI!
    前言 只卖模型真的不赚钱!欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自量子位仅用于学术分享,若侵权请联系删除CV方向的准研究生们,未来三年如何度过?招聘高光谱图像、语义分割、diffusion等方向论文指导老师谷......
  • 机器学习/数据分析--通俗语言带你入门决策树(结合分类和回归案例)
    ......