首页 > 其他分享 >Datawhale X 李宏毅苹果书 AI夏令营 深度学习方向 task 1 笔记

Datawhale X 李宏毅苹果书 AI夏令营 深度学习方向 task 1 笔记

时间:2024-08-27 15:22:58浏览次数:12  
标签:输出 未知数 task 机器 函数 AI 李宏毅 学习 一个

一、机器学习

机器学习(Machine Learning,ML):机器具备找函数的能力。当我们对机器输入一个任务时(如:语音识别和图像识别),机器要做的就是找出这些任务蕴含的函数,通过找到函数,机器就可以通过输入的内容给出对应的输出内容。而找函数人类是很难做到的,所以这时候就需要机器学习。

机器学习通过输出结果的不同可以分为不同的类别。

1、回归(Regression):函数输出是一个数值。

     预测未来PM2.5的数值

     输入:今天PM2.5浓度以及臭氧浓度以及等等可以帮助机器计算结果的条件。

     输出:一个具体的数值(明天的PM2.5的浓度)

2、分类(Classification):做选择题。我们给机器一些设定好的选项(类别),机器要做的就是从其中找出一个数值作为输出。

      判断一封邮件是否属于垃圾邮件(已经给机器设定好了选项,机器通过函数计算给出选项)

      输入:一封邮件

      输出:是垃圾邮件/不是垃圾邮件

  • AlphaGo 也是一个分类的问题,只是给他设置的选项比较多,有多少个格子就会设置多少个选项(19*19)

3、结构化学习(Structured Learning):产生一个有结构的物体

      让机器生成一个图片/文章

      输入:你的要求

      输出:一个符合你要求的文章/图片

二、案例学习

      通过今天的点阅次数等数据推测明天的观看人数

      机器学习找函数分为3个步骤:

      1、假设函数是  y = b + wx  (只是猜测,不一定对)

            y = 明天的观看人数  (要预测的东西)

            x = 今天的观看人数   (已知的)

            b、w是未知数,需要通过资料找出的(假设今天观看人数是明天的多少倍,所以需要乘上w,但是不是每天的倍数都一样,所以加上一个b来修正)

            w:权重(weight)           b:偏值(bias)

  • 未知数可以称为领域知识(domain knowledge):对预测事物的猜测
  • 带有未知数的函数叫模型 (model)

      2、 定义损失(loss) 

           损失 L(b,w):与b,w有关,且b,w作为L的输入。L的这两个值反映了预测值的好坏。

           L(0.5k,1) y=b+wx  ->  y=0.5k+1x

           如何计算Loss?

           --从训练资料进行计算(过去的数据)

           假设过去某天的观看人数是5k,将这个作为x带入y=0.5k+1x(L的值是我们设定好的),计算y的值(预估值),用这个估值和当天真正的观看人数z(真实值Label)做对比,看它们的差距e=|y-z|(差值),就可以知道这个L值的好坏。

           算出一个时间段内每天的差值,并求出他们的平均数 P,P越大说明L的这组参数越不好,P越小说明L的这组参数越好。     

  • 根据过去真实的值绘制了一个关于b,w的图,越靠近红色差值越大,越靠近蓝色差值越小

     3、找出最优解,给出一个w和b,让L的值最小。---梯度下降法(gradient descent)

           先假设只有一个未知数w,b是已知的,可以绘制出一个曲线

          需要找一个w值让L最小,需要先随机选一个值w0,计算当w=w0时的微分是多少(该点上的切线的斜率k),若k<0,说明这条切线左边比右边高,此时提高w的值(k越大,w值提的越高),就可以让k慢慢趋近于0,从而使L变直,若k>0,反之。

          反复同样的操作,不断移动w,最终会停下来,停下来有两种可能。

  • 自己不想在再试验了
  • 理想状态下,k(微分)= 0

           现在计算两个未知数的情况,分别计算w和b对L的微分(斜率),重复上面的操作,更新w和b的位置。可以画出一个二维图。不断移动就可以找到一个最好的数值。

标签:输出,未知数,task,机器,函数,AI,李宏毅,学习,一个
From: https://blog.csdn.net/2202_75857177/article/details/141597495

相关文章

  • LLM的轻量化推理:AirLLM
    AirLLM是一种针对LLM的轻量级推理框架,通常用于优化和加速大模型的推理过程,可以允许70B的LLM在单个4GB的GPU上运行,无需量化、蒸馏、剪枝。AirLLM是通过分层推理实现的上述功能,本质上是将LLM的每一层拆分出来,分别加载权重进行推理,在推理较大的LLM时会很慢。环境配置使用pip安装a......
  • Start OpenAI gym on arbitrary initial state
    题意:“在任意初始状态下启动OpenAIGym”问题背景:AnybodyknowsanyOpenAIGymenvironmentswherewecansettheinitialstateofthegame?Forexample,IfoundtheMountainCarContinuous-v0candosuchthingsothatwecanselectatwhichpointthecarst......
  • 如何使用TensorFlow构建AI模型
    TensorFlow已成为构建机器学习模型最受欢迎的框架之一。无论你是初学者还是经验丰富的数据科学家,了解如何使用TensorFlow构建AI模型对充分利用机器学习的潜力至关重要。本指南将引导你逐步创建TensorFlowAI模型,从基础知识到更高级的概念,确保你拥有坚实的基础。了解Te......
  • 顶尖AI论文创意用于突破性研究
    随着人工智能(AI)的不断进步,它为研究人员提供了大量机会,使他们能够在突破性的创新中做出贡献。对于本科生、研究生和博士生来说,选择一个引人注目的论文题目对于在该领域产生重大影响至关重要。以下是2024年的一些顶尖AI论文想法,可以为创新研究铺平道路。1.生成对抗网络(GANs)在医......
  • MURF1640CT-ASEMI智能AI专用MURF1640CT
    编辑:llMURF1640CT-ASEMI智能AI专用MURF1640CT型号:MURF1640CT品牌:ASEMI封装:ITO-220AB批号:最新最大平均正向电流(IF):16A最大循环峰值反向电压(VRRM):400V最大正向电压(VF):0.95V~1..90V工作温度:-50°C~150°C反向恢复时间:35ns芯片个数:2芯片尺寸:74mil引脚数量:3正向浪涌电流(IFMS......
  • 游戏AI中的模仿学习
    模仿学习在游戏AI中的应用已经逐渐成为提升游戏智能和玩家体验的重要技术。通过模仿人类玩家的行为,游戏AI可以表现出更加智能、自然的决策和操作能力,使得游戏更加富有挑战性和趣味性。以下是关于游戏AI中模仿学习的详细探讨。1.什么是模仿学习?模仿学习(ImitationLearning)是......
  • 【python3.8安装报错】lmportError: DLL load failed while importing ft2font: 找不
    客户需求背景:安装python3.8无法运行,报错lmportError:DLLloadfailedwhileimportingft2font:找不到指定的模块 考虑兼容性问题这个问题首先需要考虑的是是否是python版本太高了,因为python3.9不支持win7,而python3.8版本对win7的兼容性也有一定的限制。解决:首先考......
  • 用 AI 赚钱,才是最迫切、最真实的需求
    作为一名AI科普者,能很深刻的感受到,一种「割裂」的状态。AI折叠之前《三体》大火,顺便带火了国产科幻。里面有一部作品叫《北京折叠》。2016年,获得了第74届雨果奖最佳中短篇小说奖。这篇小说,“构建了一个不同空间、不同阶层的北京,可像「变形金刚般折叠起来的城市」,却又......
  • vue-cli中webpack-chain 与 configureWebpack 常用配置
    vue-cli文档1.webpack-chain1.定义通过链式调用操作webpack配置对象。(chain:链子)直接修改配置对象chainWebpack通过链式编程的形式,来修改默认的webpack配置2.包含的对象ChainedMap和ChainSet1.ChainedMap//1、从Map移除所有配置clear()//2、通过键值从Map......
  • AI agent里的长期记忆和短期记忆
    AIAgent是时下热门的一个方向,在OpenAI应用研究主管LilianWeng写的万字长文中[1],她提出Agent=LLM+记忆+规划技能+工具使用。 图1OverviewofaLLM-poweredautonomousagentsystem组件二:记忆我们可以将上下文学习(context)看成是利用模型的短期记忆(也就是......