Datawhale X 李宏毅苹果书 AI夏令营深度学习方向 task 1 笔记

时间：2024-08-27 15:22:58浏览次数：12

一、机器学习

机器学习（Machine Learning，ML）：机器具备找函数的能力。当我们对机器输入一个任务时（如：语音识别和图像识别），机器要做的就是找出这些任务蕴含的函数，通过找到函数，机器就可以通过输入的内容给出对应的输出内容。而找函数人类是很难做到的，所以这时候就需要机器学习。

机器学习通过输出结果的不同可以分为不同的类别。

1、回归（Regression）：函数输出是一个数值。

预测未来PM2.5的数值

输入：今天PM2.5浓度以及臭氧浓度以及等等可以帮助机器计算结果的条件。

输出：一个具体的数值（明天的PM2.5的浓度）

2、分类（Classification）：做选择题。我们给机器一些设定好的选项（类别），机器要做的就是从其中找出一个数值作为输出。

判断一封邮件是否属于垃圾邮件（已经给机器设定好了选项，机器通过函数计算给出选项）

输入：一封邮件

输出：是垃圾邮件/不是垃圾邮件

AlphaGo 也是一个分类的问题，只是给他设置的选项比较多，有多少个格子就会设置多少个选项（19*19）

3、结构化学习（Structured Learning）：产生一个有结构的物体

让机器生成一个图片/文章

输入：你的要求

输出：一个符合你要求的文章/图片

二、案例学习

通过今天的点阅次数等数据推测明天的观看人数

机器学习找函数分为3个步骤：

1、假设函数是 y = b + wx （只是猜测，不一定对）

y = 明天的观看人数（要预测的东西）

x = 今天的观看人数（已知的）

b、w是未知数，需要通过资料找出的（假设今天观看人数是明天的多少倍，所以需要乘上w，但是不是每天的倍数都一样，所以加上一个b来修正）

w:权重（weight） b:偏值（bias）

未知数可以称为领域知识（domain knowledge）：对预测事物的猜测
带有未知数的函数叫模型（model）

2、定义损失（loss）

损失 L（b，w）：与b，w有关，且b,w作为L的输入。L的这两个值反映了预测值的好坏。

L（0.5k，1） y=b+wx -> y=0.5k+1x

如何计算Loss？

--从训练资料进行计算（过去的数据）

假设过去某天的观看人数是5k，将这个作为x带入y=0.5k+1x（L的值是我们设定好的），计算y的值（预估值），用这个估值和当天真正的观看人数z（真实值Label）做对比，看它们的差距e=|y-z|（差值），就可以知道这个L值的好坏。

算出一个时间段内每天的差值，并求出他们的平均数 P，P越大说明L的这组参数越不好，P越小说明L的这组参数越好。

根据过去真实的值绘制了一个关于b，w的图，越靠近红色差值越大，越靠近蓝色差值越小

3、找出最优解，给出一个w和b，让L的值最小。---梯度下降法（gradient descent）

先假设只有一个未知数w，b是已知的，可以绘制出一个曲线

需要找一个w值让L最小，需要先随机选一个值w0，计算当w=w0时的微分是多少（该点上的切线的斜率k），若k<0,说明这条切线左边比右边高，此时提高w的值（k越大，w值提的越高），就可以让k慢慢趋近于0，从而使L变直，若k>0，反之。

反复同样的操作，不断移动w，最终会停下来，停下来有两种可能。

自己不想在再试验了
理想状态下，k（微分）= 0

现在计算两个未知数的情况，分别计算w和b对L的微分（斜率），重复上面的操作，更新w和b的位置。可以画出一个二维图。不断移动就可以找到一个最好的数值。

标签：输出,未知数,task,机器,函数,AI,李宏毅,学习,一个
From： https://blog.csdn.net/2202_75857177/article/details/141597495

LLM的轻量化推理：AirLLM
AirLLM是一种针对LLM的轻量级推理框架，通常用于优化和加速大模型的推理过程，可以允许70B的LLM在单个4GB的GPU上运行，无需量化、蒸馏、剪枝。AirLLM是通过分层推理实现的上述功能，本质上是将LLM的每一层拆分出来，分别加载权重进行推理，在推理较大的LLM时会很慢。环境配置使用pip安装a......
Start OpenAI gym on arbitrary initial state
题意：“在任意初始状态下启动OpenAIGym”问题背景：AnybodyknowsanyOpenAIGymenvironmentswherewecansettheinitialstateofthegame?Forexample,IfoundtheMountainCarContinuous-v0candosuchthingsothatwecanselectatwhichpointthecarst......
如何使用TensorFlow构建AI模型
TensorFlow已成为构建机器学习模型最受欢迎的框架之一。无论你是初学者还是经验丰富的数据科学家，了解如何使用TensorFlow构建AI模型对充分利用机器学习的潜力至关重要。本指南将引导你逐步创建TensorFlowAI模型，从基础知识到更高级的概念，确保你拥有坚实的基础。了解Te......
顶尖AI论文创意用于突破性研究
随着人工智能（AI）的不断进步，它为研究人员提供了大量机会，使他们能够在突破性的创新中做出贡献。对于本科生、研究生和博士生来说，选择一个引人注目的论文题目对于在该领域产生重大影响至关重要。以下是2024年的一些顶尖AI论文想法，可以为创新研究铺平道路。1.生成对抗网络（GANs）在医......
MURF1640CT-ASEMI智能AI专用MURF1640CT
编辑：llMURF1640CT-ASEMI智能AI专用MURF1640CT型号：MURF1640CT品牌：ASEMI封装：ITO-220AB批号：最新最大平均正向电流（IF）：16A最大循环峰值反向电压（VRRM）：400V最大正向电压（VF）：0.95V~1..90V工作温度：-50°C~150°C反向恢复时间：35ns芯片个数：2芯片尺寸：74mil引脚数量：3正向浪涌电流（IFMS......
游戏AI中的模仿学习
模仿学习在游戏AI中的应用已经逐渐成为提升游戏智能和玩家体验的重要技术。通过模仿人类玩家的行为，游戏AI可以表现出更加智能、自然的决策和操作能力，使得游戏更加富有挑战性和趣味性。以下是关于游戏AI中模仿学习的详细探讨。1.什么是模仿学习？模仿学习（ImitationLearning）是......
【python3.8安装报错】lmportError: DLL load failed while importing ft2font: 找不
客户需求背景：安装python3.8无法运行，报错lmportError:DLLloadfailedwhileimportingft2font:找不到指定的模块考虑兼容性问题这个问题首先需要考虑的是是否是python版本太高了，因为python3.9不支持win7，而python3.8版本对win7的兼容性也有一定的限制。解决：首先考......
用 AI 赚钱，才是最迫切、最真实的需求
作为一名AI科普者，能很深刻的感受到，一种「割裂」的状态。AI折叠之前《三体》大火，顺便带火了国产科幻。里面有一部作品叫《北京折叠》。2016年，获得了第74届雨果奖最佳中短篇小说奖。这篇小说，“构建了一个不同空间、不同阶层的北京，可像「变形金刚般折叠起来的城市」，却又......
vue-cli中webpack-chain 与 configureWebpack 常用配置
vue-cli文档1.webpack-chain1.定义通过链式调用操作webpack配置对象。(chain：链子)直接修改配置对象chainWebpack通过链式编程的形式，来修改默认的webpack配置2.包含的对象ChainedMap和ChainSet1.ChainedMap//1、从Map移除所有配置clear()//2、通过键值从Map......
AI agent里的长期记忆和短期记忆
AIAgent是时下热门的一个方向，在OpenAI应用研究主管LilianWeng写的万字长文中[1]，她提出Agent=LLM+记忆+规划技能+工具使用。图1OverviewofaLLM-poweredautonomousagentsystem组件二：记忆我们可以将上下文学习（context）看成是利用模型的短期记忆（也就是......

Datawhale X 李宏毅苹果书 AI夏令营深度学习方向 task 1 笔记

相关文章

赞助商

阅读排行

Datawhale X 李宏毅苹果书 AI夏令营 深度学习方向 task 1 笔记

相关文章

赞助商

阅读排行

Datawhale X 李宏毅苹果书 AI夏令营深度学习方向 task 1 笔记