李宏毅-机器学习-笔记-P1

时间：2024-08-11 13:57:49浏览次数：18

标签：P1 机器 Learning 李宏毅笔记学习 learning 资料标注

P1 机器学习基本概念（一）

一、机器学习是什么？

Machine Learning≈Looking for function、函数太过复杂，让机器来找

比如：Speech Recognition(语音识别)：声音信号通过函数转化为文字，输入到输出

Image Recognition(图像识别)、Playing Go

二、着重关注于其中一项关键技术：深度学习

深度学习(Deep Learning):要找的函数是一个类神经网络(Neural Network)

（一）可以有不同的输入：vector(向量)、Martix(矩阵e.g. image图像识别)、Sequence(序列e.g. speech、text语音或文字识别)

（二）也可以有不同输出：regression(回归任务)-scalar(数值)、classification(分类任务)-类别、structured learning:更复杂的，输出一段话、一个文章、甚至画图。

以上输入和输出各个类型并不是对应的，而是可组合的。

三、机器是如何实现自动找一个函数？

（一）Supervised Learning（监督学习）

大量训练资料training data——做好标注label——机器自动找出一个方向判断

大量标记耗费人工，搜集到的资料不多，若为每一个任务都搜集有标注资料，非常麻烦。

（二）self-supervised learing

希望模型在训练前先练基本功——Pre-train，期待练好之后，它在新的任务上做的很好。基础硬核或者硬核的功能（Foundation model,其中有著名叫Bert的模型）已经处理完，在此基础上再开发新功能(Downstream Task)会变得很简单。就像作业系统与应用之间的关系。

比如：影像识别

机器看大量未标注的图片资料，将图片反转、变色后问机器它们(内容)是不是一样，机器通过将此基本任务（上游任务）学好，即能够辨别不同颜色或不同角度的图像，其实是一个物品，然后在真正要解决的问题（下游任务、Downstream Task）上能够做的更好，比如：猫狗识别，识别苹果和橘子。

（三）Generative Adversarial Network

Supervised learning需要成对关系，告诉系统：输入x1，通过函数，希望输出y1；输入x2，通过函数，希望输出y2。

而如果有Generative Adversarial Network,只需要收集到大量的x和大量的y，不用知道他们之间的成对关系，机器就可以把它们之间的关联找出来。

（四）Reinforcement Learning：RL

使用场景：不知道如何标注资料的时候。不知道如何标注资料，但可以定义什么是成功时。

比如下围棋，人类也不知道要将棋子下在哪里最好时。

四、不只是关注正确率

（一）Anomaly Detection（异常检测）

让机器具备回答：“我不知道”的能力

（二）Explainable AI(可解释性AI)

分类器虽然能够判断出类别，比如判别出宝可梦和数码宝贝。但真的代表它知道宝可梦长什么样子吗？我们不仅要让它判断出类别，正确的答案，同时还要告诉我们为什么它知道答案应该是这样的，这就是可解释性AI。

（三）Model Attack(模型攻击)

（四）Domain Adaptation

如何解决图像分布不同，争取率暴跌的问题

（五）Network Compression（模型压缩）

（六）Life-long Learning

五、学会如何学习（Meta learning）

机器不再使用人发明的演算法，而是从过去的经验里面发明出新的演算法

Few-shot learning是也能够非常少量的标注资料就进行学习≈meta learning，因为若想使用非常少量的标注资料就进行学习要使用到meta learning的技术，只有机器也是用自己发明的演算法，才能做到非常少量的标注资料就进行学习。

标签：P1,机器,Learning,李宏毅,笔记,学习,learning,资料,标注
From： https://blog.csdn.net/qq_61833632/article/details/141086369

深入浅出！这份阿里内传的“Spring-MVC源码分析与实践笔记”带你看透Spring-MVC源码！太牛
第二章常见协议和标准DNS协议TCP/IP协议与SocketHTTP协议Servlet与JavaWeb开发第三章DNS的设置DNS解析Windows7设置DNS服务器Windows设置本机域名和IP的对应关系第四章Java中Socket的用法普通Socket的用法NioSocket的用法第五章自己动手实现HTTP协议第六......
汇编语言第二章寄存器（笔记、习题及拓展知识）（王爽汇编语言第四版）
一、寄存器基础知识一个典型的CPU(此处讨论的不是某一具体的CPU)由运算器、控制器、寄存器(CPU工作原理)等器件构成，这些器件靠内部总线相连。前一章所说的总线，相对于CPU内部来说是外部总线。内部总线实现CPU内部各个器件之间的联系，外部总线实现CPU和主板上其他器件的联......
HTB-Permx靶机笔记
Permx靶机笔记概述permx靶机是HTB的简单靶机，这台靶机整体考验渗透人员的信息搜集能力，可以收只有信息搜集的快速，才能快速拿到它的flag。整体是比较简单的靶机靶机连接：https://app.hackthebox.com/machines/PermX一、nmap扫描1）端口扫描nmap-sT--min-rate10000-p--......
FFmpeg开发笔记（四十六）利用SRT协议构建手机APP的直播Demo
不管是传统互联网还是移动互联网，实时数据传输都是刚需，比如以QQ、微信为代表的即时通信工具，能够实时传输文本和图片。其中一对一的图文通信叫做私聊，多对多的图文通信叫做群聊。除了常见的图文即时通信，还有实时音视频通信，比如一对一的音频通话、一对一的视频通话等等，此时可采用W......
Java开发环境安装笔记
目录JDK的版本Java8Java9Java11(LTS)Java17(LTS)Java21JDK的环境变量设置JAVAHOME和PATH环境变量CLASSPATH环境变量多个SDK版本切换又双叒叕换了一个电脑，又双叒叕得重新折腾各种软件的安装，记录一下吧...软件安装中，最麻烦的莫过于JAVA的编程环境安装了，Java运行环境区......
HTB-Permx靶机笔记
Permx靶机笔记概述permx靶机是HTB的简单靶机，这台靶机整体考验渗透人员的信息搜集能力，可以收只有信息搜集的快速，才能快速拿到它的flag。整体是比较简单的靶机靶机连接：https://app.hackthebox.com/machines/PermX一、nmap扫描1）端口扫描nmap-sT--min-rate10000-p--oport......
【云原生之kubernetes实战】在k8s环境下部署Note Mark笔记工具
【云原生之kubernetes实战】在k8s环境下部署NoteMark笔记工具一、NoteMark介绍1.1NoteMark简介1.2NoteMark特点1.3NoteMark使用场景二、本次实践介绍2.1本次实践简介2.2本次环境规划2.2k8s存储介绍三、检查k8s环境3.1检查工作节点状态3......
【笔记】【THM】Malware Analysis（恶意软件分析）
【笔记】【THM】MalwareAnalysis（恶意软件分析）探索恶意软件的世界，分析恶意软件如何感染系统并造成破坏。恶意软件分析就像猫捉老鼠的游戏。恶意软件的作者一直在设计新的技术来躲避恶意软件分析师的眼睛，而恶意软件分析师也一直在寻找识别和抵消这些技术的方法。在这个模块中，我们......
【模电笔记】——集成运算放大电路
tips：本章节的笔记已经打包到word文档里啦，建议大家下载文章顶部资源（有时看不到是在审核中，等等就能下载了。手机端下载后里面的插图可能会乱，建议电脑下载，兼容性更好且易于观看），若有不足之处请多多包含，大家可以评论指正或给出建议。一、集成运放电路简介1.集成运放电......
共识算法论文阅读笔记1-hotstuff
1.名词解释：QC：表示一个被<spanid="MathJax-Span-8"class="mrow"><spanid="MathJax-Span-9"class="mo">(<spanid="MathJax-Span-10"class="mi">n<spanid="MathJax-Span-11"class......