首页 > 其他分享 >机器学习入门笔记_基本概念

机器学习入门笔记_基本概念

时间:2024-05-29 16:33:01浏览次数:17  
标签:入门 分类 笔记 学习 降维 监督 聚类 数据 基本概念

本文介绍机器学习中一些基本的概念和分类

目录

有监督学习

回归

分类

无监督学习

聚类

降维

强化学习

机器学习适合的领域


有监督学习

  • 是一种通过训练数据集来预测目标变量的方法,其中每个训练样本都有一个已知的标签或输出值。
  • 有监督学习的特点是“有x有y”。
  • 有监督学习的目的是为了利用“有x有y”的数据进行学习,从而对于“有x无y”的数据,去预测它的“y”。
  • 核心在于使得预测的“y”和真实的“y”误差尽可能小。

有监督学习分为两类:分类和回归。两者的本质特征在于要得到的y的类型。

回归

在回归问题中,y是连续的数值变量。比如一元线性回归。

分类

在分类问题中,y是分类型变量。定类变量的特点有:

  • 不是连续的数值,而是离散值。
  • 顺序和大小没有意义。各个分类是平等的,不存在分类2>分类1的说法

无监督学习

  • 是一种利用算法自动提取给定数据的本质结构和规律的机器学习算法。
  • 无监督学习的本质特征是“有x无y”。
  • 无监督学习的目标是“捕捉并提取数据的特征”。而有监督学习的目标是“对未知数据进行预测
  • 无监督学习常见的应用有聚类和降维。

聚类

聚类是将数据中特征相似的数据按组分开的工作。
聚类大致分成两种:分层聚类和非分层聚类。

  • 分层聚类:将特征相似的聚类逐个合并,然后重复进行聚类,直到最终成为一个大聚类。如:系统聚类。
  • 非分层聚类:先指定聚类数,然后找到以该数目进行聚类的最优分开数据的方法。如:k-means。

降维

降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。
常见的降维算法有:PCA、LDA、LLE等

强化学习

  • 强化学习时指从与给定环境的互动中,为了最大化算法的学习成果反复试错,以达到最佳的一种学习方式。
  • 核心是对学习行为进行“奖励”,从而达到最佳行动。

机器学习适合的领域

机器学习的要求有:

  1. 数据存在且充足。必须有充足的数据用于模型的训练。
  2. 数据最好是定量的而不是定性的。
  3. 不关注推理的过程而只关注最后的预测结果。

机器学习的弱点:

  1. 特征量难于寻找和设计。深度学习为解决这一问题的一种方案。
  2. 对数据有很强的依赖性。

标签:入门,分类,笔记,学习,降维,监督,聚类,数据,基本概念
From: https://blog.csdn.net/wwl412095144/article/details/139298949

相关文章

  • COMSOL入门1——基础配置(自存)
    进行基础配置:文件➡首选项1.语言设置2.显卡不太好,图形的渲染改为“软件”,以防闪退、黑屏3.文件➡临时文件夹和恢复文件夹放在D盘重新启动软件......
  • 打靶笔记w1r3s.v1.0
    打靶笔记w1r3s.v1.0nmap扫描与分析主机发现nmap-sn192.168.218.0/24历史版本为-sP(已经被放弃)n不进行端口扫描192.168.218.155创建文件夹保存端口信息指定最低1万速率扫描所有端口nmap-sT--min-rate10000-p-192.168.218.155nmapscan/ports-sSSYN扫描是快......
  • R 语言入门学习笔记:软件安装踩坑记录——删除所有包以及彻底解决库包被安装到 C 盘用
    目录R语言入门学习笔记:软件安装踩坑记录——删除所有包以及彻底解决库包被安装到C盘用户目录下的问题,以及一些其他需要注意的点软件版本及环境遇到的问题描述问题的分析和探究最终的解决方案折中方案根治方案其他在安装过程中需要注意的问题R语言入门学习笔记:软件安装踩坑记......
  • GIt快速入门(一文学会使用Git)
    GIt快速入门文章目录GIt快速入门一、为什么要学习Git二、Git的安装1.安装Git2.下载GUI三、Git的概念1、版本控制2、集中式控制3、分布式控制4、多人协作开发1.并行开发2.分支管理3.冲突解决4.代码审查5.分布式特性四、Git客户端操作1.界面介绍2.提交操作3.创建分支4......
  • TikTok标签使用技巧,从入门到精通全攻略
    一、理解TikTok标签什么是TikTok标签?TikTok标签是一种元数据,用于描述视频的主题、内容或特征。通过将相关标签添加到视频中,您可以提高视频的可发现性,使其更容易被其他用户找到。标签的作用提高曝光度:有助于您的视频在TikTok平台上更容易被推荐给其他用户。目标受众:通过选择......
  • 关于希尔算法的学习笔记
    希尔算法的简介希尔算法是插入算法的升级版,D.L.Shell于1959提出,是一种减少增量算法,提出的过程为作者发现插入算法的时间复杂度会随着数组的有序性上升而下降,所以采用分组的算法,使各个组内变得有序,提升整体的有序性,从而减少插入算法的时间.希尔算法的原理比如说我......
  • python入门教程,从0到精通,不信你学不会!!
    在数字化时代的浪潮中,Python作为一门简洁、易读且功能强大的编程语言,日益受到广大编程爱好者的青睐。无论你是初涉编程的小白,还是希望进一步提升技能的开发者,本教程都将为你打开Python编程世界的大门,引领你走向编程的巅峰。只要掌握了科学的学习方法并制定了合理的学习计划,Pyth......
  • 【2024版】最新HW参考 HVV行动之蓝军经验总结(非常详细)零基础入门到精通,收藏这一篇就够
    ‍正文:HW行动,攻击方的专业性越来越高,ATT&CK攻击手段覆盖率也越来越高,这对于防守方提出了更高的要求,HW行动对甲方是一个双刃剑,既极大地推动了公司的信息安全重视度和投入力量,但同时对甲方人员的素质要求有了很大提升,被攻破,轻则批评通报,重则岗位不保;大的金融、央企可能不担心......
  • 如何成为一名合格的CTFer(非常详细)零基础入门到精通,收藏这一篇就够了
    一、成为一名CTFer,需要了解哪些领域和基础知识?**就目前来说,想成为一名水平还不错的CTF二,需要了解的基础知识还是挺多的,主要如下:**0.基础知识a.编程语言:Python、C/C++、JavaScript、Javab.操作系统原理:Linux基础、Windows系统结构c.网络基础:TCP/IP协议、HTTP......
  • 深度学习笔记: 详解处理类别不平衡
    欢迎收藏Star我的MachineLearningBlog:https://github.com/purepisces/Wenqing-Machine_Learning_Blog。如果收藏star,有问题可以随时与我交流,谢谢大家!处理类别不平衡在欺诈检测、点击预测或垃圾邮件检测等机器学习用例中,通常会遇到标签不平衡的问题。根据具体用例,可......