首页 > 其他分享 >0001.机器学习系统的类型

0001.机器学习系统的类型

时间:2023-06-02 12:34:22浏览次数:41  
标签:机器 0001 训练 模型 系统 学习 监督 数据

根据训练期间接受的监督数量和监督类型,可以将机器学习系统分为以下四个主要类型:有监督学习、五监督学习、半监督学习和强化学习。

一、 有监督学习

在有监督学习中,提供给算法的包含所需解决方案的训练集称为标签。

有监督学习方法有:k-近邻算法;线性回归;逻辑回归;支持向量机(SVM);决策树和随机森林;神经网络。

二、无监督学习

顾名思义,无监督学习的训练数据都是未经过标记的,系统会在没有“老师”的情况下进行学习。

无监督学习算法有:聚类算法;k-均值算法;DBCSAN;分层聚类分析(HCA);异常检测和新颖性检测;单类SVM; 孤立森林; 可视化和降维;主成分分析(PCA);核主成分分析;局部线性嵌入(LLE);t-分布随机近邻嵌入(t-SNE);关联规则学习;Apriori;Eclat。

三、半监督学习

由于通常给数据做标记是非常耗时和昂贵的,往往会有很多未标记的数据而很少有已标记的数据。有些算法可以处理标记的数据。这被称为半监督学习。

四、强化学习

强化学习 则是一个非常与众不同的“巨兽”。它的学习系统能够观察环境,做出选择,执行操作,并获得回报。所以它必须自行学习什么是最好的策略,从而随着时间的推移获得最大的回报。策略代表智能体在特定情况下应该选择的动作。

五、批量学习和在线学习

基于机器学习系统是否可以从传入的数据流中进行增量学习。

批量学习,系统无法进行增量学习,必须使用所有可用数据进行训练。通常是离线完成的,离线学习就是先训练系统,然后将其投入生产环境,这时学习过程停止,它只是将其所学到的应用出来。

在线学习,可以循序渐进低给系统提供训练数据,逐步积累学习成果。在线学习系统的一个重要参数是其使用不断变化的数据的速度,这就是所谓的学习率。

六、基于实例的学习和基于模型的学习

基于实例的学习,就是简单的死记硬背。系统用心学习示例,然后通过使用相似度度量来比较新实例和已经学习的实例,从而泛化新实例。

基于模型学习,从一组示例集中泛化的另一种方法是构建这些示例的模型,然后使用该模型进行预测。

七、机器学习的主要挑战

1. 训练数据的数量不足:大量的数据;

2. 训练数据不具代表性:训练数据一定要非常具有代表性;

3. 低质量数据:训练集中的错误、异常值、噪音等都需要提请进行清理;

4. 无关特征:垃圾入,垃圾出。 所以训练集需要选择最有用的特征进行训练,将现有特征进行整合,产生更有用的特征;

5. 过拟合训练数据:深度神经网络的复杂模型可以检测到数据中的微小模式,但是如果训练集本身是有噪声的,或者数据集太小(引入了采样噪声),那么很可能会导致模型检测噪声本身的模式。导致模型过拟合。

6. 欠拟合训练数据: 欠拟合与过拟合正好相反,就是模型太过简单,缺少一些特征值;

八、测试与验证

在建立模型时,通常将数据源分割成两部分,训练集和测试集。用训练集的数据来训练模型,然后用测试集的数据来测试模型。根据自己数据量的大小,进行分割,一般8:2。

 

标签:机器,0001,训练,模型,系统,学习,监督,数据
From: https://www.cnblogs.com/lxinghua/p/17451433.html

相关文章

  • ChatGPT + Flutter快速开发多端聊天机器人App
    ChatGPT+Flutter快速开发多端聊天机器人Appdownload:3w51xuebccom剖析ChatGPT的应用场景和案例ChatGPT是一种基于人工智能技术的自然语言处理模型,它可以通过对话的方式与用户进行交互。在本篇文章中,我们将介绍ChatGPT的应用场景和相关案例。ChatGPT的应用场景ChatGPT主要应用于......
  • 深入学习RabbitMQ五种模式(一)
    1.安装erlang下载otp_win64_25.3.exehttps://www.erlang.org/downloadserlang安装完成,需要配置erlang环境变量ERLANG_HOME=E:\software\ErlangOTPPATH=%PATH%;%ERLANG_HOME%\bin;2.安装RabbitMQ下载rabbitmq-server-3.11.13.exehttps://www.rabbitmq.com/download.html进入安装......
  • SQLite数据库简单小入门学习(一)
    目录一、认识数据库(一)数据库简介(二)数据库类型二、SQLite数据库(一)SQLite简介(二)学习所需工具(1)scott.db(2)SQLiteSpy.exe(三)SQL语言SQL语言分类1.简单查询2.限定查询(1)关系运算(2)取值范围运算(3)基数范围运算(4)模糊查询(5)空判断(6)逻辑运算这是我在学习SQLite时的笔记,主要是一些比......
  • 微软自动化框架Playwright学习和使用-脚本录制和回访过程
    接上回,可以使用 playwright inspector 来进行脚本录制。今天就说下具体的录制步骤。playwright inspector都会显示出来。   1.点击PlaywrightInspector中的 Record按钮,开始录制  2.点击 Record按钮后,Record按钮显示为红色,代表已经开始录制了。这时将鼠标移动到要测......
  • python算法学习——第1天
    目录1、3,5,7的倍数判定2、鸡兔同笼3、计算有n个字符串中最长的字符串长度4、输出10个不重复的英文字母5、统计一段文字的单词个数并按字母顺序排序输出6、字典合并7、最大公约数&最小公倍数8、输出全排列9、输出<=n的全部回文数10、重复元素判定1、3,5,7的倍数判定num=int(inp......
  • 机器学习的基本概念和应用领域
    机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心,是使计算机具有智能的根本途径。机器学习的应用......
  • Python | 数据分析和计算机视觉 | 学习记录
    计算机视觉empty()和vstack(),hstack():使用循环创建新数组时,可以先用np.empty()创建空数组并确定数组维度,循环中创建新的行数组,再使用vstack()合并数组A=np.empty([0,2],dtype="float32")for...:Axy=...A=np.vsatck(A,Axy)A=vstack()不要漏掉A=......
  • 算法学习day39动态规划part02-62、63
    packageLeetCode.DPpart02;/***62.不同路径*一个机器人位于一个mxn网格的左上角(起始点在下图中标记为“Start”)。*机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角(在下图中标记为“Finish”)。*问总共有多少条不同的路径?*示例:*输入......
  • 算法学习day41动态规划part03-343、96
    packageLeetCode.DPpart03;/***343.整数拆分*给定一个正整数n,将其拆分为k个正整数的和(k>=2),并使这些整数的乘积最大化。*返回你可以获得的最大乘积。*示例:*输入:n=2*输出:1*解释:2=1+1,1×1=1。**/publicclassIntegerBre......
  • 一. 机器学习绪论
    一.绪论1.1引言在计算机系统中,经验通常以数据的形式存在,因此,机器学习所研究的主要内容是关于计算机从数据中产生的模型的算法,即“学习算法”。1.2基本术语现在收集到西瓜的数据\[表\quad1-1\quad西瓜数据集\]编号色泽根茎敲声1青绿蜷缩浊响2乌黑稍......