首页 > 其他分享 >什么是机器学习?

什么是机器学习?

时间:2022-09-05 09:23:51浏览次数:68  
标签:机器 什么 学习 算法 可视化 数据 模型

什么是机器学习?

参考了网络上的各家说法,一句话概括就是数据学习,机器决策(对应输入和输出)。

机器学习通常解决分类,回归等问题。

1 分类算法&机器学习

一张图概括分类算法流程

机器学习

  1. 原始数据集
  2. 探索性数据分析
  3. 数据预处理
  4. 数据分割(训练和测试)
  5. 算法建模
  6. 选择机器学习任务
  7. 模型结果评估

1.1 数据集

数据集本质上是一个M*N矩阵(N由X变量和Y标签变量组成)

1.2 数据分析

EDA做的是去了解数据,知道数据分布,通过图表对数据做直觉分析。通用的EDA三大方法包括

  • 描述性统计:av,mean,模式,标准差
  • 数据可视化:热力图(辨别特征内部相关性)、箱形图(可视化群体差异)、散点图(可视化特征之间的相关性)、主成分分析(可视化数据集中呈现的聚类分布)等。
  • 数据整形:对数据进行透视、分组、过滤等。

1.3 数据预处理

对数据做检查和校正

数据的质量将对机器学习算法模型的质量好坏产生很大的影响。因此,为了达到最好的机器学习模型质量,传统的机器学习算法流程中,其实很大一部分工作就是在对数据进行分析和处理。

一般来说,数据预处理可以轻松地占到机器学习项目流程中80%的时间,而实际的模型建立阶段和后续的模型分析大概仅占到剩余的20%。

1.4 数据分割

训练和测试8:2

1.5 算法建模

机器学习算法可以大致分为以下三种类型之一:

  • 监督学习:是一种机器学习任务,建立输入X和输出Y变量之间的数学(映射)关系。这样的(X、Y)对构成了用于建立模型的标签数据,以便学习如何从输入中预测输出。
  • 无监督学习:是一种只利用输入X变量的机器学习任务。X变量是未标记的数据,学习算法在建模时使用的是数据的固有结构。
  • 强化学习:是一种决定下一步行动方案的机器学习任务,它通过试错学习(trial and error learning)来实现这一目标,努力使reward回报最大化。

参数调优(入门能做的)
传说中的调参侠主要干的就是这个工作啦。超参数本质上是机器学习算法的参数,直接影响学习过程和预测性能。由于没有万能的超参数设置,可以普遍适用于所有数据集,因此需要进行超参数优化。

特征选择
从大量特征中选择重要的特征子集。特征选择的任务本身就可以构成一个全新的研究领域,在这个领域中,大量的努力都是为了设计新颖的算法和方法。从众多可用的特征选择算法中,一些经典的方法是基于模拟退火和遗传算法。除此之外,还有大量基于进化算法(如粒子群优化、蚁群优化等)和随机方法(如蒙特卡洛)的方法。

机器学习任务

  • 分类
    一个训练好的分类模型将一组变量作为输入,并预测输出的类标签。可视化图可以通过执行PCA分析并显示前两个主成分(PC)来创建;或者也可以选择两个变量的简单散点图可视化。

  • 性能指标
    如何知道训练出来的机器学习模型表现好或坏?就是使用性能评价指标(metrics),一些常见的评估分类性能的指标包括准确率(AC)、灵敏度(SN)、特异性(SP)和马太相关系数(MCC)。

  • 回归
    Y = f(X)。其中,Y对应量化输出变量,X指输入变量,f指计算输出值作为输入特征的映射函数(从机器学习模型中得到)。

评估回归模型性能的常用指标是确定系数(R²)。此外,均方误差(MSE)以及均方根误差(RMSE)也是衡量残差或预测误差的常用指标。

贴张深度学习的流程

深度学习

标签:机器,什么,学习,算法,可视化,数据,模型
From: https://www.cnblogs.com/hshsk/p/16656913.html

相关文章

  • MPI学习笔记(四):矩阵相乘的Cannon卡农算法
    mpi矩阵乘法:C=αAB+βC一、Cannon卡农算法基本介绍1、二维矩阵串行乘法两个n维方阵的乘法A×B=C的串行计算公式为:下图是用图示来表示的这种计算规则:2、二维块划分的......
  • 什么?MySQL 8.0 会同时修改两个ib_logfilesN 文件?
    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。GreatSQL是MySQL的国产分支版本,使用上与MySQL一致。作者介绍:孙黎,GreatDB认证DBA问题现象描述......
  • MongoDB学习(二)
    MongoDB基本操作查看数据库语法:showdatabases选择数据库语法:use数据库名注意:在MongoDB中选择不存在的数据库不会报错,后期当该数据库有数据时,系统会自动创建,这叫隐......
  • 提供实时机器学习预测服务简介
    提供实时机器学习预测服务简介实时机器学习越来越受到用例的关注,例如使用编码为特征的近期会话活动的实时推荐模型、音乐会门票预订/拼车应用程序中使用的激增价格预测算......
  • Vue学习之--------深入理解Vuex之getters、mapState、mapGetters(2022/9/3)
    这一篇博客的内容是在上一篇博客的基础上进行:深入理解Vuex、原理详解、实战应用@目录1、getters的使用1.1概念1.2用法1.3如何读取数据2、getters在项目中的实际应用3......
  • Vue学习之--------深入理解Vuex之多组件共享数据(2022/9/4)
    在上篇文章的基础上:Vue学习之--------深入理解Vuex之getters、mapState、mapGetters1、在state中新增用户数组2、新增Person.vue组件提示:这里使用nanoid来生成新用户......
  • 将机器学习应用于 A/B 假设测试
    将机器学习应用于A/B假设测试什么是A/B测试?A/B测试是一种比较某事物的两个版本以确定哪个性能更好的方法。虽然它最常与网站和应用程序相关联,但该方法已有近100......
  • Vue学习之--------深入理解Vuex之模块化编码(2022/9/4)
    在以下文章的基础上1、深入理解Vuex、原理详解、实战应用:https://blog.csdn.net/weixin_43304253/article/details/1266513682、深入理解Vuex之getters、mapState、mapG......
  • 自定义反应钩子。它们是什么以及它们有什么帮助?
    自定义反应钩子。它们是什么以及它们有什么帮助?Photoby劳塔罗·安德里亚尼on不飞溅介绍ReactHooks是在React.jsv16.8中引入的。它们允许我们在功能组件中使......
  • 零基础学习Python字典操作
    零基础学习Python字典操作在Python中,字典是一种可以将相关的两个信息关联起来的操作,并且字典可存储的信息量几乎不受限制,下面一起来跟小编学习一下如何访问和使用字典中......