首页 > 其他分享 >《白话机器学习的数学》第1章——开始二人之旅

《白话机器学习的数学》第1章——开始二人之旅

时间:2024-07-19 18:28:41浏览次数:12  
标签:机器 之旅 白话 标签 分类 学习 聚类 数据

1.1对机器学习的兴趣

1.2机器学习的重要性

        1.无论是过去还是现在,计算机都特别擅长处理重复的任务。所以 计算机能够比人类更高效地读取大量的数据、学习数据的特征并 从中找出数据的模式。这样的任务也被称为机器学习或者模式识 别,以前人们就有用计算机处理这种任务的想法,并为此进行了 大量的研究,也开发了很多代码。

        2.受益于计算机理论的发展,现在已经具备了能够收集大量数据的环境和能够处理大量数据的环境

        3.。当我们打算用机器学习做什么事情的时候, 首先需要的就是数据。因为机器学习就是从数据中找出特征和模 式的技术。

1.3机器学习的算法

        4.机器学习擅长的任务:回归分类聚类。

        5.回归就是在处理连续数据如时间序列数据时使用的技术。

        时间序列数据就是那些连续观测到的因时而异的数据。

        6. 鉴别垃圾邮件就可以归类于分类。

        只有两个类别的问题称为二分类,有三个及以上的问题称为多分类。

        7.聚类与分类相似,却又有些不同。聚类考虑的问题是:假设在有 100 名学生的学校进行摸底考试,然后根据考试成绩把 100 名学生分为几组,根据分组结果,我们能得出某组偏重理科、某组偏重文科这样有意义的结论。

        它与分类的区别在于数据带不带标签。也有人把标签称为正确答案数据。

         8.使用有标签的数据进行的学习称为有监督学习,与之相反,使用没有标签的数据进行的学习称为无监督学习。回归和分类是有监督学习,而聚类是无监督学习。

1.4数学与编程

        9.机器学习常用的开发语言有 Python 和 R。

标签:机器,之旅,白话,标签,分类,学习,聚类,数据
From: https://blog.csdn.net/weixin_51130882/article/details/140556742

相关文章

  • 【Linux】Linux进程揭秘:从理论到实践的深度探索之旅
    目录前言:操作系统简介概念设计目的理解进程:程序的执行之魂进程和程序的联系与区别 描述进程-PCB进程的标识符 进程状态 状态转换僵尸进程孤儿进程前言:操作系统简介概念操作系统(英语:OperatingSystem,缩写:OS)是一组主管并控制计算机操作、运用和运行硬件、软......
  • 通过pushgateway 推送的一批机器的nodeexporter,怎么判断这批机器是否有宕机的,已解决
    上回说到,即使你的监控已经下线,prometheus还会拉取到旧的监控数据,需要手动清理pushgateway不要的数据。但是这样并不符合我们监控的预期,尤其是对于pushgateway获取的机器如果宕机的话,就会收不到告警,本文针对此问题做一个处理给node-exporter增加一个告警项,unix时间戳,这里采用n......
  • 机器学习中常用的数据类型
    常用的数据类型有FP64、FP32、FP16、BFLOAT16等FP64FP64表示64位浮点数,通常为IEEE754定义的双精度二进制浮点格式,由1位符号位、11位指数位、52位小数位组成表示范围:正数范围:约4.9x10e-324~1.8x10e308负数范围:约-1.8x10e308~-4.9x10e-324通常用于精度要求......
  • 计算机毕业设计PySpark+Django高考志愿填报推荐系统 高考预测 高考大数据分析 Hadoop
    摘要本文旨在设计与实现一个基于Spark的高考志愿填报推荐系统,旨在帮助高考生根据自身成绩和兴趣,精准推荐合适的大学和专业。系统采用大数据处理框架Spark,结合机器学习算法,实现了对高考数据的深度挖掘和分析,为考生提供科学、有效的志愿填报建议。系统捕捉考生个人特征、......
  • Java基础-Java代码变成机器可执行代码过程
    1Javac编译因为JVM把Javac把Java代码编译成字节码,即把.java文件变成.class文件,JVM(Java虚拟机)可以理解字节码文件,将其转换为机器可以执行的代码,所以只要安装了JVM的平台,都可以运行Java程序。2JVMJavac编译后,Java文件就变成了字节码文件,JVM类加载器会去加载字节码文件,然后由解......
  • XGBoost模型构建+SHAP解析-Python代码——用XGBoost模型实现机器学习并进行黑箱过程解
    一、XGBoost模型简介1.1适用范围XGBoost(ExtremeGradientBoosting)是一个基于梯度提升(GradientBoosting)框架的增强算法,广泛应用于分类、回归、排序等任务。常见的应用包括:信用风险评估销售预测病毒检测图像识别1.2原理XGBoost是梯度提升树(GradientBoostedDecisionTree......
  • 决策树模型构建+调参Python代码——用决策树模型实现机器学习
    一、决策树模型简介1.1适用范围决策树模型(DecisionTree)可以用于分类和回归任务,广泛应用于以下领域:客户细分信用风险评估医疗诊断营销策略优化1.2原理决策树是一种树形结构的预测模型,通过一系列的特征测试(即节点的分裂)将数据集逐步划分,从而形成一个树状的决策路径。每个节......
  • 智能结合:信息推送与供需发布机器人
    摘要在数字化浪潮中,信息的快速传递与资源的高效匹配是企业与用户互动的关键。本文将探讨信息推送机器人与供需发布机器人的智能结合,旨在通过技术创新提升用户体验和企业效率。引言随着技术的进步,信息推送和资源匹配的方式也在不断演变。传统的手动推送和资源发布不仅效率低......
  • TG群导航机器人:深度检索技术的创新应用
    关键词TG群导航机器人,深度检索,信息检索,智能助手1.引言TG群导航机器人是一种运行在TG平台上的智能助手,能够根据用户的需求,自动检索并推送相关信息。通过深度检索技术的应用,机器人能够提供更加精准和个性化的信息服务。在信息泛滥的今天,精准的信息检索变得尤为重要。TG群导......
  • MiniRHex:一种开源的六足机器人 by DYNAMIXEL Robotis
    原文链接:https://www.youtube.com/watch?v=ldLXVDNCCzc  At#IROS 2023,weranintotheCarnegieMellonUniversity RobomechanicsLab.TheyhadsomereallycoolrobotstherethatwerePoweredby#DYNAMIXEL XLseriesmotors.Oneoftherobotstheyhadfeat......