首页 > 其他分享 >1.1 - 机器学习概述

1.1 - 机器学习概述

时间:2024-03-18 13:44:57浏览次数:18  
标签:学习 机器 1.1 距离 cell 概述 Jupyter 范数

1.1.1 ML基本认识

  机器学习是研究AI的一种方法。其从数据中挖掘特征从而学习到一些规律、规则(模型),然后对输入的新数据做出 预测(回归)和判断(分类)。

机器学习主要分为:

        有监督学习:数据有标签

        无监督学习:数据无标签,如:聚类等。

        半监督学习:人工标注是一项极其耗时的工程,为了省一部分人工。只对一部分数据打标签,对模型训练也有效果。从而衍生了半监督学习。

强化学习:没有开始的训练数据,机器从环境中主动学习并获得反馈。

1.1.2 数据集表示方法

  通过笛卡尔坐标系中的坐标点来表示样本数据。在 机器学习中的数学:概率论 中,用距离通过映射函数来计算概率值。因此,在笛卡尔坐标系中,可以通过计算样本点间的距离来衡量样本的相似度

常用的表示距离的方法:

    曼哈顿距离(L1范数);

    欧式距离(L2范数);

    切比雪夫距离(L∞范数);

    闵可夫斯基距离(Lp范数);

    余弦距离(将坐标看作原点出发的向量)。

1.1.3 Jupyter环境设置

  Jupyter是一个实时交互的机器学习代码运行平台,兼具本文文档的功能。 Jupyter按照cell来划分单元,每个cell可以单独运行,cell中的代码每运行一次就相当于复制当前cell的代码然后放在后面与逆行,因此,多次执行某个cell的代码且cell代码修改了其中某个变量的值,下次运行cell的时候,该变量的值会继承上次cell运行返回的结果。

  Jupyte的优势在于:可以将整个项目代码分成几段分别运行;并且能及时返回结果,实时交互。

  修改Jupyter工具默认的项目文件存储 根路径:

    1)在配置文件中设置Jupyter文件存储 根路径。

    2)在某个环境下,修改Jupyter的 文件存储路径为配置文件中的存储路径。

    3)重启。

 

标签:学习,机器,1.1,距离,cell,概述,Jupyter,范数
From: https://www.cnblogs.com/zhangzhenw/p/18080183

相关文章

  • 科技小论文——机器学习
    (1. 石家庄铁道大学,河北省 石家庄市 050043)摘要:本论文旨在研究基于深度学习的图像识别技术,并探讨其在实际应用中的效果。通过收集大量图像数据,利用深度学习模型进行训练和优化,提出了一种基于卷积神经网络(CNN)的图像识别方法。实验结果表明,在经过大规模数据集的训练后,所提出的......
  • 华为OD机试Java - 机器人搬砖
    机器人搬砖前言:本专栏将持续更新互联网大厂机试真题,并进行详细的分析与解答,包含完整的代码实现,希望可以帮助到正在努力的你。关于大厂机试流程、面经、面试指导等,如有任何疑问,欢迎联系我,wechat:steven_moda;email:[email protected];备注:CSDN。题目描述机器人搬砖,一共有N......
  • 【机器学习-04】最小二乘法的推导过程及使用方法(python代码实现)
    最小二乘法是一种常用的数据拟合方法,它可以通过最小化残差平方和来找到数据的最佳拟合线。有了上述内容铺垫之后,本文将介绍最小二乘法的推导过程,并提供使用Python实现最小二乘法的代码示例。1.模型及方程组的矩阵形式改写  首先,我们对......
  • 【机器学习-01】机器学习基本概念与建模流程
      机器学习的过程本质上是一个不断通过数据训练来提升模型在对应评估指标上表现的过程。在此过程中,为模型提供有效的反馈并基于这些反馈进行持续的调整是至关重要的。只有当这个过程顺利进行时,模型才能得到有效的训练,机器才能真正实现学习。  虽然从广义上理解机器学习......
  • python做了一个极简的栅格地图行走机器人,到底能干啥?[第五弹]——解锁蒙特卡洛定位功能
    目录1、前言2、增加的功能3、主要算法python实现3.1定义一个地图和固定标签3.2定义一个粒子3.3定义一个粒子管理类3.4定义粒子运动模型3.5定义观测模型3.6定义权重计算3.6更新粒子重采样4总结5、python源码1、前言在现代科技的普及下,人们对于机器人的兴趣与期待日......
  • 一线/顶级的机器人公司(双足、四足、人形机器人)都在忙啥/主要工作是啥?
    参考:https://www.youtube.com/watch?v=NOljjZP75Gg很多AI方向的人认为这些世界顶级的机器人公司一定是把大量的时间和精力放在了AI技术研发上了,其实不然,AI技术在实体产业上的使用其实并没有想象中的那么大的距离,甚至可以把这个理解为work就OK,尤其机器人公司其实并不需要想那......
  • 机器人路径规划:基于迪杰斯特拉算法(Dijkstra)的机器人路径规划(提供Python代码)
    迪杰斯特拉算法(Dijkstra)是由荷兰计算机科学家狄克斯特拉于1959年提出的,因此又叫狄克斯特拉算法。是从一个顶点到其余各顶点的最短路径算法,解决的是有权图中最短路径问题。迪杰斯特拉算法主要特点是从起始点开始,采用贪心算法的策略,每次遍历到始点距离最近且未访问过的顶点的邻......
  • 07.多线程的概述
    1.线程的概述进程--是我们程序的执行实例,进程在执行的时候,真正执行的就是进程中的线程,进程只是提供了线程执行的资源(PCB)。---进程包含线程进程:进程指正在运行的程序。确切的来说,当一个程序进入内存运行,即变成一个进程,进程是处于运行过程中的程序,并且具有一定独立功能。线程:......
  • 毕业设计:基于机器学习的工地员工安全着装识别系统 目标检测
    目录前言课题背景和意义实现技术思路一、算法理论基础1.1 Mobilenet算法1.2 人脸检测模型二、 数据集2.1数据集2.2数据扩充三、实验及结果分析3.1 实验环境搭建3.2 模型训练最后前言  ......
  • 【Linux】linuxCNC+Qt+Opencascade+kdl+hal 实时6轴机器人控制器
    CNC机器人程序框架机器人模型笔记:debian重启后无法打开共享目录最新版搜狗输入法安装后不支持中文,需要安装旧版本的sogoupinyin_4.0.1.2800_x86_64.deb可用数控机器人在哪些领域应用有优势数控机器人在多个领域都展现出了显著的优势,特别是在需要高精度和......