首页 > 其他分享 >机器学习基础

机器学习基础

时间:2023-04-19 23:55:06浏览次数:35  
标签:机器 函数 模型 基础 损失 学习 参数 数据

机器学习中的关键组件

  • 可以用来学习的数据(data);

  • 如何转换数据的模型(model);

  • 模型用来消化数据;

  • 一个目标函数(objective function),用来量化模型的有效性,判断是否达到目标;

  • 调整模型参数以优化目标函数的算法(algorithm)。

数据

由数据集组成,数据集==样本集合,每个样本都有一组称为特征的属性,模型则会根据这些属性进行预测。例如在进行图像处理时,一张单独的照片被称为一个样本,特征为$rgb三元素数值$表示。
数据的维数:每个样本的特征数量相同,特征向量长度固定。此长度称为维数。
数据不仅需要量,还需要正确的数据。含有偏见的数据训练出来的模型同样是有偏见的。

模型

负责数据的转换。比如根据图片预测笑脸。

目标函数

  • 机器学习:从经验中学习。
  • 学习:指自主提高模型完成某些任务的效能
    如何才算提高?定义度量衡量模型的优劣程度,这个度量在大多数情况是“可优化”的,这被称之为目标函数。又称损失函数,希望优化它到最低点,越低越好。
    损失函数是根据模型参数定义的,并取决于数据集。在一个数据集上,我们可以通过最小化总损失来学习模型参数的最佳值。 该数据集由一些为训练而收集的样本组成,称为训练数据集(training dataset,或称为训练集(training set))。 然而,在训练数据上表现良好的模型,并不一定在“新数据集”上有同样的性能,这里的“新数据集”通常称为测试数据集(test dataset,或称为测试集(test set))。可以理解为模拟考试和正式考试,模拟考试考得好未必代表正式考试考得好。

优化算法

有了数据源、模型、损失函数,接下来就需要一种算法,它能够搜索出最佳参数,以最小化损失函数。

  • 梯度下降:在每个步骤中,梯度下降法都会检查每个参数,看看如果仅对该参数进行少量变动,训练集损失会朝哪个方向移动。 然后,它在可以减少损失的方向上优化参数。

标签:机器,函数,模型,基础,损失,学习,参数,数据
From: https://www.cnblogs.com/pureayu/p/17335131.html

相关文章

  • Java基础知识点API之System
    一:System的介绍总的来说,System类提供了一些与系统相关的方法二:System类的常见方法publicstaticvoidexit(intstatus)终止当前运行的虚拟机publicstaticvoidlongcurrentTimeMil(isc)返回当前系统的时间毫秒值形式publicstaticvoidgc()运行垃圾回收器publicstaticString......
  • Gin学习笔记-A
    fresh包可以实现预加载预定义函数预定义的全局函数,用在html文件中and函数返回它的第一个empty参数或者最后一个参数就是说"andxy"等价于"ifxthenyelsex":所有参数都会执行or返回第一个非empty参数或者最后一个参数亦"orxy"等价于"ifxthenxelsey":所有参......
  • 4月19日map和multimap以及AVL树的学习
    map的插入比较繁琐,但是用方括号运算符就可以直接插入。也可以用方括号查找键的位置并且用它的返回值来修改值。同样map也可以用迭代器来遍历。map头文件中还有一个multimap关键字,他与map不同点在于它可以存入键相同的键值对,以应对某些情况。给定一个单词列表 words 和一个整数......
  • 数据库基础概述
    (一)数据库基础1.什么是数据库数据库这个术语的用法很多,一般来说,数据库是一个以某种有组织的方式存储的数据集合。理解数据库的一种最简单的办法是将其想象为一个文件柜。此文件柜是一个存放数据的物理位置,不管数据是什么以及如何组织的。数据库(database):保存有组织的数据的容器......
  • 学习C语言的第八天
    由于个人的拖拉原因,时隔一周继续更新博客,记录学习。一.结构体1.1为什么要用结构体1.2定义一个结构体编程习惯要求大写开头structStudent{intnum;charname[32];charsex;intage;doublescore;charaddr[......
  • 深度学习--- 深度学习基础1
    本文对接触到的深度学习相关内容做一个梳理。一、深度学习1.深度学习是什么深度学习(DeepLearning)是机器学习(MachineLearning)的一个研究方向,而机器学习属于人工智能(AI,ArtificialIntelligence)的范畴,人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应......
  • 【Linux】基础开发工具使用 --- vim
    目录前言vim的基本概念具体操作插入模式命令模式下的指令底行模式下的指令vim的配置前言......
  • python+playwright 学习-35.获取页面的完整 HTML 内容
    前言selenium里面有个driver.page_source可以获取整个html页面的内容,playwright里面也有类似的方法使用page.content()page.content()获取html内容使用示例withsync_playwright()asp:browser=p.chromium.launch(headless=False)context=browser.new_context(......
  • java学习日记20230415-LinkedHashSet源码
    LinkedHashSet全面说明:LinkedHashSet是HashSet子类;底层是一个LinkedHashMap,底层维护了一个数组和双向链表根据元素的hashCode值来决定元素的位置,同时使用链表维护元素的次序,使得元素看起来是以插入的顺序保存的不允许添加重复元素维护了一个hash表和双向链表,每个节点有pre和......
  • #yyds干货盘点#详解Django基础
    一:创建项目使用django-admin命令构建项目django-adminstartprojectHelloWorld如上使用django构建了一个HelloWorld项目二:项目结构我们可以看到HelloWorld项目结构如下|--HelloWorld||--__init__.py||--settings.py||--urls.py|`--wsgi.py`--manage.p......