机器学习基本术语

主要的基本术语

数据集、样本、样本空间、属性、属性空间、特征向量、维数、训练样本、训练集、标记空间、测试样本、有监督学习、无监督学习、泛化能力。

数据集

记录了一系列关于某个事物或对象的特征描述。
例如：西瓜的一个数据集

色泽	根蒂	敲声	瓜的好坏（label）
青绿	乌黑	清脆	好瓜
...	...	...	...

以上的多条数据组成了一个数据集

样本

数据集中的任意一条记录都是一个样本，众多样本共同组成了数据集。
样本空间即多个样本组成的集合。

属性

属性即样本的某一属性（也称为特征），例如西瓜的色泽是西瓜的一个属性。

属性空间

属性空间即机器学习研究的事物的多个属性共同组成的一个集合。也称为样本空间/输入空间。

特征向量

上述西瓜的数据集中，可知有三个属性值：色泽、根蒂、敲声。
将其作为数据分别输入到x,y,z轴用于描述西瓜。可以知道每个西瓜都能在这个空间之中找到唯一的坐标向量。因此一个实例也可以成为特征向量。

维数

属性的数目

训练样本

从数据集中提取一部分样本用于模型的训练，每一个参与模型训练的样本都称为训练样本，众多训练样本共同组成了训练集。

标记

在模型的训练之中，我们需要获得样本的结果信息。例如西瓜的例子中对于瓜好坏的判断即是标记

标记空间

所有标记的集合即标记空间

测试样本

即用于测试训练过后的模型拟合优劣程度的样本。
众多测试样本共同组成了测试集。

有监督学习/无监督学习

根据训练数据是否有标记信息可将学习任务分为有监督学习和无监督学习。
有监督学习有标记信息，如分类、回归等；
无监督学习没有标记信息，如聚类。

泛化能力

即经历过训练后的模型对于新数据的适用程度。具有强泛化能力的模型能够较好的适用于整个样本空间。

标签：术语,西瓜,机器,标记,样本,学习,数据,属性
From： https://www.cnblogs.com/shineyun/p/17055190.html

算法学习笔记(10): BSGS算法及其扩展算法
BSGS算法及其扩展算法BSGS算法所谓BabyStep,GiantStep算法，也就是暴力算法的优化用于求出已知\(a,b,p,p为质数\)时\(a^x\equivb\pmodp\)的一个最小正整......
【学习日志】后端接口常见优化方案总结
耗时操作异步，可以考虑使用Future或Java8后出现的CompletableFuture内存缓存，分布式用Redis，单机用Guava，注意缓存问题（击穿，穿透和雪崩），Redis的两种缓存结构锁粒度控制数据库......
2022年上半年网络安全应急响应分析报告学习笔记
声明本文是学习2022年上半年网络安全应急响应分析报告.而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们2022年上半年应急2022年1-6月，奇安信集团......
percona xtrabackup 学习总结
1.安装版本选择官网：https://www.percona.com/downloads/PerconaXtraBackup8.0 只支持MySQL8.0的版本PerconaXtraBackup2.4 支持MySQL5.11,5......
【学习日志】Java8的CompletableFuture
Java8引入的CompletableFuture，对Future做了改进：1.可以传入回调对象，不再像Future那样循环查询执行结果。2.另外可以将多个Future结合到一起并行或串行执行，主要方法如下：......
循序渐进，学习开发一个RISC-V上的操作系统 5.1答案
现知道某条RISC-V的机器指令在内存中的值为b3059500，从左往右为从低地址到⾼地址，单位为字节，请将其翻译为对应的汇编指令。解:risc-v是小端模式将这个16进制的数倒......
JUC学习笔记
1进程与线程：进程指正在运行的程序，进程拥有一个完整的、私有的基本运行资源集合。它有自己的内存空间。为了便于进程之间的通信，大多数操作系统都都支持进程间通信（IPC）.IPC......
MarkDown学习
MarkDown学习二级标题三级标题四级标题字体Hello，world！Hello，world！Hello，world！Hello，world！Hello，world！Hello，world！引用我一定要好好学习，早日成为大神分割线......
win11配置深度学习环境GPU
参考网址：https://zhuanlan.zhihu.com/p/460806048CUDA11.6 + CUDNN+ Anaconda+ pytorch 电脑信息RTX2060GPU01.CUDA11.61.1 确认信息C:\Users\thzn>n......
【Python学习】图片放缩
使用图片对模型进行训练时，对图片的大小有一定的要求，因此需要对图片进行放缩。安装包PILpipinstallPillow简单介绍基本使用方法#ImportsPILmodulefromPILi......

机器学习基本术语

机器学习基本术语

主要的基本术语

数据集

样本

属性

属性空间

特征向量

维数

训练样本

标记

标记空间

测试样本

有监督学习/无监督学习

泛化能力

相关文章

赞助商

阅读排行