大数据机器学习中，无监督学习和有监督学习的概念和区分？（简述，适用于初学者理解）

时间：2024-06-19 21:28:01浏览次数：14

一、无监督学习：
   无监督学习就是根据类别未知(没有被标记)的训练样本，解决模式识别中的各种问题。无监督学习的训练数据不包含标记或者分类信息。在无监督学习中，算法需要从数据中发现隐藏的模式、结构和规律，而不是根据预先定义的目标进行分类或者预测。
   举例：a.聚类算法。（比如K均值聚类）聚类的目的在于把相似的东西聚在一起，将数据分成若干组，使得同一组内的数据点彼此相似，而不同组之间的数据点尽可能不相似。这样的聚类可以帮助发现数据中的内在结构，比如市场细分、社交网络中的用户群等。
       b.降维技术。（比如主成分分析PCA）PCA通过线性变换将高维数据投影到低维空间，保留最重要的特征，从而帮助理解数据的内在结构和特性。

二、有监督学习：
监督学习是利用一组已知类别的样本调整分类器的参数，使其达到所要求性能的过程。有监督学习的训练数据包含输入特征和对应的标记或输出。在有监督学习中，算法的目标是学习一个输入到输出的映射，以便能够对新的输入数据做出预测或者分类。

    常见的分类算法有线性分类器、支持向量机(SVM)、决策树、k近邻和随机森林
   举例：a.线性回归。线性回归好汉一组输入特征和相应输出值的训练数据，算法的任务是学习一个线性模型，以使得输入特征与输出值之间的关系达到最佳拟合。然后利用学习到的模型对新的输入特征进行预测，比如根据房屋的特征来预测其价格。
       b.支持向量机（SVM）。SVM是实现分类任务的算法，算法通过已标记的训练数据学习一个决策边界，以将不同类别的数据点分开。学习完成后，该模型可以用于对新的未标记数据进行分类。

三、区别：

监督学习和无监督学习之间的主要区别在于她们处理训练数据的方式以及学习目标的不同。

   a.训练数据：
   ·监督学习：训练数据包含输入特征和对应的标记或者输出，也就是说，每个训练样本都有一个明确的标签或输出值。
   ·无监督学习：训练数据不包含标记或者分类信息，只包含输入特征。换句话说，训练样本没有明确的标签或者输出值。

   b.学习目标：
   ·监督学习：算法的目标是学习一个输入到输出的映射，以便能够对新的输入数据做出预测或分类。也就是需要标记数据，即每个输入数据都有一个对应的标签或输出。
   ·无监督学习：算法的目标是从数据中发现隐藏的模式、结构或者规律，而不是根据预先定义的目标进行分类或预测。通俗点就是只需输入数据，不需要对应的标签。

   c.应用领域：
   ·监督学习常用于预测、分类、回归等任务，比如房价预测、垃圾邮件过滤等。
   ·无监督学习常用于聚类、降维、异常检测等任务，比如市场细分、数据可视化、异常行为检测等。

标签：分类,算法,学习,监督,初学者,数据,输入
From： https://blog.csdn.net/C_EST_L_VIE/article/details/139798855

初识Python————Python“三剑客“（适用初学者，了解概述，有官网）
Python三剑客指的是Pandas、Numpy和Matplotilb这三个库，它们在数据分析领域扮演着核心角色。它们各自拥有独特的功能和优势，结合使用可以极大地提高数据分析的效率和准确性。一、NumpyNumPy是使用Python进行科学计算的基础包。它包含如下的内容：一个强大的N维数组......
3、18 贡献法学习
贡献法计算每一个字符对答案的贡献，然后进行地推求解即可；题目：https://www.acwing.com/problem/content/5157/计算贡献1、当[变化]的对象存在两个时尝试[固定]一者可以发现对于ρ(“TCG”,”GCA”)而言三轮操作中的每轮操作是等价的每轮(第一层循环左移)对结果的贡献是......
基于深度学习的图像压缩
基于深度学习的图像压缩图像压缩是指将图像数据量减小的同时尽量保留其视觉质量的过程。传统的图像压缩方法（如JPEG、PNG等）已经广泛应用，但随着深度学习技术的发展，基于深度学习的图像压缩方法逐渐显现出其优越性。以下是一些关键方法和模型，它们在图像压缩任务中表现出色。深度......
基于深度学习的图像去噪
基于深度学习的图像去噪图像去噪是从受噪声污染的图像中恢复原始图像的过程。在传统方法中，常用的去噪技术包括均值滤波、中值滤波和维纳滤波等。随着深度学习技术的发展，基于深度学习的图像去噪方法取得了显著进展。深度学习图像去噪方法1.卷积神经网络（CNN）卷积神经网络是图......
【深度学习驱动流体力学】计算流体力学openfoam-paraview与python3交互
目的1:配置ParaView中的PythonShell和Python交互环境ParaView提供了强大的Python接口，允许用户通过Python脚本来控制和操作其可视化功能。在ParaView中，可以通过View>PythonShell菜单打开PythonShell窗口，用于执行Python代码。要确保正确配置Python......
【深度学习驱动流体力学】OpenFOAM 编译完成Bin目录命令计算流体力学详解
OpenFOAM译完成Bin目录下包含了多个关键命令和工具，用于管理、运行和优化仿真过程中的各个环节。这些命令涵盖了从创建新案例、运行仿真到分析结果的全过程，包括处理网格、设置物理条件、运行求解器和后处理数据等多个方面。每个命令和工具都有其特定的功能和操作方法，用户......
【人工智能】讯飞星火Prompt提示词工程基础学习
AIPrompt工程师认证学习为什么要创建AI助手1）解决重复性操作，使用Prompt结构化的模板将AI大模型的特定能力固定，一劳永逸2）减少输入，减少反复思考压力3）更稳定，效率提升，可以直接使用已经调整好参数的AI助手所提供的服务（提高生产力）4）便于分享，将助手分享给其他用户共同体验解......
机器学习day03
机器学习day03超参数选择方法--交叉验证、网格搜索、手写数字识别案例1交叉验证1.1什么是交叉验证？是一种数据集的分割方法，将训练集划分为n份，拿一份做验证集（测试集）、其他n-1份做训练集1.2交叉验证法原理：将数据集划分为cv=4第一次：把第一份数据做验证集，其他数据做训练第......
论如何使用机器学习，预测客户流失率，轻松实现客户精准维护
01、案例说明首先我们学习最经典的机器学习模型，就是监督学习（SupervisedLearning）中的分类模型。这边使用的是一个电信公司的案例，通过客户的基本资料和一些简单的互动信息，建立一个模型，以预测哪些客户有较高的可能性流失，从而进行补救。因为研究显示得到一个新客户的成本是维......
Javascript入门博客【入门复习（学习）使用】
JavaScript是一门高级，解释形语言，大量用于关于web网站的开发，可以和网页联动做出更多有趣的动画效果。其运行方式大都是嵌入在网页中运行。其实在定义方面如果过你是初学者来学习和这方面相关的知识，知道上面这些就已经足够了。我们可以在浏览器中直接进行对代码的控制，进入浏览器......

大数据机器学习中，无监督学习和有监督学习的概念和区分？（简述，适用于初学者理解）

相关文章

赞助商

阅读排行