首页 > 其他分享 >监督学习无监督学习自监督学习

监督学习无监督学习自监督学习

时间:2025-01-22 14:13:31浏览次数:1  
标签:标签 模型 学习 监督 数据 输入

监督学习/无监督学习/自监督学习

监督学习(Supervised Learning )

定义是使用标记数据集来训练,以便训练后的算法可以对数据进行分类或准确预测结果。

在监督学习中,每个样本数据都被正确地标记过(i.e. 带有人工标签)。

模型在训练过程中,被一系列 “监督”误差的程序、回馈、校正模型,以便达到在输入给模型为标记输入数据时,输出则十分接近标记的输出数据,即适当的拟合。

监督学习的目标是学习从输入到输出的映射关系

例子:

图像分类

  • 输入:一张猫的图片。
  • 标签:类别“猫”。
  • 模型的任务是学习从图片到类别“猫”的映射。

情感分析

  • 输入:一段文本“这部电影很棒!”
  • 标签:情感“正面”。
  • 模型的任务是学习从文本到情感“正面”的映射。

房价预测

  • 输入:房屋的特征(如面积、位置、房间数等)。
  • 标签:房价。
  • 模型的任务是学习从特征到房价的映射。

无监督学习(Unsupervised Learning)

无监督学习使用无标签的数据进行训练,模型的目标是发现数据中的结构或模式。

没有明确的监督信号,模型需要从数据本身学习

聚类

  • 输入:一组未标注的客户数据(如年龄、消费习惯等)。
  • 任务:将客户分为不同的群组(如高价值客户、低价值客户)。
  • 模型的任务是发现数据中的自然分组。

降维

  • 输入:高维数据(如图像像素、文本词向量)。
  • 任务:将数据降维到低维空间,同时保留重要信息。
  • 例如,使用 PCA(主成分分析)将数据从 100 维降到 2 维。

生成模型

  • 输入:无标签的图像数据。
  • 任务:学习数据的分布,生成新的图像。
  • 例如,GAN(生成对抗网络)可以生成逼真的图像。

自监督学习(Self-Supervised Learning / Self-Training)

自监督学习使用无标签的数据,但通过设计预训练任务,从数据本身生成监督信号

模型的目标是学习数据的通用特征表示,这些特征可以迁移到下游任务中。

主要思路为:通过mask掉真实数据的一部分,然后使用模型进行预测/生成,接着比较预测结果与真实词来计算损失(如交叉熵损失),最后通过优化算法更新模型参数。

图像修复

  • 输入:一张被遮挡的猫的图片。
  • 任务:预测被遮挡的部分。
  • 模型通过比较预测结果与未遮挡的部分来学习。

文本填空(Masked Language Modeling)

  • 输入:一段文本序列,例如 “我喜欢吃___。”
  • 任务:预测下一个词(如“苹果”)。
  • 监督信号:真实的下一词(“苹果”)作为监督信号。

对比学习

  • 输入:同一张图像的不同增强版本(如裁剪、旋转)。
  • 任务:让模型学习到这些增强版本在特征空间中应该接近。
  • 例如,SimCLR 通过对比学习从无标签图像数据中学习特征表示。

标签:标签,模型,学习,监督,数据,输入
From: https://www.cnblogs.com/mercurystraw/p/18685683

相关文章

  • TensorFlow迁移学习Resnet50预测10-monkey-species
     In [15]:fromtensorflowimportkerasimporttensorflowastfimportnumpyasnpimportpandasaspdfromscipyimportndimageimportmatplotlib.pyplotasplt In [2]:resnet50=keras.applications.ResNet50(include_top=False,po......
  • Nature Methods|可解释机器学习在计算生物学中的应用与陷阱
    在计算生物学和生物信息学领域,机器学习技术正迅速改变着我们对生物系统的研究方式。然而,随着模型复杂度的增加,如何解释这些模型的行为并从中提取生物学意义,成为了一个亟待解决的问题。最近,卡内基梅隆大学的JianMa和AmeetTalwalkar团队在《NatureMethods》杂志上发表了一篇题为......
  • 数学建模学习-朴素贝叶斯分类器(Naive Bayes Classifier)教程(31)
    数学建模学习-朴素贝叶斯分类器(NaiveBayesClassifier)教程(31)写在最前注意本文的相关代码及例子为同学们提供参考,借鉴相关结构,在这里举一些通俗易懂的例子,方便同学们根据实际情况修改代码,很多同学私信反映能否添加一些可视化,这里每篇教程都尽可能增加一些可视化方便同......
  • Day22-【英语】短文,从box学习/ɑː/音如何发音?
    十六、/ɑː/音如何发音?口型比中文的“啊”要饱满示例单词:box[bɑːks]和box结构类似的其他单词有哪些?以PETS一级中的单词为例:30个发音字母组合/情况音标单词翻译/ɑː/字母组合“o['enibɑːdi]anybodyprep.(否定、疑问、条件句中)任何人;(肯定句中)随便哪一个人/......
  • Markdown+LaTeX+C++| VS Code 搭建高效学习环境
    Markdown+\(\LaTeX\)+C++|VSCode搭建高效学习环境开始之前:创建一个文件夹作为你的工作区,确保它没有中文路径并且文件夹下的文件也不能用中文命名。在https://code.visualstudio.com/上下载并安装VisualStudioCode。确保你的电脑系统为Windows且版本在Windows7.0......
  • Transformer 学习与解读
    LLM学习笔记注意力机制sequencetosequence(seq2seq)输入N个向量,输出任意可能数量的向量(由机器决定);如果输出N个向量的任务就叫做SequenceLabeling李沐课程讲义:https://zh-v2.d2l.ai/chapter_attention-mechanisms/self-attention-and-positional-encoding.html在注意力机制......
  • 自学网络安全(黑客技术)2025年 —100天学习计划
    前言什么是网络安全网络安全可以基于攻击和防御视角来分类,我们经常听到的“红队”、“渗透测试”等就是研究攻击技术,而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行,因为不知如何去学,在这里,我将这个整......
  • 下降幂、斯特林数学习笔记
    下降幂注:这里其实还有上升幂。定义下降幂:\(x^\underline{k}=\prod\limits_{i=x-k+1}^xi=\frac{x!}{(x-k)!}\)上升幂:\(x^\overline{k}=\prod\limits_{i=x}^{x+k-1}i=\frac{(x+k-1)!}{(x-1)!}\)性质幂相加:\[n^\underline{a+b}=n^\underlinea(n-a)^\underlineb\]\[n^\overl......
  • 前端学习思路(从0基础到大神,超详细)
    从零开始学习前端开发并成为高手,是一个需要时间、耐心和持续实践的过程。下面提供一个超详细的前端学习思路,帮助你规划学习路径:1.基础知识(深入)HTML语义化标签:学习HTML5新引入的语义化标签如<article>,<section>,<aside>等,了解它们如何提升网页结构的可读性和SEO。表单......
  • Java 大视界 -- Java 大数据中的强化学习算法实践与优化 (57)
           ......