首页 > 其他分享 >知识蒸馏(Distillation)简介

知识蒸馏(Distillation)简介

时间:2024-11-12 21:17:03浏览次数:3  
标签:hard 蒸馏 简介 模型 知识 Distillation soft target

 1.介绍

    知识蒸馏最早出自于论文“Distilling the Knowledge in a Neural Network”,作者是深度学习泰斗Geofrey Hinton,在人工智能方向上,有公认的四大天王,见下图,另外,博主也算是吴恩达的学生,从一个门外汉看他的视频一步一步的走上了算法工程师的岗位,建议有这方面兴趣的人,可以去看他的视频,比培训班的视频不知道要强多少。

da68cb7979742451dc4d1a1529cd4abe.png

2.模型结构

8408b30c0909580d13785dca1b398005.png

第一步:训练大模型(teacher 模型),用到的标签是正常(hard)label(one-hot之后的,比如【0,0,1,0】)

第二步:计算soft target:利用训练好的大模型来计算soft target,也就是大模型的输出经过下面的公式计算,其中T一般从20开始试

2579cf72427533a6ee9fde5315835c2a.png

第三步:训练小模型(student 模型),在小模型的基础上再加一个额外的soft target的loss function,通过权重来调节两个loss functions的比重

a01644221487e17dfce650718259691a.png

第四步:预测时,将训练好的小模型按常规方式(右图)使用,这个和正常的网络预测没有任何区别,不要想复杂了

3.模型特点

      1.hard label与 soft  target区别?

      hard label一般是这样的:【0,0,1,0】,除了表示第三个位置的概率为1,并不能表示其它信息

      soft   target一般是这样的:【0.1,0.1,0,6,0.2】,其它位置(除了第三个位置)也能表示是这个属性的概率有多少,这里面有一个潜在关系,即不同类别之间的关系

     2.上面公式中,T的作用?

     T的作用就是起一个软化作用,比如输出为【0.001, 0.149,0.85】(现在比较好分类),经上面公式计算之后,soft target为【0.1,0.3,0.6】(分类正确相对于前面变困难了一点)这就人为的加大了训练困难,当T最后被设置为1的时候,结果就会接近teacher 模型

有了理论,怎么可能缺少实战内容呢

Pytorch框架——知识蒸馏(Distillation)分类实战_知识蒸馏csdn-CSDN博客

keras框架——知识蒸馏之深度学习VGG19神经网络图像分类系统源码_keras 知识蒸馏-CSDN博客

标签:hard,蒸馏,简介,模型,知识,Distillation,soft,target
From: https://blog.csdn.net/m0_59023219/article/details/130964649

相关文章

  • Elasticsearch简介
    前言什么是搜索引擎搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。分类:全文索引搜索引擎采集ip段内的网页数据,扫描网页内容的每一个词,对其创建索引,指明词......
  • jQuery 选择器简介及其代码样例
    一、jQuery选择器简介jQuery选择器是一种强大的工具,用于在HTML文档中快速、便捷地选取一个或多个DOM元素,以便对这些元素进行后续的操作,比如修改样式、添加事件处理函数、获取或修改元素内容等。它提供了多种类型的选择器,每种类型都有其特定的用途和语法,使得开发者可以根据......
  • 集成学习(Ensemble Learning)简介
    1集成学习作用俗话说:“三个臭皮匠赛过诸葛亮”。当使用某一种分类器不能使我们达到很好的效果的时候,我们不妨设想将这些分类效果不好的分类器组合一下,再去看看效果是否有提升,这就是集成学习(EnsembleLearning)的思想。集成学习是机器学习中的一种思想,它通过多个模型的组合......
  • (12-1)使用YOLOv8识别检测交通标志:背景介绍+项目简介+准备环境
    12.1 背景介绍随着自动驾驶技术的不断发展和智能交通系统(ITS)逐步普及,交通标志的自动识别成为了交通安全和管理中的一个重要研究领域。交通标志不仅为驾驶员提供必要的指示信息,同时也是自动驾驶系统中重要的感知模块。准确、高效地识别和理解交通标志对自动驾驶系统的安全性......
  • # Playwright爬虫(.net)介绍:1 简介
    Playwright是一个由Microsoft开发的开源工具,用于自动化Web浏览器的测试和操作。它提供了一种跨浏览器、跨平台的自动化解决方案,可以在Chromium、FireFox、微软Edge等多种浏览器上进行测试和操作。如果你曾经使用过Selenium,那么我可以告诉你,Playwright的用途与Selenium非常类似,可......
  • USB、CAN、CAN FD、SPI、IIC、UART常见的通信协议简介
    USB、CAN、CANFD、SPI、IIC、UART都是常见的通信协议,它们在许多领域都有广泛的应用。以下是对这些通信协议的详细介绍:USB(通用串行总线)定义:USB(UniversalSerialBus)是一种计算机与外围设备进行数据交互的通信协议。版本与速度:常用的版本有USB2.0(480Mbps)和USB3.0(速率更高)。......
  • QRust(一) 简介
    QRust是一个开源组件,是Qt和Rust两种语言的混合编程中间件,是Qt调用Rust函数的支持技术。QRust来源于工具软件OnTheSSH,OnTheSSH软件由Qt和Rust两种语言共同构建,Rust实现了SSH通讯底层协议,Qt搭建程序界面,Qt调用Rust的技术需求催生出了QRust。一个使用QRust的例子:Rust端:fninvo......
  • 一致性蒸馏
    一致性蒸馏是一种机器学习技术,用于从一个大型模型中提取出重要的特征,并将其转移到一个小型模型中。在图像处理领域,一致性蒸馏可以用来将一个复杂的图像风格转换模型中的重要特征提取出来,并应用到一个新的、更简单的模型中,从而实现更快、更准确的图像风格转换。一致性蒸馏的核心思......
  • 地应力分析平台简介
    一、平台介绍地应力分析平台是由专业团队开发的云平台软件,专为地应力数据的计算、统计、绘图、管理和综合分析而设计。该平台包含多个分析模块,并以插件形式集成了多个适用于地应力数据分析的工具集,极大地提高了地应力数据的处理效率和分析准确性(一站式地应力数据管理与分析)。......
  • 五子棋软件简介及其用法
    本文按照五子棋对弈平台、五子棋单机版软件、五子棋界面+引擎三种模式的顺序介绍。五子棋对弈平台人机对弈 http://wap.lltskb.com/shfw/game/wzq/index.html?eqid=a0cd9efb0000c3ca00000006645b4932 天天象棋里的欢乐五子棋   五子棋单机版软件gomocalc网页......