首页 > 其他分享 >AI模型常见的压缩技术分类

AI模型常见的压缩技术分类

时间:2024-08-12 22:52:45浏览次数:8  
标签:Knowledge AI 压缩 distillation Quantization 模型 Pruning 转化成

文章目录

Pruning

Pruning 把模型里一些不重要的权重砍掉,减少网络模型中参数量和计算量,同时尽量保证模型的性能不受影响。

Quantization

Quantization. 模型量化就是将训练好的深度神经网络的权值,激活值等从高精度转化成低精度的操作过程,例如将32位浮点数转化成8位整型数int8,同时我们期望转换后的模型准确率与转化前相近。

Knowledge distillation

Knowledge distillation 将已经训练好的大模型包含的知识,蒸馏(Distill)提取到另一个小的模型中去。

标签:Knowledge,AI,压缩,distillation,Quantization,模型,Pruning,转化成
From: https://blog.csdn.net/weixin_43883448/article/details/141144246

相关文章

  • TGI 多-LoRA: 部署一次,搞定 30 个模型的推理服务
    你是否已厌倦管理多个AI模型所带来的复杂性和高成本?那么,如果你可以部署一次就搞定30个模型推理服务会如何?在当今的ML世界中,哪些希望充分发挥其数据的价值的组织可能最终会进入一个“微调的世界”。在这个世界,各个组织会构建大量模型,其中每个模型都针对特定任务进行了高度......
  • containerd配置镜像加速器
    目录Containerd配置镜像加速器1.旧版本配置方法1.1生成containerd配置文件1.2修改配置文件2.新版本配置方法2.1创建目录2.2配置加速器3.测试拉取镜像Containerd配置镜像加速器为什么要给containerd配置镜像加速器?因为k8s1.24以后的容器运行时是containerd,也就是说k8s会......
  • Linux Centos通过mail向QQ邮箱发邮件
    1.配置1.1如果是配置全局文件,则编辑/etc/mail.rc1.2如果是配置当前用户,则编辑~/.mailrc2.配置文件内容#这里填入smtp地址,这里的xxx为qq或者163等,如果用的云服务器,安全组策略要开放465/25端口,入站和出站都要开放该端口setsmtp=smtp.qq.com:587#设置发信人邮箱和昵称(......
  • 2024年新SCI顶刊算法红嘴蓝鹊优化器RBMO优化Transformer模型的多变量时间序列预测
    matlabR2024a以上一、数据集二、2024年新SCI顶刊算法红嘴蓝鹊优化器RBMO红嘴蓝鹊优化算法(Red-billedbluemagpieoptimizer,RBMO)是一种新型的元启发式算法(智能优化算法),灵感来源于红嘴蓝鹊的合作、高效的捕食行为。该成果由ShengweiFu等人于2024年5月发表在SCI顶......
  • 【转载】为什么OpenAI下一步是Agent? 关于Agent你需要知道的一切
    单Agent不就是生物学中的细胞吗?多Agent不就是一个物种部落吗?单Agent不就是生物学中的细胞吗?多Agent不就是一个物种部落吗?大家好。我是甘润泽,毕业于硕士新加坡国立大学(NUS),深度学习方向,现在是AIAgent开发者、全栈工程师。很高兴在AI新智能的俱乐部内给大家做这次分享。我......
  • 【转载】AI Agent,为什么是AIGC最后的杀手锏?
    AIAgent,为什么是AIGC最后的杀手锏?|业界动态 作者:腾讯研究院 2023-11-20AIAgent无疑是当下大模型最激动人心的发展主线,被称为“大模型下一场战事”“最后的杀手产品”“开启新工业革命时代的Agent-centric”。11月7日,OpenAI首届开发者大会(OpenAIDevDay)引爆了AIAgent。OpenA......
  • 每日AI必读资讯 2024-08-12
    原文链接:https://blog.csdn.net/m0_46163918/article/details/14111374601黑匣子被打开了!能玩的Transformer可视化解释工具:TransformerExplainer佐治亚理工学院和IBM研究院开发一款基于web的开源交互式可视化工具「TransformerExplainer」,帮助非专业人士了解Transfor......
  • 【单调栈+倍增】[P7167 [eJOI2020 Day1] Fountain
    【单调栈+倍增】[P7167[eJOI2020Day1]Fountain思路用单调栈处理每个圆盘溢出后流到的第一个位置,然后倍增优化。代码#include<bits/stdc++.h>usingnamespacestd;usingi64=longlong;intmain(){ios::sync_with_stdio(false);cin.tie(nullptr);......
  • 从AlphaGo到AlphaPong:AI乒乓球机器人将如何改变乒乓球竞技?
    在人工智能领域,谷歌DeepMind的AlphaGo曾以其超凡的围棋能力震惊了世界。而如今,DeepMind又将其技术延伸到了乒乓球领域,推出了乒乓球机器人,被网友戏称为“AlphaPong”。这一机器人使用ABB的IRB1100机械手臂,能够与普通人进行激烈的乒乓对抗。那么,中国在乒乓球领域的传统优势是......
  • Neuralink的进展与马斯克的技术愿景——从脑机接口到AI融合的未来
    引言Neuralink,这个由埃隆·马斯克(ElonMusk)创立的公司,一直是科技界的焦点。自从其发布以来,Neuralink的脑机接口技术便吸引了全球的目光。最近,马斯克再次向公众展示了Neuralink的突破性进展,成功为第二位患者植入了脑机接口。这项手术标志着Neuralink在增强人类与机器互动能......