首页 > 其他分享 >AI经典模型参数规模

AI经典模型参数规模

时间:2023-11-14 18:36:28浏览次数:36  
标签:billion BERT Transformer AI million 参数 经典 GPT

| 模型 |                          参数数量 |
|-----------------------------|-----------------------------|
| AlexNet | 约 60 million |
| VGG16 | 约 138 million |
| ResNet50 | 约 25 million |
| InceptionV3 | 约 23 million |
| MobileNetV2 | 约 3.5 million |
| EfficientNetB0 | 约 5 million |

图像识别

-----------------------------------------------------------------
| BERT (Base) | 约 110 million |
| GPT-1 | 约 110 million |
| GPT-2 (1.5 billion 参数) | 约 1.5 billion |
| GPT-3 (175 billion 参数) | 约 175 billion |
| GPT-3.5 (175 billion参数) | 约 175 billion |

NLP

-----------------------------------------------------------------

1. BERT (Bidirectional Encoder Representations from Transformers):
参数数量:约 110 million(BERT Base)
简介:BERT 是一种基于 Transformer 模型的预训练模型,通过双向上下文表示学习在各种 NLP 任务中取得了显著的成功。

2. ELMo (Embeddings from Language Models):
参数数量:依赖于具体配置,通常较大
简介:ELMo 通过组合不同层次的语言模型来生成词嵌入,具有上下文感知性。

3. Transformer-XL:
参数数量:依赖于具体配置,通常较大
简介:这是 Transformer 模型的变体,专注于处理长文本序列,并引入了相对位置编码。

4. XLNet:
参数数量:依赖于具体配置,通常较大
简介:XLNet 结合了 Transformer 和自回归模型的优点,引入了“permutation language modeling”来捕捉全局关系。

5. RoBERTa (Robustly optimized BERT approach):
参数数量:约 125 million
简介:RoBERTa 是对 BERT 的一种改进,通过修改训练动态和采样策略来提高性能。
6. GPT-2 (Generative Pre-trained Transformer 2):
参数数量:约 1.5 billion(GPT-2 Small)
简介:GPT-2 是一个自回归语言模型,采用了 Transformer 架构,被设计用于生成文本。

标签:billion,BERT,Transformer,AI,million,参数,经典,GPT
From: https://www.cnblogs.com/ahuo/p/17832250.html

相关文章

  • windows ewomail docker搭建流程记录
     一、安装命令dockerrun-d-hmail.dowhere.com--restart=always-p25:25-p109:109-p110:110-p143:143-p465:465-p587:587-p993:993-p995:995-p8182:80-p8181:8080-p13307:3306-vD:/dockercontainer/ewomail/mysql/:/mysql/data/-vD:/dockerconta......
  • linux离线安装portainer&配置远程连接其他linux服务器的docker环境
    1、下载安装包的地址https://github.com/portainer/portainer/releases/tag/2.19.2 2、将安装包上传linux服务器并解压cd到安装包所在目录后执行如下命令解压:forfilein*.tar.gz;dotar-zxvf"$file"--strip-components=1;done3、设置环境变量echo-e"\n#设置port......
  • AI技术如何融合应用于工业物联网
    人工智能技术在近年来得到飞跃性地发展,在自主识别、分析、判断、规划等功能方面都进步显著,也已经应用于越来越多的行业产业。在工业物联网领域,人工智能也将成为一大助力,通过与工业物联网系统集成融合,能够为工业生产、制造、监测、控制领域提供高智能、高效、实时快速、精准的数据......
  • 智慧隧道:TSINGSEE青犀远程视频AI智能监管平台保障隧道施工安全
    一、背景与需求分析随着我国交通运输量的增加以及新基建的不断规划和建设,公路建设工作也在持续开展中。高速公路隧道属于特殊构造段,因为隧道空间小,密闭性强,施工过程中一旦发生火灾、事故等,将带来重大人员伤亡和财产损失。如果不采用先进的监控管理手段,则极易发生严重的安全事故。因......
  • TSINGSEE视频汇聚管理与AI算法视频质量检测方案
    一、建设背景随着互联网视频技术的发展,视频监管在辅助安全生产、管理等方面发挥了不可替代的作用。但是,在监管场景中,仍然存在视频掉线、视频人为遮挡、视频录像存储时长不足等问题,对企业的日常管理和运转存在较大的安全隐患。企业原有视频运维系统存在检测准确率低、告警提醒滞后......
  • 中睿天下&Coremail | 2023年Q3企业邮箱安全态势观察报告
    10月25日,北京中睿天下信息技术有限公司联合Coremail邮件安全发布《2023年第三季度企业邮箱安全性研究报告》。2023年第三季度企业邮箱安全呈现出何种态势?作为邮箱管理员,我们又该如何做好防护?以下为精华版阅读,如需下载完整版,请关注【中睿天下】,后台回复【2023Q3】即可下载1国内垃圾......
  • 视频质量AI检测算法与LiteCVR视频质量诊断方案介绍
    LiteCVR视频质量诊断方案可以实现对监控设备常见的异常抖动、画面条纹、画面模糊、偏色、亮度异常、对比度异常、冻结、丢失、噪声等机器故障及恶意遮挡、恶意变化监控场景的行为做出准确判断,还可以对监控设备因为网络异常等原因导致的设备断线、取流异常、码率是否达标等问题进行......
  • 人工智能计算大会(AICC 2023)将于11月29日在北京举办
    生成式人工智能和大模型正加速世界向智能化时代迈进,并引发AI计算需求的爆发式增长。智算已经成为驱动智慧世界持续进化的核心引擎,带动生产力与创新力实现跃迁式变革。11月29日,人工智能计算大会(AICC2023)将在北京举办。本届大会以“智算力就是创新力”为主题,由北京市科学技术委员会......
  • gitee error: GE007: Your push would publish a private email address.
    remote:PoweredbyGITEE.COM[GNK-6.4]remote:error:GE007:Yourpushwouldpublishaprivateemailaddress.remote:Youcanmakeyouremailpublicordisablethisprotectionbyvisiting:remote:https://gitee.com/profile/emailsremote:error:hookdeclined......
  • Xcode 展示failed to prepare the device for development
    首先打开链接找到https://gitee.com/Han0/iOSDeviceSupport 找到对应版本,解压其次打开终端输入 open/Applications/Xcode.app/Contents/Developer/Platforms/iPhoneOS.platform/DeviceSupport然后将解压后的文件夹放进去,即可重启xcode......