首页 > 其他分享 >大语言模型一览

大语言模型一览

时间:2023-07-19 14:45:26浏览次数:46  
标签:Google 语言 no 一览 Encoder https Decoder open 模型

 

 
Model作者Size类型开源?
LLaMa Meta AI 7B-65B Decoder open
OPT Meta AI 125M-175B Decoder open
T5 Google 220M-11B Encoder-Decoder open
mT5 Google 235M-13B Encoder-Decoder open
UL2 Google 20B Encoder-Decoder open
PaLM Google 540B Decoder no
LaMDA Google 2B-137B Decoder no
FLAN-T5 Google 同T5 Encoder-Decoder open
FLAN-UL2 Google 同U2 Encoder-Decoder open
FLAN-PaLM Google 同PaLM Decoder no
FLAN Google 同LaMDA Decoder no
BLOOM BigScience 176B Decoder open
T0 BigScience 3B Decoder open
BLOOMZ BigScience 同BLOOM Decoder open
mT0 BigScience 同T0 Decoder open
GPT-Neo EleutherAI 125M-2.7B Decoder open
GPT-NeoX EleutherAI 20B Decoder open
GPT3 OpenAI 175B (davinci) Decoder no
GPT4 OpenAI unknown OpenAI no
InstructGPT OpenAI 1.3B Decoder no
Alpaca Stanford 同LLaMa Decoder open

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

参考资料:

https://blog.csdn.net/jarodyv/article/details/129992142   开源大语言模型(LLM)汇总(持续更新中)

https://zhuanlan.zhihu.com/p/611403556  腾讯算法工程师 总结当下可用的大模型LLMs

 

https://blog.csdn.net/bqw18744018044/article/details/128908060   BLOOM:一个176B参数且可开放获取的多语言模型

 

https://mp.weixin.qq.com/s/Q3BihZjpAonVIfNuFUOVmQ  百模大战时代,思考大模型的未来格局

https://mp.weixin.qq.com/s/SAlWXzdqc-wIyrFEc9ujJA  国产108个大模型,谁是36天罡?谁是72地煞?百模争霸排行榜

标签:Google,语言,no,一览,Encoder,https,Decoder,open,模型
From: https://www.cnblogs.com/yanshw/p/17361209.html

相关文章

  • go语言操作docker删除容器
    代码部分packagemainimport( "context" "fmt" "os" "github.com/docker/docker/api/types" "github.com/docker/docker/client")funcmain(){ //设置远程Docker守护进程的地址 remoteDockerURL:="tcp://10.0.0.1......
  • go语言操作docker重启容器
    代码部分packagemainimport( "context" "fmt" "os" "github.com/docker/docker/api/types/container" "github.com/docker/docker/client")funcmain(){ //设置远程Docker守护进程的地址 remoteDockerURL:="tcp:......
  • 关于go语言常量的那些事
    相对于变量,常量是恒定不变的值,多用于定义程序运行期间不会改变的那些值。常量的声明和变量声明非常类似,只是把var换成了const,常量在定义的时候必须赋值。const常量名[数据类型]=value项目实战常见场景数据类型可以忽略不写,Golang编译器会⾃动推断出数据类型。在使⽤......
  • go语言操作docker创建容器
    开启远程api的方式https://www.cnblogs.com/guangdelw/p/17562539.html代码部分packagemainimport( "context" "fmt" "os" "github.com/docker/docker/api/types" "github.com/docker/docker/api/types/container" &quo......
  • 大语言模型的预训练4:指示学习Instruction Learning详解以及和Prompt Learning,In-cont
    大语言模型的预训练[4]:指示学习InstructionLearning:Entailment-oriented、PLMoriented、human-oriented详解以及和PromptLearning,In-contentLearning区别1.指示学习的定义InstructionLearning让模型对题目/描述式的指令进行学习。针对每个任务,单独生成指示,通过在若干个......
  • 大语言模型的预训练[5]:语境学习、上下文学习In-Context Learning:精调LLM、Prompt设计
    大语言模型的预训练[5]:语境学习、上下文学习In-ContextLearning:精调LLM、Prompt设计和打分函数(ScoringFunction)设计以及ICL底层机制等原理详解1.In-ContextLearning背景与定义背景大规模预训练语言模型(LLM)如GPT-3是在大规模的互联网文本数据上训练,以给定的前缀来预测生......
  • C语言:数据类型之整形(一)
     什么是数据?记录一天各个时间的温度,那么这个温度就是数据.记录一个水库水位的变化值,那么这个值就是数据.什么是数据类型?1215是整数12.23是小数"helloworld"是一段话基本数据类型:数值类型:整形,浮点型。整形顾名思义就是整数,像:1,2,3,4,5就是整形整形在C语言的关键字是:int......
  • 初识C语言--2
    指针,指针的大小为4或8字节,取决于使用系统的地址线,32位为4字节。指针变量——用来存放地址取地址——int*p=&a;inta=10;//创建一个空间,此空间有一个地址名,空间存放的值为10int*p=&a;//创建一个空间,名字为p,里面存放的为a的地址*p=20;//*p的意义为p空间中存放的地址,其指......
  • 大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型
    大语言模型的预训练[2]:GPT、GPT2、GPT3、GPT3.5、GPT4相关理论知识和模型实现、模型应用以及各个版本之间的区别详解1.GPT模型1.1GPT模型简介在自然语言处理问题中,可从互联网上下载大量无标注数据,而针对具体问题的有标注数据却非常少,GPT是一种半监督学习方法,它致力于用大量......
  • 大语言模型的预训练[3]之Prompt Learning:Prompt Engineering、Answer engineering、Mu
    大语言模型的预训练[3]之PromptLearning:PromptEngineering、Answerengineering、Multi-promptlearning、Trainingstrategy详解1.PromptLearning1.1PromptLearning的出现背景目前学术界一般将NLP任务的发展分为四个阶段,即NLP四范式::第一范式:传统机器学习模型的范......