大模型三种架构

大模型三种架构

时间：2024-06-12 14:59:01浏览次数：22

标签：架构模型 encoder only 解码器三种 decoder 生成

大模型进化树
在这里插入图片描述
灰色代表其他模型
粉色表示encoder-only
绿色代表encoder-decoder
蓝色代表decoder-only

1.encoder-only
代表的有google的bert模型。专注于理解和编码输入信息，常用于分类、标注等任务
优点：强大的理解能力：能够有效处理和理解输入数据。
缺点：生成能力有限：不擅长自主生成文本或内容。
适用场景：情感分析，文本分类任务。

2.decoder-only
代表的有openai的GPT，meta的Llama。在Decoder-Only模型架构中，模型只包含一个解码器，没有编码器。优点：专注于生成部分，能够生成连贯、有创造性的文本，灵活性高。
缺点：理解能力较差，不擅长理解复杂的输入。
适用场景；常用于生成任务。

3.encoder-decoder
代表的有Google的T5模型，清华的GLM。利用编码器对输入序列进行编码，提取其特征和语义信息，并将编码结果传递给解码器。然后，解码器根据编码结果生成相应的输出序列。
优点：灵活强大：能够理解复杂输入并生成相关输出。缺点：架构复杂：相比单一的Encoder或Decoder，它更复杂。需要更多的数据和计算资源。
适用于复杂任务：如机器翻译、文本摘要等。

标签：架构,模型,encoder,only,解码器,三种,decoder,生成
From： https://blog.csdn.net/SWZ156/article/details/139626724

数据驾驶舱技术架构与实施
在当前信息技术飞速发展的时代，数据已成为企业决策的重要支撑。数据驾驶舱作为一种新型的数据展示和分析工具，其技术架构与实施受到了广泛关注。数据驾驶舱简单来说，数据驾驶舱是一种将大量数据进行整合、分析和可视化展示的平台。它通过图表、仪表盘等形式，将复杂的数据转化为直......
带你走进信息安全软件架构
汽车信息安全逐步受到重视，网络安全相关法律法规陆续颁布。在这样的背景下，AUTOSAR组织也发布了有关信息安全模块和CryptoStack(加密协议栈)，落地有关汽车信息安全法律法规要求，应对汽车网络安全风险。从2011年起，经纬恒润紧跟行业发展大势，开始研究信息安全相关标准......
AI大模型战场：通用大模型与垂直大模型的角逐
随着人工智能技术的迅猛发展，AI大模型已成为推动科技进步的重要力量。然而，在AI大模型的战场上，通用大模型与垂直大模型之间的分化日益明显。两者各有其独特的优势和潜力，在不同的应用场景中发挥着重要作用。那么，在这场通用与垂直的角逐中，谁将占据优势地位？一、通用大模型的广泛适......
AI大模型探索之路-实战篇：智能化IT领域搜索引擎的构建与初步实践
系列篇章......
LLM应用实战：当图谱问答(KBQA)集成大模型(三)
1. 背景最近比较忙(也有点茫)，本qiang~想切入多模态大模型领域，所以一直在潜心研读中...本次的更新内容主要是响应图谱问答集成LLM项目中反馈问题的优化总结，对KBQA集成LLM不熟悉的客官可以翻翻之前的文章《LLM应用实战：当KBQA集成LLM》、《LLM应用实战：当KBQA集成LLM(二)》。针对K......
Selenium的三种等待方式
目录Selenium的三种等待方式1、强制等待2、隐式等待3、显性等待Selenium的三种等待方式什么是等待机制？等待就是当系统运行时，如果页面渲染的速度跟不上程序执行的速度，这时就需要人为的去限制计算机的执行速度。例如在WebUI自动化测试的时......
给出五种典型的访存模型，并分别简要描述其特点。
均匀存储访问模型（UMA）：物理存储器被所有处理器均匀共享；所有处理器访问任何存储字取相同的时间；每台处理器可带私有高速缓存；外围设备也可以一定形式共享。非均匀存储访问模型（NUMA）：被共享的存储器在物理上是分布在所有的处理器中的，其所有本地存储器的集合就组成了全局地址空间；处理......
使用PyTorch Profiler进行模型性能分析，改善并加速PyTorch训练
如果所有机器学习工程师都想要一样东西，那就是更快的模型训练——也许在良好的测试指标之后加速机器学习模型训练是所有机器学习工程师想要的一件事。更快的训练等于更快的实验，更快的产品迭代，还有最重要的一点需要更少的资源，也就是更省钱。熟悉PyTorchProfiler然后就可以启动te......
YOLO 模型的评估指标——IOU、Precision、Recall、F1-score、AP、mAP、
一、置信度是什么？置信度用于评估模型对检测结果的信心程度下图中，绿色框A表示GroundTruth，也称GT，GT就是正确的标注（人工）二、IOU与TP、FP、FNiou：表示预测的边界框（或分割区域）与真实边界框（或分割区域）之间的交集与并集之间的比值。阈值：根据实际情况可调节IOU=0.5如果预......
从游戏场景看，ByteHouse存算分离架构如何实现降本增效
经过几十年发展，中国游戏产业逐步迈向成熟与稳健的新阶段。根据中国音数协游戏工委的数据，2023年，中国移动游戏用户规模达6.57亿人，同比增速小幅增长。在商业模式层面，除了传统的广告投放和付费会员制度外，一些游戏公司还引入了电商直播、虚拟礼物销售等新的商业模式，以提高用户粘性......

相关文章

赞助商

阅读排行