首页 > 其他分享 >宏观了解AI大模型(持续更新中~)

宏观了解AI大模型(持续更新中~)

时间:2024-09-07 09:21:32浏览次数:6  
标签:训练 AI 模型 宏观 学习 参数 文本

  AI大模型是什么

AI大模型是指具有巨大参数量的深度学习模型,通常包含数十亿甚至数万亿个参数。这些模型可以通过学习大量的数据来提高预测能力,从而在自然语言处理、计算机视觉、自主驾驶等领域取得重要突破。
AI大模型的定义具体可以根据参数规模来分类。根据OpenAI的分类方法,可以将AI模型分为以下几类:
小型模型: ≤ 1百万个参数
中型模型:1百万 – 1亿个参数
大型模型:1亿 – 10亿个参数
极大型模型:≥ 10亿个参数
其中大型模型和极大型模型可以被视为AI大模型。总的来说,“大模型”应该是基于具有超级大规模的、甚至可以称之为“超参数”的模型,需要大量的计算资源、更强的计算能力以及更优秀的算法优化方法进行训练和优化。
 


AI大模型很大一个原理:通过大量的学习,不断提高预测结果的准确性

token:一般指的是大语言模型的一个基本文本单位

模型会先看到一部分文本,基于上下文预测下一个token,然后通过比较准确答案和他的预测,模型会更新权重,从来能够根据上文来生成合理的下文,随着见过的文本越多,生产的结果就越好。

要得到一个ChatGPT要分三步:

1.无监督学习(成本最高)

.通过大量大量的文本为原料(大模型中的大也就是大量大量的原料参数意思)进行无监督学习预训练去训练模型,最后得到了一个能进行文本生产的基座模型,此时具有根据上文预测下一个token的能力,但并不擅长对话

2.监督微调

通过一些人类撰写的高质量对话数据对基座模型进行监督微调,得到一个微调后的模型,此时的模型除了续写文本之外,也会具备更好的对话能力,得到一个STF模型

3.(训练奖励模型+强化学习训练)

用问题和多个对应回答的数据,让人类标注员更加3H(helpful,honest,harmless)原则对回答进行质量排序,如果打分高的话就再接再厉,低的话就要给予改正,当时由于人类一个个打分成本高效率低,于是就训练出了另一个(奖励)模型,让模型给模型打分,不断地回答学习,回答的质量也在不断提升

以上ChatGPT被练成了。

增强辅助:

小样本,思维链,分步骤思考

标签:训练,AI,模型,宏观,学习,参数,文本
From: https://blog.csdn.net/m0_74969835/article/details/141941352

相关文章

  • Distributed Training: DeepSpeed ZeRO 1/2/3 + Accelerate, Megatron-LM
    1IntroductionGithub:https://github.com/microsoft/DeepSpeedZeRO:MemoryOptimizationsTowardTrainingTrillionParameterModelsZeRO-Offload:DemocratizingBillion-ScaleModelTrainingZeRO-Infinity:BreakingtheGPUMemoryWallforExtremeScaleDee......
  • uAI - AI Assistant 人工智能辅助助手插件
    uAI助手支持GPT3.5Turbo、GPT3.5Turbo16K、GPT4-8k和GPT4Turbo-128k什么是uAI助理?uAIAssistant是Unity游戏引擎的强大扩展,它使用GPTAI帮助游戏开发人员轻松创建专业代码和引人入胜的游戏内容。你需要一个OpenAI密钥才能使用uAI助手!阅读我们的文档以获取更多说明。......
  • Why I‘m getting 404 Resource Not Found to my newly Azure OpenAI deployment?
    题意:为什么我新部署的AzureOpenAI服务会出现404资源未找到的错误?问题背景:I'vegonethroughthis quickstart andIcreatedmyAzureOpenAIresource+createdamodeldeploymentwhichisinstatesucceedded.Ialsoplayarounditin AzureOpenAIStudio-Mi......
  • 五子棋AI:实现逻辑与相关背景探讨(上)
    绪论本合集将详细讲述如何实现基于群只能遗传算法的五子棋AI,采用C++作为底层编程语言本篇将简要讨论实现思路,并在后续的文中逐一展开了解五子棋五子棋规则五子棋是一种经典的棋类游戏,规则简单却充满策略性。游戏在一个19×19的棋盘上进行(也可以使用13×13或15×15的棋盘)。......
  • 利用AI大语言模型和Langchain开发智能车算法训练知识库(上篇)
    今天小李哥将介绍亚马逊云科技的JupyterNotebook机器学习托管服务AmazonSageMaker上,通过AI大语言模型、向量知识库和LangChainAgent,创建用于AI智能车模型训练的RAG问答知识库。整个项目的架构图如下:本系列共分为上下两篇。在上篇内容中,我将分享该知识库的GitHub项目开源代......
  • 深入浅出孪生神经网络,高效训练模型
    大家好,在深度学习领域,神经网络几乎能处理各种任务,但通常需要依赖于海量数据来达到最佳效果。然而,对于像面部识别和签名验证这类任务,我们不可能总是有大量的数据可用。由此产生了一种新型的神经网络架构,称为孪生网络。孪生神经网络能够基于少量数据实现精准预测,本文将介绍孪生......
  • AI绘画作品能不能商用?一文说清楚AI作品的版权问题
    前言AI绘画作品能不能商用?什么情况会被判定侵权?如何避免侵权?这三个问题一定要有个清楚的认知,不然你可能突然就收到律师函,这篇内容我将通过一个案例,两个角度,三个立场说清楚AI绘画的商用与版权问题1个案例前段时间我分享过一个AI绘画的操作视频,这个操作用到一个lora模型......
  • AI大语言模型LLM学习-Token及流式响应
    token是什么?比较官方的token解释:Token是对输入文本进行分割和编码时的最小单位。它可以是单词、子词、字符或其他形式的文本片段。token是自然语言处理的最细粒度。简单点说就是,LLM的输入是一个个的token,输出也是一个个的token。token是由LLM处理的基本数据单元。......
  • 常见的raid有哪些,使用场景是什么
    RAID(冗余独立磁盘阵列)是一种将多个物理硬盘组合成一个逻辑单元的技术,以提高数据的可靠性、性能或两者兼而有之。以下是一些常见的RAID级别及其使用场景:1.RAID0特点:数据条带化,没有冗余。所有数据均分散在多个硬盘上。提供最高的读写性能。使用场景:适用于对性能......
  • 带你1分钟玩转AI大模型微调推理,更有限时福利等你领
    本文分享自华为云开发者联盟微信公众号《如何1分钟玩转AI大模型微调推理?(文末有福利)》想要低成本用好大模型,必然离不开对它的微调(FineTuning)。那么,为什么大模型需要微调呢?举个例子:一个通用大模型涵盖了许多语言信息,我们和它可以进行流畅的对话。但是如果想要它正确回答“布......