首页 > 其他分享 >5分钟入门大模型,就5分钟

5分钟入门大模型,就5分钟

时间:2024-06-06 20:44:26浏览次数:24  
标签:这个 入门 训练 模型 根蒂 分钟 学习 参数

这个是大模型系列课程的第一节。

接下来我带着大家一起拥抱新技术,分享的进展不会很快,大概一周一次,有空可以直播讲解或实操。


为了照顾那些工程出身,甚至非技术同学,我这个系列会从小白开始,从基础概念入门逐步展开。

我不会研究基础大模型,而是会关注应用层,当然也会涉及预训练、知识库、多智能化跟模型最终效果息息相关的部分。

废话不多说,赶快上车。

我们先理解一下什么是大模型,先从 ChatGPT 来学习大模型。
ChatGPT(Generative Pre-trained Transformer)从名字上已经表明了它的特点,
“Chat” - 聊天,
G:“Generative” - 生成式,
P:“Pre-trained” - 预训练,
T:“Transformer” - 大模型推理架构


Chat-聊天


聊天大家基本都理解,你说一句,它回你一句,所以叫“Chat”-GPT。


Generative-生成式


乍一听啥玩意?
我们跟之前模型的玩法做个对比,就理解了。
比如你在百度/Google 上搜索,它都是把一堆文章和链接返给你,但是GPT 是什么样的,用过的都知道,尤其是网络不好的时候更明显,GPT 就像有口吃,讲话是一个词一个词往外蹦。

为什么呢?
来到了大家最爱的原理剖析了,面试官即视感,来,请讲讲底层原理

标签:这个,入门,训练,模型,根蒂,分钟,学习,参数
From: https://www.cnblogs.com/guofu-angela/p/18235991

相关文章

  • 图神经网络GNN实践入门
    参考视频网址:https://www.bilibili.com/video/BV1MP41187pv/?spm_id_from=333.999.0.0&vd_source=590f4019caa7ed7b4e57c0e869ad0867文章目录图神经网络GNN一、GNN的优势1、处理非欧几里得数据2、捕捉节点间的复杂关系3、信息聚合和传递4、适用于各种图相关任务二、G......
  • 【粉丝福利社】《安恒“网安三剑客”:大模型时代下的网络安全实战指南》(文末送书-完成)
    ......
  • 突破开源天花板!最强文本转语音工具ChatTTS:对话式高可控的语音合成模型
    ChatTTS一夜爆火,极速出圈,3天就斩获9k的Star量,截止2024.06.04,已经19.3k的star,极速接近GPT-soVITs当天的26.2k的star数。什么是ChatTTS?TTS全称:TextToSpeech(也就是文本转语音模型)。ChatTTS是专为对话场景设计的语音生成模型,特别适用于大型语言模型(LLM......
  • autotrain学习-环境搭建、模型和数据集下载、训练全过程
    autotrain学习-环境搭建、模型和数据集下载、训练全过程1.参考链接2.创建容器3.安装autotrain4.解决没有真实权值的问题(不下载真实的权值)5.下载SFT微调数据集6.下载opt-125m模型(忽略权值文件)7.下载后的目录结构8.SFT训练A.生成配置文件(使用之前下载好的模型和数据集......
  • ChatGPT Prompt技术全攻略-入门篇:AI提示工程基础
    系列篇章......
  • 利用智普AI大模型进行基于 RAG 的表格数据问答
    前言最近一直在探索RAG相关的技术,刚好尝试了一些国产的大模型,发现智普的大模型用着还挺不错的,因此就尝试用它对表格数据进行问答。遇到的问题智普的SDK更新到了2.0的版本,这也就导致原来Langchain的版本无法适配了,需要重新自己写一些代码才可以。另外,Langchain提供的cr......
  • 程序员为什么要学习AI大模型?
    前言在科技浪潮的推动下,人工智能(AI)技术已经成为推动软件行业发展的核心动力。而在AI技术的众多分支中,AI大模型以其巨大的潜力和广泛的应用场景,逐渐成为了程序员们关注的焦点。本文将从程序员的角度出发,探讨AI大模型的定义、应用,以及为何程序员需要深入了解大模型的相关知识......
  • 【入门教程】5分钟教你快速学会集成Java springboot ~
    介绍ApacheDolphinScheduler是一个分布式易扩展的开源分布式调度系统,支持海量数据处理,具有任务流程调度、任务流程编排、任务监控告警、工作流引擎等功能。本文将介绍如何将ApacheDolphinScheduler集成到JavaSpringboot项目中,以实现更灵活和便捷的调度功能。步骤步骤一:添......
  • Netty 快速入门
    什么是NettyNetty的官网:[https://netty.io/Netty是一个JavaNIO技术的开源异步事件驱动的网络编程框架,用于快速开发可维护的高性能协议服务器和客户端。往通俗了讲,可以将Netty理解为:一个将JavaNIO进行了大量封装,并大大降低JavaNIO使用难度和上手门槛的网络编程框架。Net......
  • IOS网络模型
    IOS网络模型应用层: 内核缓冲区内封包(man3setsocketopt)表示层:会话层:传输层: TCP头+有效数据网络层: IP头+TCP头+有效数据数据链路层: MAC头+IP头+TCP头+有效数据物理层: 集中器,中继器ps:TCP支持紧急数据,可以使用send+标记MSG_OOB,可以忽略内核缓冲区的最小值限制......