首页 > 其他分享 >LLM小白的成长之路—零基础怎么转行大模型?

LLM小白的成长之路—零基础怎么转行大模型?

时间:2024-09-13 13:24:56浏览次数:10  
标签:Transformer AI 转行 学习 小白 LLM 薪资 模型

如何转大模型这块,分享一下目前我的经验。

这篇文章是我之前几个月学习LLM知识的总结,我把看过的比较好的资料罗列下来,方便大家阅读。只要照着我写的路线按顺序学习,然后自己动手多做一些项目,或者参加比赛就可以0经验跨入大模型领域。
毕竟我就是个例子,嘿嘿~

想学习大语言模型,不得不学的前导知识就有 Python 编程知识/神经网络的知识/深度学习框架。

1,大语言模型一般通过 Python 代码进行训练和推理。

2,神经网络的知识也是必须掌握的,否则不能理解内在逻辑。比较著名的框架就有 Pytorch,Tensorflow,Caffe等。

3,深度学习框架提供了一系列的API和工具,用于处理神经网络结构、优化算法、数据加载等任务。每个框架都有自己的风格。

4,学习大语言模型,绕不开的就是大魔王Transformer: 说Transformer是一个模型,倒不如说其是一个机制,一个引入了 [Self-attention机制]的模型。Transformer可以说是后续大语言模型的基石,Bert和GPT都是其的衍生物,可以说是继承了Transformer不同的部分。类似于家族企业有两个继承人,每个人都分走了一部分产业。一个继承了Encoder部分,一个继承了Decoder部分。它们分别将这两个部分发扬光大了。 刚入门大语言模型的话,还是从这几个模型开始学起。

5,其他还有LLaMA,LLaMA是Decoder-Only的结构。
img

img

img

img

img

img

img

img

在大模型时代,我们如何有效的去学习大模型?

现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性

• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;

• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术,也_想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把都打包整理好,希望能够真正帮助到大家_。

标签:Transformer,AI,转行,学习,小白,LLM,薪资,模型
From: https://blog.csdn.net/2401_85324918/article/details/142208429

相关文章

  • 【转行必看】Java到AI,程序员的逆袭秘籍!
    随着技术的不断进步,AI大模型已经成为当今科技领域最热门的话题之一。许多开发者开始考虑从传统的软件开发领域,如Java,转向AI大模型领域,今天小编和大家一起来探讨Java开发者是否可以转型到AI大模型、转行需要补齐哪些知识?,以及在大模型时代我们如何有效的去学习大模型?01Java......
  • LLM驱动的NL2SQL方法论:现状、难点、优化
    阅读原文NL2SQL在大型语言模型(LLM)的支持下得到了广泛应用,为了对基于LLM的NL2SQL解决方案进行系统化研究,我们需要全面理解和实践,包括Prompt工程、指令微调(SFT)、Agent、RAG等技术方案。为深入研究NL2SQL提供一些参考和指导。1.什么是NL2SQL简言之,NaturalLanguagetoSQL......
  • 降维算法 0基础小白也能懂(附代码)
    降维算法0基础小白也能懂(附代码)原文链接啥是降维算法在互联网大数据场景下,我们经常需要面对高维数据,在对这些数据做分析和可视化的时候,我们通常会面对「高维」这个障碍。在数据挖掘和建模的过程中,高维数据也同样带来大的计算量,占据更多的资源,而且许多变量之间可能存在相关性......
  • 不想做程序员了,听说网安前景好,好转行吗?
    前言:我四月份被裁员,找了两个月工作,面试寥寥无几,就算有也都是外包,而且外包也没面试通过。我经历了挫败,迷茫,自我怀疑。常常大半夜刷招聘软件,不断的修改简历,甚至有时候坐在沙发上焦虑到哭。好在,我一个大胆的决定意外让我找到了现在这份我很喜欢的工作,开发转做渗透。一、迷茫......
  • 最全元器件焊接指南,从小白到精通!
    如果你觉得焊接是一件轻松的事,那我可得提醒你,焊接不仅需要技巧,还需要大量的练习。每一块完美的焊点背后都是数不清的尝试和经验积累!焊接贴片元器件的心得最近累积了不少项目(坑)在焊接过程中,本来以为自己焊接技术还不错(bushi),但实际操作中发现自己还有很多需要提高的地方。......
  • AI大语言模型LLM学习-RAG技术及代码实现
    系列文章1.AI大语言模型LLM学习-入门篇2.AI大语言模型LLM学习-Token及流式响应3.AI大语言模型LLM学习-WebAPI搭建4.AI大语言模型LLM学习-基于Vue3的AI问答页面5.AI大语言模型LLM学习-语义检索(RAG前导篇)前言大语言模型(LLM)已经取得了显著的成功,尽管它们仍然面......
  • 从小白到高手:Windows注册表基础运维全攻略
    哈喽大家好,欢迎来到虚拟化时代君(XNHCYL)。“  大家好,我是虚拟化时代君,一位潜心于互联网的技术宅男。这里每天为你分享各种你感兴趣的技术、教程、软件、资源、福利…(每天更新不间断,福利不见不散)第一章、小叙经常遇到一些Windows疑难杂症,大家都知道可以通过修改注册表的方......
  • E2LLM:长上下文理解与推理的新纪元
    在当今的人工智能研究中,长上下文理解已成为大型语言模型(LLMs)不可或缺的一部分,特别是在多轮对话、代码生成和文档摘要等任务中。随着人们对LLMs能力的期望不断提高,如何有效处理长文本并保持高效性、性能与兼容性之间的平衡,成为了一个备受关注的挑战。为了解决这一“无法实现......
  • pediatrics_llm_qa:儿科问诊小模型
    项目简介本项目开源了基于儿科医疗指令微调的问诊模型:pediatrics_llm_qa(GitHub-jiangnanboy/pediatrics_llm_qa),目前模型的主要功能如下:智能问诊:问诊后给出诊断结果和建议。更新[2024/09/11]开源了基于Qwen2-1.5B-instructlora指令微调的儿科问诊模型开源模型......
  • 小白学懂C语言---分支循环语句(下)
    循环语句这章我们来谈谈三种循环语句(for循环,while循环,do-while循环)1.for循环for循环应该是平时用的比较多的一种,也是一种容易理解的循环。for循环语法:for(表达式1;表达式2;表达式3){ 语句}强调一下:1.表达式1表达式2表达式3,两两之间用;隔开,记住不要写成逗......