如何转大模型这块,分享一下目前我的经验。
这篇文章是我之前几个月学习LLM知识的总结,我把看过的比较好的资料罗列下来,方便大家阅读。只要照着我写的路线按顺序学习,然后自己动手多做一些项目,或者参加比赛就可以0经验跨入大模型领域。
毕竟我就是个例子,嘿嘿~
想学习大语言模型,不得不学的前导知识就有 Python 编程知识/神经网络的知识/深度学习框架。
1,大语言模型一般通过 Python 代码进行训练和推理。
2,神经网络的知识也是必须掌握的,否则不能理解内在逻辑。比较著名的框架就有 Pytorch,Tensorflow,Caffe等。
3,深度学习框架提供了一系列的API和工具,用于处理神经网络结构、优化算法、数据加载等任务。每个框架都有自己的风格。
4,学习大语言模型,绕不开的就是大魔王Transformer: 说Transformer是一个模型,倒不如说其是一个机制,一个引入了 [Self-attention机制]的模型。Transformer可以说是后续大语言模型的基石,Bert和GPT都是其的衍生物,可以说是继承了Transformer不同的部分。类似于家族企业有两个继承人,每个人都分走了一部分产业。一个继承了Encoder部分,一个继承了Decoder部分。它们分别将这两个部分发扬光大了。 刚入门大语言模型的话,还是从这几个模型开始学起。
5,其他还有LLaMA,LLaMA是Decoder-Only的结构。
在大模型时代,我们如何有效的去学习大模型?
现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。
掌握大模型技术你还能拥有更多可能性:
• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;
• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;
• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;
• 更优质的项目可以为未来创新创业提供基石。
可能大家都想学习AI大模型技术,也_想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。为了让大家少走弯路,少碰壁,这里我直接把都打包整理好,希望能够真正帮助到大家_。
标签:Transformer,AI,转行,学习,小白,LLM,薪资,模型 From: https://blog.csdn.net/2401_85324918/article/details/142208429