LLM小白的成长之路—零基础怎么转行大模型？

时间：2024-09-13 13:24:56浏览次数：10

标签：Transformer AI 转行学习小白 LLM 薪资模型

如何转大模型这块，分享一下目前我的经验。

这篇文章是我之前几个月学习LLM知识的总结，我把看过的比较好的资料罗列下来，方便大家阅读。只要照着我写的路线按顺序学习，然后自己动手多做一些项目，或者参加比赛就可以0经验跨入大模型领域。
毕竟我就是个例子，嘿嘿~

想学习大语言模型，不得不学的前导知识就有 Python 编程知识/神经网络的知识/深度学习框架。

1，大语言模型一般通过 Python 代码进行训练和推理。

2，神经网络的知识也是必须掌握的，否则不能理解内在逻辑。比较著名的框架就有 Pytorch，Tensorflow，Caffe等。

3，深度学习框架提供了一系列的API和工具，用于处理神经网络结构、优化算法、数据加载等任务。每个框架都有自己的风格。

4，学习大语言模型，绕不开的就是大魔王Transformer：说Transformer是一个模型，倒不如说其是一个机制，一个引入了 [Self-attention机制]的模型。Transformer可以说是后续大语言模型的基石，Bert和GPT都是其的衍生物，可以说是继承了Transformer不同的部分。类似于家族企业有两个继承人，每个人都分走了一部分产业。一个继承了Encoder部分，一个继承了Decoder部分。它们分别将这两个部分发扬光大了。刚入门大语言模型的话，还是从这几个模型开始学起。

5，其他还有LLaMA，LLaMA是Decoder-Only的结构。

在大模型时代，我们如何有效的去学习大模型？

现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。
在这里插入图片描述

掌握大模型技术你还能拥有更多可能性：

• 成为一名全栈大模型工程师，包括Prompt，LangChain，LoRA等技术开发、运营、产品等方向全栈工程；

• 能够拥有模型二次训练和微调能力，带领大家完成智能对话、文生图等热门应用；

• 薪资上浮10%-20%，覆盖更多高薪岗位，这是一个高需求、高待遇的热门方向和领域；

• 更优质的项目可以为未来创新创业提供基石。

可能大家都想学习AI大模型技术，也_想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。为了让大家少走弯路，少碰壁，这里我直接把都打包整理好，希望能够真正帮助到大家_。

标签：Transformer,AI,转行,学习,小白,LLM,薪资,模型
From： https://blog.csdn.net/2401_85324918/article/details/142208429

【转行必看】Java到AI，程序员的逆袭秘籍！
随着技术的不断进步，AI大模型已经成为当今科技领域最热门的话题之一。许多开发者开始考虑从传统的软件开发领域，如Java，转向AI大模型领域，今天小编和大家一起来探讨Java开发者是否可以转型到AI大模型、转行需要补齐哪些知识？，以及在大模型时代我们如何有效的去学习大模型？01Java......
LLM驱动的NL2SQL方法论：现状、难点、优化
阅读原文NL2SQL在大型语言模型（LLM）的支持下得到了广泛应用，为了对基于LLM的NL2SQL解决方案进行系统化研究，我们需要全面理解和实践，包括Prompt工程、指令微调（SFT）、Agent、RAG等技术方案。为深入研究NL2SQL提供一些参考和指导。1.什么是NL2SQL简言之，NaturalLanguagetoSQL......
降维算法 0基础小白也能懂(附代码)
降维算法0基础小白也能懂(附代码)原文链接啥是降维算法在互联网大数据场景下，我们经常需要面对高维数据，在对这些数据做分析和可视化的时候，我们通常会面对「高维」这个障碍。在数据挖掘和建模的过程中，高维数据也同样带来大的计算量，占据更多的资源，而且许多变量之间可能存在相关性......
不想做程序员了，听说网安前景好，好转行吗？
前言：我四月份被裁员，找了两个月工作，面试寥寥无几，就算有也都是外包，而且外包也没面试通过。我经历了挫败，迷茫，自我怀疑。常常大半夜刷招聘软件，不断的修改简历，甚至有时候坐在沙发上焦虑到哭。好在，我一个大胆的决定意外让我找到了现在这份我很喜欢的工作，开发转做渗透。一、迷茫......
最全元器件焊接指南，从小白到精通！
如果你觉得焊接是一件轻松的事，那我可得提醒你，焊接不仅需要技巧，还需要大量的练习。每一块完美的焊点背后都是数不清的尝试和经验积累！焊接贴片元器件的心得最近累积了不少项目（坑）在焊接过程中，本来以为自己焊接技术还不错（bushi），但实际操作中发现自己还有很多需要提高的地方。......
AI大语言模型LLM学习-RAG技术及代码实现
系列文章1.AI大语言模型LLM学习-入门篇2.AI大语言模型LLM学习-Token及流式响应3.AI大语言模型LLM学习-WebAPI搭建4.AI大语言模型LLM学习-基于Vue3的AI问答页面5.AI大语言模型LLM学习-语义检索(RAG前导篇)前言大语言模型（LLM）已经取得了显著的成功，尽管它们仍然面......
从小白到高手：Windows注册表基础运维全攻略
哈喽大家好，欢迎来到虚拟化时代君（XNHCYL）。“ 大家好，我是虚拟化时代君，一位潜心于互联网的技术宅男。这里每天为你分享各种你感兴趣的技术、教程、软件、资源、福利…（每天更新不间断，福利不见不散）第一章、小叙经常遇到一些Windows疑难杂症，大家都知道可以通过修改注册表的方......
E2LLM：长上下文理解与推理的新纪元
在当今的人工智能研究中，长上下文理解已成为大型语言模型（LLMs）不可或缺的一部分，特别是在多轮对话、代码生成和文档摘要等任务中。随着人们对LLMs能力的期望不断提高，如何有效处理长文本并保持高效性、性能与兼容性之间的平衡，成为了一个备受关注的挑战。为了解决这一“无法实现......
pediatrics_llm_qa：儿科问诊小模型
项目简介本项目开源了基于儿科医疗指令微调的问诊模型：pediatrics_llm_qa(GitHub-jiangnanboy/pediatrics_llm_qa)，目前模型的主要功能如下：智能问诊：问诊后给出诊断结果和建议。更新[2024/09/11]开源了基于Qwen2-1.5B-instructlora指令微调的儿科问诊模型开源模型......
小白学懂C语言---分支循环语句（下）
循环语句这章我们来谈谈三种循环语句（for循环，while循环，do-while循环）1.for循环for循环应该是平时用的比较多的一种，也是一种容易理解的循环。for循环语法：for(表达式1;表达式2;表达式3){ 语句}强调一下：1.表达式1表达式2表达式3，两两之间用;隔开，记住不要写成逗......

LLM小白的成长之路—零基础怎么转行大模型？

如何转大模型这块，分享一下目前我的经验。

在大模型时代，我们如何有效的去学习大模型？

相关文章

赞助商

阅读排行