我为什么要转行做大模型？

时间：2024-06-17 17:57:53浏览次数：20

标签：私有化框架 AI 转行做大学习算法模型

前言

最近研究了一下大模型相关的内容，决定从互联网的推荐算法转行做大模型推理工程化相关的工作。所以简单说说我在这个决定中的思考过程。

1. 推荐算法岗的现状

我本来是一个在大厂做推荐算法的工程师。收入在行业里面算是中游水平, 就这么一直干着似乎也没什么问题。

但是互联网行业的岗位毕竟和公务员和事业单位比，不存在一个工作干一辈子的情况。这个工作能不能继续干完全取决于市场对于这个岗位有没有需求。

但是推荐算法今年的情况就是，流量增长见顶，需求萎靡。

前两年推荐算法很火，是因为4G出来以后有大量的移动端APP(抖音快手小红书等) 用户量激增，创作的内容需要通过推荐算法分发给最需要的用户。但是最近几年这几个APP的用户量增长基本见顶了，就算推荐算法推荐的再好，最大的一波用户增长红利已经结束了。

该用app的用户都已经用上了，连身边的老年人都已经在玩这些app了，还能有哪些新用户呢？无非就是让存量用户每天再多玩个1-2分钟就了不起了。相当于市场对于推荐算法真正的需求已经不多了。

所以从招聘市场的反馈来看，目前依然在招推荐算法的公司似乎只有字节和小红书了。只有字节的抖音系app以及小红书还有用户的增长。其他的公司都是缩招，反应到薪资上也是没什么涨幅。类似于阿里系的蚂蚁淘宝等公司，跳槽过去可能都是平薪。整个行业似乎都在卡30%的跳槽涨幅。

对于抖音生活服务，小红书电商这类新业务，整体体量小，基数低，可以去抢一抢阿里和美团的生意，看起来整体业务增长幅度还不错。只要不是算法做的特别差，随着不断通过各种渠道获取新用户，都可以有不错的业务增长，并不一定非得是算法牛逼。但是这类新的有增量的业务在市场上已经很小了。

对于一些老的业务，比如抖音短视频这类成熟型业务，都是各种高端技术以及极端的trick 才能获得不到百分之一，甚至不到千分之五业务指标收益。说白了就是改革进入了深水区的感觉，再怎么改算法，都是费劲巴拉收益很小。典型的对数曲线增长。从老板的角度来看，再继续招更多的算法工程师也不能带来业务的收益，索性也就不继续招了。

所以传统的推荐算法在流量见顶的大环境下，岗位需求变得萎靡不振。

2. 大模型创造的新需求

今年年初，ChatGPT的横空出世，让人类看到了人工智能的更多可能。ChatGPT就像2016年的AlphaGo 一样，给各类创业者投资者打了一个样，AI原来可以这么牛逼。

虽然说现在的ChatGPT还只能当个查找资料的工具，但是让人们看到了更多底层的技术的巨大进步，预计在未来的几年会颠覆很多行业，只是暂时没有找到特别大的场景。

从英伟达的股价来看，资本是很看好这个新兴的增长点的。所以投了很多资本进去，这正是打工人收割资本家的好机会。现在资本家人傻钱多，此时不割，更待何时。

另外根据最近猎头的反馈，已经有很多的大模型公司都在疯狂招人了。有的原来做推荐算法的猎头甚至都要转行做大模型了。猎头是可以直接反应市场需求的一批人。

技术再牛逼，卖不出去，没有市场就是没用的。市场需求暴增但是供给跟不上的时候往往是价格最高的时候。反正我就是个打工的，既然都出来卖了，为什么不赶紧把自己卖个好价钱。

别跟我说什么深耕一个领域。纵观互联网这几年的发展，就知道这个行业没有什么值得深耕的。都是走快速扩张，抢占市场的逻辑。除非是特别小众，利润微薄的角落才允许你慢慢深耕。

只要是利润够多，就一个字，快。快速抢占市场是最重要的。
所以啥也别说了，我要去学习去转行了，趁着年轻，刚30，还没有因为35岁被hr把简历直接扔掉。
现在转行，门槛还不算高，还能趁着供给没跟上来多要一些工资。

如何系统的去学习大模型LLM ？

作为一名热心肠的互联网老兵，我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。

但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的 AI大模型资料 包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

标签：私有化,框架,AI,转行,做大,学习,算法,模型
From： https://blog.csdn.net/2401_85379281/article/details/139699227

pytorch使用交叉熵训练模型学习笔记
python代码：importtorchimporttorch.nnasnnimporttorch.optimasoptim#定义一个简单的神经网络模型classSimpleModel(nn.Module):def__init__(self):super(SimpleModel,self).__init__()self.fc=nn.Linear(3,2)#输入3维，输出2类......
人工智能大模型——零样本提示
零样本提示是与少样本提示相对应的一种提示词编写方式，其含义是指在编写提示词过程中，并未给LLM提供任何的相关示例。零样本提示是新手使用ChatGPT最常规的提示方式，也是最好掌握的一种提示方式，同时也是其他所有高级提示技术的基础。应用场景我一直建议在写提示词的时候遵循一......
R语言动态广义相加模型GAM张量积交互项、傅立叶项、谐波回归分析季节性时间序列航空乘
全文链接：https://tecdat.cn/?p=36497原文出处：拓端数据部落公众号季节性在真实的时间序列中是非常常见的。许多系列以周期性、规律性的方式变化。例如，冰淇淋销售在温暖的假期月份往往更高，而候鸟数量围绕年度迁徙周期强烈波动。由于季节性非常普遍，已经开发了许多时间序列和预测方......
利用大模型服务一线小哥的探索与实践
一、小哥作业+大模型2022年OpenAI基于GPT推出了聊天机器人ChatGPT，带来了非常惊艳的语言理解、内容生成、知识推理等能力，能够准确理解人的语言、意图，并能够回答出清晰、完整的内容，让人很难分辨出沟通交流的是人类还是机器人。大模型会尝试基于已有的内容，生成内容的延续。基于预训......
大模型辅助编程助手：『小浣熊 Raccoon』如何使用？
认识RaccoonRaccoon(Raccoonis Another Code CO-pilOt Navigator)是基于AI的代码助手，是商汤科技发布基于商汤自研大语言模型的智能编程助手，代码小浣熊Raccoon支持Python、Java、JavaScript、C++、Go、SQL等30+主流编程语言和VSCode、IntelliJIDEA等主流IDE......
硬核解读KubeEdge基于大模型边云协同的机器人语义分割算法
本文分享自华为云社区《KubeEdge：基于大模型边云协同的机器人语义分割算法》，作者：云容器大未来。近年来快速发展的视觉大模型(例如SAM)在促进高精度的智能感知方面具有很大的潜力。然而，边缘环境中的资源限制往往会限制这种视觉大模型在本地部署，从而产生相当大的推理延迟，导致难以......
11大3D模型销售网站
无法决定是在在线市场上销售3D模型还是在电子商务平台上销售？让我们帮助你。在这篇博文中，我们列出了10个在线销售3D模型的最佳网站。我们还列出了每个平台的优缺点，以便你做出明智的决定。那么，让我们开始吧！1、SellfySellfy是一种易于使用的电子商务解决方案，具有大......
绘制MySQL数据库的实体关系图（ERD）与逻辑模型图
绘制MySQL的实体关系图（ERD,Entity-RelationshipDiagram）和数据库模型图对于理解和设计数据库结构非常重要。这些图表有助于可视化数据库中的表、列、关系以及约束。以下是一些步骤和工具，你可以使用它们来创建这些图表。步骤确定实体：首先，确定你的数据库中的实体（或称为表......
开源复刻apple 数学笔记；纯C++实现了ChatGLM系列模型；腾讯混元文生图模型发布新版本并开
✨1:AIMathNotesAIMathNotes是一个交互式绘图应用，可绘制并计算数学方程。AIMathNotes受到Apple在WWDC2024上的“MathNotes”演启发，开发的一个互动式绘图应用程序，用户可以在画布上绘制数学方程。一旦方程被绘制完成，应用程序将使用多模态LLM（LargeLanguageM......
Java的I/O模型
Java的I/O发展简史从JDK1.0到JDK1.3，Java的I/O类库都非常原始，很多UNIX网络编程中的概念或者接口在I/O类库中都没有体现，比如Pipe、Channel、Buffer和Selector等。2002年发布JDK1.4时，NIO以JSR-51的身份正式随JDK发布。它新增加了java.nio包，提供了很多进行异步I/O开发的API和类库......

我为什么要转行做大模型？

前言

1. 推荐算法岗的现状

2. 大模型创造的新需求

如何系统的去学习大模型LLM ？

相关文章

赞助商

阅读排行