我为什么要转行做大模型？

时间：2024-08-06 18:56:49浏览次数：16

最近研究了一下大模型相关的内容，决定从互联网的推荐算法转行做大模型推理工程化相关的工作。所以简单说说我在这个决定中的思考过程。

1. 推荐算法岗的现状

我本来是一个在大厂做推荐算法的工程师。收入在行业里面算是中游水平, 就这么一直干着似乎也没什么问题。

但是互联网行业的岗位毕竟和公务员和事业单位比，不存在一个工作干一辈子的情况。这个工作能不能继续干完全取决于市场对于这个岗位有没有需求。

但是推荐算法今年的情况就是，流量增长见顶，需求萎靡。

前两年推荐算法很火，是因为4G出来以后有大量的移动端APP(抖音快手小红书等) 用户量激增，创作的内容需要通过推荐算法分发给最需要的用户。但是最近几年这几个APP的用户量增长基本见顶了，就算推荐算法推荐的再好，最大的一波用户增长红利已经结束了。

该用app的用户都已经用上了，连身边的老年人都已经在玩这些app了，还能有哪些新用户呢？无非就是让存量用户每天再多玩个1-2分钟就了不起了。相当于市场对于推荐算法真正的需求已经不多了。

所以从招聘市场的反馈来看，目前依然在招推荐算法的公司似乎只有字节和小红书了。只有字节的抖音系app以及小红书还有用户的增长。其他的公司都是缩招，反应到薪资上也是没什么涨幅。类似于阿里系的蚂蚁淘宝等公司，跳槽过去可能都是平薪。整个行业似乎都在卡30%的跳槽涨幅。

对于抖音生活服务，小红书电商这类新业务，整体体量小，基数低，可以去抢一抢阿里和美团的生意，看起来整体业务增长幅度还不错。只要不是算法做的特别差，随着不断通过各种渠道获取新用户，都可以有不错的业务增长，并不一定非得是算法牛逼。但是这类新的有增量的业务在市场上已经很小了。

对于一些老的业务，比如抖音短视频这类成熟型业务，都是各种高端技术以及极端的trick 才能获得不到百分之一，甚至不到千分之五业务指标收益。说白了就是改革进入了深水区的感觉，再怎么改算法，都是费劲巴拉收益很小。典型的对数曲线增长。从老板的角度来看，再继续招更多的算法工程师也不能带来业务的收益，索性也就不继续招了。

所以传统的推荐算法在流量见顶的大环境下，岗位需求变得萎靡不振。

2. 大模型创造的新需求

今年年初，ChatGPT的横空出世，让人类看到了人工智能的更多可能。ChatGPT就像2016年的AlphaGo 一样，给各类创业者投资者打了一个样，AI原来可以这么牛逼。

虽然说现在的ChatGPT还只能当个查找资料的工具，但是让人们看到了更多底层的技术的巨大进步，预计在未来的几年会颠覆很多行业，只是暂时没有找到特别大的场景。

从英伟达的股价来看，资本是很看好这个新兴的增长点的。所以投了很多资本进去，这正是打工人收割资本家的好机会。现在资本家人傻钱多，此时不割，更待何时。

另外根据最近猎头的反馈，已经有很多的大模型公司都在疯狂招人了。有的原来做推荐算法的猎头甚至都要转行做大模型了。猎头是可以直接反应市场需求的一批人。

**技术再牛逼，卖不出去，没有市场就是没用的。**市场需求暴增但是供给跟不上的时候往往是价格最高的时候。反正我就是个打工的，既然都出来卖了，为什么不赶紧把自己卖个好价钱。

别跟我说什么深耕一个领域。纵观互联网这几年的发展，就知道这个行业没有什么值得深耕的。都是走快速扩张，抢占市场的逻辑。除非是特别小众，利润微薄的角落才允许你慢慢深耕。

只要是利润够多，就一个字，快。快速抢占市场是最重要的。

所以啥也别说了，我要去学习去转行了，趁着年轻，刚30，还没有因为35岁被hr把简历直接扔掉。

现在转行，门槛还不算高，还能趁着供给没跟上来多要一些工资。

标签：私有化,框架,AI,转行,做大,L2.2,算法,模型
From： https://blog.csdn.net/weixin_43467475/article/details/140963032

大模型入门教程（非常详细）从零基础入门到精通，看完这一篇就够了
人人都看得懂的大模型简介大模型就像一座庞大的图书馆，里面有非常多的书籍。但与普通图书馆不同的是，这座图书馆中的每本书都是关于不同事物的描述和知识。而这些书籍中的每一页都代表了这个事物的一些特征或细节。现在，想象一下，你是一个研究员，你想了解各种各样的话题，比如天气......
学大模型必看！手把手带你从零微调大模型！
今天分享一篇技术文章，你可能听说过很多大模型的知识，但却从未亲自使用或微调过大模型。今天这篇文章，就手把手带你从零微调一个大模型。大模型微调本身是一件非常复杂且技术难度很高的任务，因此本篇文章仅从零开始，手把手带你走一遍微调大模型的过程，并不会涉及过多技术细节。......
【大模型书籍PDF】LangChain入门指南：构建高可复用、可扩展的LLM应用程序（推荐）
今天又来给大家推荐一本大模型方面的书籍<Langchain入门指南>这本书专门为那些对自然语言处理技术感兴趣的读者提供了系统的LLM应用开发指南。全书分为11章，从LLM基础知识开始，通过LangChain这个开源框架为读者解读整个LLM应用开发流程。......
想学习人工智能、大语言模型？这份学习路线与免费学习资源最值得推荐
想学习人工智能吗？但不知道如何开始？要熟练掌握人工智能相关的技术，光学习很多课程是不够的。为了摆脱只是跟着教程学习，你需要亲自动手，从头开始编写算法，动手实践，并通过使用人工智能解决问题来做一些有趣的边项目。这篇文章试图创建一份免费的课程路径，希望对大家学习有帮助。（注......
爬虫“拥抱大模型”，有没有搞头？
前言大模型是当前最热门的研究方向之一，千行百业加速“拥抱大模型”。如今，越来越多的研究机构和企业选择开放大模型的源代码和训练数据，促进了学术界和工业界的合作与交流，推动了技术进步，相关生态越来越好。这也使得，无论体量大小，各公司都有参与的机会，越来越多的大模型开始支持多模......
Stable Fast 3D技术解析 - Stability AI推出0.5秒将图片转为3D模型
一、介绍StableFast3D，由StabilityAI推出，是一项颠覆性的3D建模技术，它通过AI算法将单张图片迅速转换为高质量的3D模型，极大地缩短了传统3D建模的时间，同时保持了模型的细节和真实感。关键要点StableFast3D能在仅0.5秒内从单张图片生成高质量的3D资产。S......
大模型与人工智能有什么区别？看完涨知识了
前言人工智能是一个广泛的概念，涵盖了多个领域和技术，旨在实现各种智能化应用。大模型则是人工智能领域中的一个特定技术或方法，主要通过构建规模庞大的模型来处理复杂任务。随着科技的飞速发展，人工智能（ArtificialIntelligence，简称AI）已经成为了我们生活中不可或缺的一部分。......
多模态大模型 intern_vl 2.0版本解读
目录更大规模的语言模型多模态输入多任务输出性能表现github:GitHub-OpenGVLab/InternVL:[CVPR2024Oral]InternVLFamily:APioneeringOpen-SourceAlternativetoGPT-4o.接近GPT-4o表现的可商用开源多模态对话模型论文：https://arxiv.org/pdf/2404.16821（还是......
神-从零构建大模型，尚未发布，GitHub标星22k。
从零构建大模型-即将于今年10月底发布的书籍，github已经吸引了惊人的21.7k标星！作者是威斯康星大学麦迪逊分校的终身教授，在GitHub、油管、X上拥有大量粉丝，是一位真正的大佬。免费获取：神-从零构建大模型，尚未发布，GitHub标星22k！！内容截图......
VannaAI（带有 Ollama 和 ChromaDB）示例程序在训练模型步骤失败
我开始测试VannaAI，并且我正在运行一个基于使用Ollama、ChromaDB为Postgres生成SQL的示例程序：fromvanna.ollamaimportOllamafromvanna.chromadbimportChromaDB_VectorStoreclassMyVanna(ChromaDB_VectorStore,Ollama):def__init__(self,confi......

我为什么要转行做大模型？

标签：私有化,框架,AI,转行,做大,L2.2,算法,模型
From： https://blog.csdn.net/weixin_43467475/article/details/140963032

相关文章

赞助商

阅读排行

我为什么要转行做大模型？

标签：私有化,框架,AI,转行,做大,L2.2,算法,模型 From： https://blog.csdn.net/weixin_43467475/article/details/140963032

相关文章

赞助商

阅读排行

标签：私有化,框架,AI,转行,做大,L2.2,算法,模型
From： https://blog.csdn.net/weixin_43467475/article/details/140963032