首页 > 其他分享 >我为什么要转行做大模型?

我为什么要转行做大模型?

时间:2024-08-06 18:56:49浏览次数:12  
标签:私有化 框架 AI 转行 做大 L2.2 算法 模型

最近研究了一下大模型相关的内容,决定从互联网的推荐算法转行做大模型推理工程化相关的工作。 所以简单说说我在这个决定中的思考过程。

1. 推荐算法岗的现状

我本来是一个在大厂做推荐算法的工程师。收入在行业里面算是中游水平, 就这么一直干着似乎也没什么问题。

但是互联网行业的岗位毕竟和公务员和事业单位比,不存在一个工作干一辈子的情况。这个工作能不能继续干完全取决于市场对于这个岗位有没有需求。

但是推荐算法今年的情况就是,流量增长见顶,需求萎靡。

前两年推荐算法很火,是因为4G出来以后有大量的移动端APP(抖音 快手 小红书等) 用户量激增,创作的内容需要通过推荐算法分发给最需要的用户。但是最近几年这几个APP的用户量增长基本见顶了,就算推荐算法推荐的再好,最大的一波用户增长红利已经结束了。

该用app的用户都已经用上了,连身边的老年人都已经在玩这些app了,还能有哪些新用户呢?无非就是让存量用户每天再多玩个1-2分钟就了不起了。相当于市场对于推荐算法真正的需求已经不多了。

所以从招聘市场的反馈来看,目前依然在招推荐算法的公司似乎只有字节和小红书了。只有字节的抖音系app以及小红书还有用户的增长。其他的公司都是缩招,反应到薪资上也是没什么涨幅。类似于阿里系的蚂蚁淘宝等公司,跳槽过去可能都是平薪。整个行业似乎都在卡30%的跳槽涨幅。

对于抖音生活服务,小红书电商这类新业务,整体体量小,基数低,可以去抢一抢阿里和美团的生意,看起来整体业务增长幅度还不错。只要不是算法做的特别差,随着不断通过各种渠道获取新用户,都可以有不错的业务增长,并不一定非得是算法牛逼。但是这类新的有增量的业务在市场上已经很小了。

对于一些老的业务,比如抖音短视频这类成熟型业务,都是各种高端技术以及极端的trick 才能获得不到百分之一, 甚至不到千分之五业务指标收益。说白了就是改革进入了深水区的感觉,再怎么改算法,都是费劲巴拉收益很小。典型的对数曲线增长。从老板的角度来看,再继续招更多的算法工程师也不能带来业务的收益,索性也就不继续招了。

所以传统的推荐算法在流量见顶的大环境下,岗位需求变得萎靡不振。

2. 大模型创造的新需求

今年年初,ChatGPT的横空出世,让人类看到了人工智能的更多可能。ChatGPT就像2016年的AlphaGo 一样,给各类创业者投资者打了一个样,AI原来可以这么牛逼。

虽然说现在的ChatGPT还只能当个查找资料的工具,但是让人们看到了更多底层的技术的巨大进步,预计在未来的几年会颠覆很多行业,只是暂时没有找到特别大的场景。

从英伟达的股价来看,资本是很看好这个新兴的增长点的。所以投了很多资本进去,这正是打工人收割资本家的好机会。现在资本家人傻钱多,此时不割,更待何时。

另外根据最近猎头的反馈,已经有很多的大模型公司都在疯狂招人了。有的原来做推荐算法的猎头甚至都要转行做大模型了。猎头是可以直接反应市场需求的一批人。

**技术再牛逼,卖不出去,没有市场就是没用的。**市场需求暴增但是供给跟不上的时候往往是价格最高的时候。反正我就是个打工的,既然都出来卖了,为什么不赶紧把自己卖个好价钱。

别跟我说什么深耕一个领域。纵观互联网这几年的发展,就知道这个行业没有什么值得深耕的。都是走快速扩张,抢占市场的逻辑。除非是特别小众,利润微薄的角落才允许你慢慢深耕。

只要是利润够多,就一个字,快。快速抢占市场是最重要的。

所以啥也别说了,我要去学习去转行了,趁着年轻,刚30,还没有因为35岁被hr把简历直接扔掉。

现在转行,门槛还不算高,还能趁着供给没跟上来多要一些工资。

标签:私有化,框架,AI,转行,做大,L2.2,算法,模型
From: https://blog.csdn.net/weixin_43467475/article/details/140963032

相关文章

  • 大模型入门教程(非常详细)从零基础入门到精通,看完这一篇就够了
    人人都看得懂的大模型简介大模型就像一座庞大的图书馆,里面有非常多的书籍。但与普通图书馆不同的是,这座图书馆中的每本书都是关于不同事物的描述和知识。而这些书籍中的每一页都代表了这个事物的一些特征或细节。现在,想象一下,你是一个研究员,你想了解各种各样的话题,比如天气......
  • 学大模型必看!手把手带你从零微调大模型!
    今天分享一篇技术文章,你可能听说过很多大模型的知识,但却从未亲自使用或微调过大模型。今天这篇文章,就手把手带你从零微调一个大模型。大模型微调本身是一件非常复杂且技术难度很高的任务,因此本篇文章仅从零开始,手把手带你走一遍微调大模型的过程,并不会涉及过多技术细节。......
  • 【大模型书籍PDF】LangChain入门指南:构建高可复用、可扩展的LLM应用程序( 推荐)
    今天又来给大家推荐一本大模型方面的书籍<Langchain入门指南>这本书专门为那些对自然语言处理技术感兴趣的读者提供了系统的LLM应用开发指南。全书分为11章,从LLM基础知识开始,通过LangChain这个开源框架为读者解读整个LLM应用开发流程。......
  • 想学习人工智能、大语言模型?这份学习路线与免费学习资源最值得推荐
    想学习人工智能吗?但不知道如何开始?要熟练掌握人工智能相关的技术,光学习很多课程是不够的。为了摆脱只是跟着教程学习,你需要亲自动手,从头开始编写算法,动手实践,并通过使用人工智能解决问题来做一些有趣的边项目。这篇文章试图创建一份免费的课程路径,希望对大家学习有帮助。(注......
  • 爬虫“拥抱大模型”,有没有搞头?
    前言大模型是当前最热门的研究方向之一,千行百业加速“拥抱大模型”。如今,越来越多的研究机构和企业选择开放大模型的源代码和训练数据,促进了学术界和工业界的合作与交流,推动了技术进步,相关生态越来越好。这也使得,无论体量大小,各公司都有参与的机会,越来越多的大模型开始支持多模......
  • Stable Fast 3D技术解析 - Stability AI推出0.5秒将图片转为3D模型
    一、介绍StableFast3D,由StabilityAI推出,是一项颠覆性的3D建模技术,它通过AI算法将单张图片迅速转换为高质量的3D模型,极大地缩短了传统3D建模的时间,同时保持了模型的细节和真实感。关键要点StableFast3D能在仅0.5秒内从单张图片生成高质量的3D资产。S......
  • 大模型与人工智能有什么区别?看完涨知识了
    前言人工智能是一个广泛的概念,涵盖了多个领域和技术,旨在实现各种智能化应用。大模型则是人工智能领域中的一个特定技术或方法,主要通过构建规模庞大的模型来处理复杂任务。随着科技的飞速发展,人工智能(ArtificialIntelligence,简称AI)已经成为了我们生活中不可或缺的一部分。......
  • 多模态大模型 intern_vl 2.0版本解读
    目录更大规模的语言模型多模态输入多任务输出性能表现github:GitHub-OpenGVLab/InternVL:[CVPR2024Oral]InternVLFamily:APioneeringOpen-SourceAlternativetoGPT-4o.接近GPT-4o表现的可商用开源多模态对话模型论文:https://arxiv.org/pdf/2404.16821(还是......
  • 神-从零构建大模型,尚未发布,GitHub标星22k。
       从零构建大模型-即将于今年10月底发布的书籍,github已经吸引了惊人的21.7k标星!作者是威斯康星大学麦迪逊分校的终身教授,在GitHub、油管、X上拥有大量粉丝,是一位真正的大佬。免费获取:神-从零构建大模型,尚未发布,GitHub标星22k!!内容截图......
  • VannaAI(带有 Ollama 和 ChromaDB)示例程序在训练模型步骤失败
    我开始测试VannaAI,并且我正在运行一个基于使用Ollama、ChromaDB为Postgres生成SQL的示例程序:fromvanna.ollamaimportOllamafromvanna.chromadbimportChromaDB_VectorStoreclassMyVanna(ChromaDB_VectorStore,Ollama):def__init__(self,confi......