首页 > 编程语言 >AGI时代,程序员想学习大语言模型(LLM),应该从哪里开始?

AGI时代,程序员想学习大语言模型(LLM),应该从哪里开始?

时间:2024-09-11 20:55:10浏览次数:17  
标签:https AGI AI 模型 学习 程序员 LLM 我们

一、 怎样学好,并应用大模型

AGI(Artificial General Intelligence,通用人工智能)时代,懂AI、懂编程、懂业务的超级个体,会是AGI时代最重要的人。为了成为这样的超级个体,我们需要在哪几个方向发力呢?那就是:原理、实践和认知。

不懂原理就不会举一反三,走不了太远。

不懂实践就只能纸上谈兵,做事不落地。

认知不高就无法做对决策,天花板太低。

接着,老师给我们展示了我们学员的职业构成,我从来没有见过有哪一门课,学员的组成是这样的复杂与多样。而这也反证了,大模型时代,对各行业的大家都提出了要求,也都给予了机遇,我们站在风口上,应当抓住它。下面我放一张关于这个课程的学习人群,我们也能看出来各个行业领域,看看是否你也是其中一员。

学习大模型技术人才岗位比例

孙老师在课上也给同学们吃了几颗定心丸,这也让我认识到多模态新一代人工智能的变化之大,相较于过去得确存在很大的变化,我总结以下核心几点:

1. 用好AI需要很多数学知识吗?

以前真需要,以后可能不那么需要了。

2. 有的知识太深,我理解不了怎么办?

[用到再讲,学以致用]是这堂课的教学理念,很多知识,用着用着就了解了;

少部分数学知识主要集中在数据和模型训练部分,不理解,也不影响使用。

3. 感觉讲的太浅了,没学到知识怎么办?

更深的东西,在实践中未必有用;

欢迎随时在群里提问。

4. 课听懂了,实际工作中还是不会用怎么办?

NLP的实际问题通常不是由一个算法解决的,我们把拆解问题的思路融入课程中,用心体会。

在了解了这些之后,接下来我们看一些更干、更实的内容,大模型到底能干什么?

大模型能干什么?

大模型,全称「大语言模型」,英文「Large Language Model」,缩写「LLM」。例如以下这些都是目前访问量较高的大语言模型,我们能够看到越来越多的头部公司、创业公司开始布局大模型,我也给大家放了访问地址,大家可以自行体验:

ChatGPT:https://chat.openai.com/

Bing Chat:https://bing.com/new

文心一言https://yiyan.baidu.com/

讯飞星火https://xinghuo.xfyun.cn/

智谱清言https://chatglm.cn/

当然,我们不难发现,在大模型快速发展的一年,ChatGPT 仍然是当家扛把子,别人追赶的对象。对于问答类的大模型大家难免会有疑问,那大语言模型只能充当聊天机器人吗?

我的回答是:NONONO,它的应用场景,远不止于此。在图像、音视频、编程、文案、知识库等应用上,它都能比传统的处理方式或工具强N多倍,接下来我就结合几个大家常用的案例来抛砖引玉一下。

1. 按格式输出

我们提供给大模型一个收件地址,并用自然语言描述我们希望它输出的格式,那么大模型就会按照“name”、“address”以及“phone”三个字段对进行整合。

2. 分类

我们提供给大模型一个新闻标题,以及几个类别,让大模型为我们在这几个类别里面进行分类,那么大模型就会给出它认为的答案并输出。

3.聚类

我们提供给大模型几个句子,并让大模型根据它自己的理解,对这几个句子进行聚类,以数组的形式进行输出,可以看到大模型也给出了它认为的答案。

4.持续互动

当然大模型也可以与用户进行多轮对话,即持续互动,以下举了一个下棋的例子,首先将三个子连成一行的那方赢,第一轮对话中我们给大模型介绍了游戏规则,并以坐标的形式放了4个棋子,这轮对话结束后,我们继续问大模型“该X方放置棋子了,他应该把棋子放在哪里?”,大模型给出了图示以及这样放置的原因,可见大模型是能够保存上一轮对话的历史的,我们可以基于历史对大模型进行进一步的交流。

5. 技术相关问题

技术相关的问题肯定是程序员的必问问题之一,以下例子中我们用自然语言描述了我们的需求,我们在Ubuntu的系统中,我们没有安装任何软件包,我们需要运行一个MySQL的数据库,我们应该怎样做,可见大模型给到了我们非常详细的代码。当然了,除此之外,我们还可以将我们运行代码过程中遇到的报错信息粘贴到大模型对话框里,可能下一秒这个问题就解决了~

结合上面几个简单的小例子,可能没那么难,这也是它的冰山一角。

而这仅仅是一个入门,《AI全栈工程师培养计划》这门课是一个全面、系统、实践创新的综合性课程,旨在培养掌握前沿技术的全栈工程师。该计划包括多个阶段,涵盖了从基础知识到大模型框架、大模型微调的方方面面。我建议你可以先通过公开课,来全方位剖析一下在你的工作领域有哪些工作是可以通过大模型来进行优化。

 大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。


2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书 

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。



4.LLM面试题和面经合集


这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。



标签:https,AGI,AI,模型,学习,程序员,LLM,我们
From: https://blog.csdn.net/2401_84204207/article/details/142150021

相关文章

  • 中年程序员该何去何从
    中年程序员在职业生涯中可能会面临一些独特的挑战和机遇。以下是一些建议,帮助中年程序员在职业生涯中找到方向并继续成长:1.持续学习和技能提升技术领域变化迅速,持续学习是保持竞争力的关键。考虑以下几种方式:在线课程和认证:参加在线课程(如Coursera、Udacity、edX等)并获......
  • 借鉴史蒂芬·柯维的《高效能人士的七个习惯》,高效能程序员的七个习惯
                    借鉴史蒂芬·柯维的《高效能人士的七个习惯》中的概念。高效能程序员的七个习惯是指那些能够帮助程序员提高工作效率、代码质量以及个人职业发展的一系列行为准则。以下是一些被广泛认可的习惯:持续学习:技术领域不断进步,高效能程序员会持续......
  • 程序员副业推荐专题—如果利用AI来撰写爽文小说
    概况说明:这一过程将结合自然语言处理(NLP)、机器学习(ML)以及可能的生成对抗网络(GANs)或变分自编码器(VAEs)等高级技术。爽文小说,以其情节紧凑、节奏明快、主角成长迅速且屡获奇遇为特点,深受读者喜爱。以下是AI撰写爽文小说的详细步骤与考虑因素:1.数据收集与预处理收集素材:首先,需......
  • 程序员副业推荐专题—如果利用AI来撰写生成短剧
    AI生成短剧的过程是一个结合了创意、技术与自动化的复杂流程。以下是AI生成短剧的详细步骤:1.概念构思与主题确定明确主题与风格:首先,需要确定短剧的主题、风格(如喜剧、科幻、悬疑等)和目标受众。这一步是创作的基础,决定了后续环节的方向。灵感来源:AI可以通过分析大量文本、......
  • tanuki.py学习资料汇总 - 轻松构建更快更便宜的LLM应用
    tanuki.py简介tanuki.py是一个用于轻松构建LLM驱动应用的Python库,它能让LLM应用随着使用变得更快更便宜。其主要特点包括:易于集成-只需几秒钟即可将LLM增强功能添加到任何工作流程中类型感知-确保LLM输出符合函数的类型约束,避免意外问题对齐输出-通过简单的断言语......
  • 程序员也需要流程图?
       市面上常用的流程图软件有很多,常见的有Visio,ProcessOn,draw.io等等。最开始尝试了Visio,老大哥般的存在,微软旗下的,不过有点贵;后来尝试了免费的draw.io和processon,整体还不错,但长期使用的话会发现比Visio差点手感。  但你以为我会选择其中一个推荐吗?其实我推荐的是......
  • 程序员下班以后做什么副业合适?
    我就是一个最普通的网络安全工程师,出道快10年了,不出意外地遭遇到瓶颈期,但是凭技术在各大平台挖漏洞副业,硬是妥妥扛过来了。因为对于程序员来讲,这是个试错成本很低、事半功倍的选择。编程技能是一种强大生产力,决定程序员是一个高薪职业,同时由于技术迭代太快,决定程序员也是一......
  • Base/chat/instruct in LLM
    Base/chat/instructhttps://blog.csdn.net/qq_43127132/article/details/140447880大模型库中的base、chat、instruct和4bit通常指的是不同类型或配置的预训练语言模型。它们的区别主要在于训练目标、用途和模型参数的精度。以下是对这些术语的解释:1.Base模型(base)   ......
  • 程序员转行须知:深思熟虑后再做决定——评估转行至大模型领域的可行性
    在当今的AI时代,程序员的工作模式已经受到了很大的冲击。随着AI大模型的快速发展和应用,传统初级程序员的工作确实是大受影响,这些人员的工作主要是功能实现和重复场景实现。而现在,越来越多的工具可以帮助程序员提高效率,如GithubCopilot等。这些工具可以理解上下文的语义,并且......
  • RAG与LLM原理及实践(17)---Docker Redis & Python Usage
    目录背景Redis环境download修改镜像RunRedisCodingpythonredisdownload基本使用描述完整代码运行结果高阶用法序列化的方式 Snapshot与AOF快照(RDB)AOF(Append-OnlyFile)代码总结发布与订阅描述     代码运行结果注意事项解释Transanction......