Datawhale AI夏令营(第三期)

时间：2024-08-03 14:53:41浏览次数：15

标签：prompt 行动 AI 微调 agent 智能 Datawhale LLM 夏令营

Task4

上分加油站

提分思路

如何使用大语言模型实现top方案呢？

一是训练＆微调模型提升解决逻辑推理问题的能力。

二是使用各种prompt工程、agent系统方案，达到模型解决逻辑推理问题的能力边界。

从这两个方面向大家介绍如何提分，有哪些方案可以选择，可以参考哪些资料。

模型训练&微调

已经在Task03中尝试了baseline2，这里面介绍了如何实现微调。并且大家在微调后模型的推理速度也有一定的提升。那么除了baseline2中讲的lora微调，还有哪些可以在微调中的工作呢？

可以通过prompt调整进行最简单的入手。
除了lora其实还有很多微调的方案，都可以试试看。

当然也可以试试全量微调

prompt & agent

说到prompt，在之前的Task中，已经有了自己的尝试，而且取得了一定的进展。那么prompt还有哪些值得思考的地方呢？datawhale又推出了一份学习prompt以及相关内容的课程，大家可以快速补充prompt的相关知识。

prompt优化思路

agent优化思路

首先，agent是什么？

我们把Agent想象成环境中的数字人，其中

Agent = 大语言模型（LLM） + 观察 + 思考 + 行动 + 记忆

这个公式概括了智能体的功能本质。

为了更好的理解每个组成部分，让我们将其与人类进行类比：

大语言模型（LLM）：LLM作为智能体的“大脑”部分，使其能够处理信息，从交互中学习，做出决策并执行行动。
观察：这是智能体的感知机制，使其能够感知其环境。智能体可能会接收来自另一个智能体的文本消息、来自监视摄像头的视觉数据或来自客户服务录音的音频等一系列信号。这些观察构成了所有后续行动的基础。
思考：思考过程涉及分析观察结果和记忆内容并考虑可能的行动。这是智能体内部的决策过程，其可能由LLM进行驱动。
行动：这些是智能体对其思考和观察的显式响应。行动可以是利用 LLM 生成代码，或是手动预定义的操作，如阅读本地文件。此外，智能体还可以执行使用工具的操作，包括在互联网上搜索天气，使用计算器进行数学计算等。
记忆：智能体的记忆存储过去的经验。这对学习至关重要，因为它允许智能体参考先前的结果并据此调整未来的行动。

例如在MetaGPT中定义的一个agent运行示例如下：

学习agent

一个agent在启动后他会观察自己能获取到的信息，加入自己的记忆中
下一步进行思考，决定下一步的行动，也就是从Action1，Action2，Action3中选择执行的Action
决定行动后，紧接着就执行对应行动，得到这个环节的结果

比如在MetaGPT内 Role 类是智能体的逻辑抽象。一个 Role 能执行特定的 Action，拥有记忆、思考并采用各种策略行动。基本上，它充当一个将所有这些组件联系在一起的凝聚实体。

Docker 存储与部署

教程

总结

恭喜看完所有笔记（撒花撒花），时间飞逝，七天的学习就要结束啦。

整体来说，受益匪浅，还记得第一篇笔记，本以为很难，真的是抱着尝试的态度来完成的，结果不仅提前完成了，而且取得了不错的成绩。因此，凡事都要尝试，会有意想不到的收获。

永远—— “For the Learner，For the Dreamer”！

标签：prompt,行动,AI,微调,agent,智能,Datawhale,LLM,夏令营
From： https://blog.csdn.net/2201_75413532/article/details/140889704

ai轨迹过京东m端
声明(a15018601872)本文章中所有内容仅供学习交流使用，不用于其他任何目的，抓包内容、敏感网址、数据接口等均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！本文章未经许可禁止转载，禁止任何修改后二次传播，擅自使用......
开源模型应用落地-LangChain实用小技巧-ChatPromptTemplate的各种花样（三）
一、前言在当今的自然语言处理领域，LangChain框架因其强大的功能和灵活性而备受关注。掌握一些实用的小技巧，能够让您在使用LangChain框架时更加得心应手，从而更高效地开发出优质的自然语言处理应用。二、术语2.1.LangChain 是一个全方位的、基于大语言模型这......
Pandas中显示Dataframe里的特定行 head/tail/iloc
显示最上面x行cities_df.head(x)#cities_df是名称cities_df.iloc[:x]#iloc是基于整数位置的索引（从0开始）选第三就是写2显示倒数x行cities_df.tail(x)详解iloc开始df.iloc[0]:索引0行（实际标签行的下一行，行0）df.iloc[1:3,0:2]: 1:3是指索引1开始到不......
参加阿里云X优酷AI江湖创作大赛，赠送博客园T恤
大赛官网：https://developer.aliyun.com/plan/create/snbm8月刚开始就接到一个阿里云的广告单子，也是CPA(CostPerAction)方式，按有效参赛人数付费，KPI是完成500人参赛。参赛方式是基于阿里云函数计算服务部署的AI绘画平台创作图片作品。（注：函数计算服务有免费试用额度，使用这个额......
Caused by: io.lettuce.core.RedisCommandExecutionException: WRONGTYPE Operation a
当遇到io.lettuce.core.RedisCommandExecutionException:WRONGTYPEOperationagainstakeyholdingthewrongkindofvalue这个异常时，说明你在Redis中尝试执行的操作与存储在特定键中的数据类型不匹配。下面是一些具体的步骤来帮助你解决问题：1.确定键的数据类型首先，你......
Llamaindex RAG实践
任务要求：基于LlamaIndex构建自己的RAG知识库，寻找一个问题A在使用LlamaIndex之前InternLM2-Chat-1.8B模型不会回答，借助LlamaIndex后InternLM2-Chat-1.8B模型具备回答A的能力，截图保存。本文将分为以下几个部分来介绍，如何使用LlamaIndex来部署InternLM21.8B（以......
使用LangChain访问个人数据第四章-向量数据库与词向量
需要学习提示词工程的同学请看面向开发者的提示词工程需要学习ChatGPT的同学请查看搭建基于ChatGPT的问答系统需要学习LangChian开发的同学请查看基于LangChain开发应用程序本部分前几个章节请查看使用LangChain访问个人数据第一章-简介使用LangChain访问个人数据第......
解密AI漫画解说视频从原理到实践（分佣渠道篇）
......
科大讯飞学生机平板怎么样2024 科大讯飞AI学习机T20 值得买吗
科大讯飞AI学习机T20是一款基于24年AI技术积累的学习工具，致力于为广大学生提供更加智能化、高效的学习体验。该学习机采用了先进的AI技术，通过智能语音识别、自然语言处理等技术手段，实现了AI1对1类人辅导，能够针对不同学生的学习需求和水平，提供个性化的学习方案。不仅如此，科大讯飞A......
我可以为 OpenAI GPT 生成功能输入的 max_tokens 数量是多少？
我尝试过使用100_000、20_000，但似乎只有10_000是可能的：fromopenaiimportOpenAIclient=OpenAI()messages={"role":"user","content":"Hello"}completion=client.chat.completions.create(model="gpt-4o-mini&q......