基于大语言模型的智能体入门学习
一、大模型开发背景
1、大模型工作原理:
2、大模型的固有缺陷
不具备知识出现幻觉:使用外接知识库给LLM提供知识
无法解决复杂逻辑任务:多个LLM各司其职
不擅长数学运算:使用外接工具如计算器等
3、现有开发范式
检索增强生成(RAG) AI Agent
4、调用open AI GPT3&4模型API
用open AI库调用
requsts原生请求
二、prompt工程
Few-shot
使用少量例子给LLM作为上提示
Zero-shot
不使用例子输入 仅适用指令
Cot
思维链 让LLM有思考过程
可控生成
使用prompt控制LLM生成我们想要的格式方便后期解析
三、检索增强生成
四、大模型智能体
利用LLM搭建自己的AI智能助手
1.获取LLM:
国外:GPT4o 比较便宜国内:阿里的通义千问,智谱AI的GLM都是有开源可以自己运行,也可以调用API使用,
2.工具包开发:
如刚刚提到的网页搜索、代码生成等,在此期间,需要将工具包的描述书写清楚,以便于LLM解析,(如:调用工具包需要的参数及描述)
3.提示词设计:
4.处理模型的回答: LLM返回的数据中,包含了是否使用工具等信息,如果没有则将LLM 返回的消息直接显示给用户如果有,则根据LLM返回的固定格式信息(如json)解析出来, 作为参数调用对应的工具包, 将工具包返回的信息输入到LLM中并告知这是调用该工具包返回的结果。最后将LLM的输出返回给用户
标签:返回,调用,入门,AI,模型,工具包,智能,LLM From: https://www.cnblogs.com/dzhangk/p/18381532