文章目录
- 1 前言
- 2 搭建我的博客问答系统
- 2.1 平台介绍(不需要魔法即可访问)
- 2.2 前期准备
- 2.3 上传博客作为数据集至Dify
- 2.4 搭建你的博客回答专员
- 3 利用有针对性的GPT帮助我们阅读前沿论文
- 4 结语
个人博客专属问答员:demo
1 前言
GPT是生成式预训练Transformer的缩写。它是由OpenAI开发的一系列大型语言模型。GPT系列的模型基于Transformer架构,使用注意力机制来有选择性地关注输入文本的相关部分。GPT模型使用大量数据进行训练,以预测序列中的下一个标记,并且能够生成连贯且与上下文相关的文本。
GPT系列中最近的模型是GPT-4,于2023年3月14日发布。GPT-4是一个多模态语言模型,意味着它可以接受文本和图像作为输入。它经过了强化学习和人工智能反馈的微调,以确保与人类的一致性和遵循政策。
GPT-3是该系列中另一个值得注意的模型,于2020年发布。它有1750亿的参数,使其成为当时最大的语言模型之一。GPT-3在各种任务上展示出了强大的零样本和少样本学习能力。
OpenAI还开发了一个名为ChatGPT的聊天机器人,它是基于GPT模型构建的。ChatGPT允许用户进行交互式对话,并提供了调整和引导对话的选项,以达到所需的长度、格式、风格、细节级别和使用语言。它已经变得非常流行,并提供免费版和付费订阅服务“ChatGPT Plus”。
众所周知,GPT3.5学习的知识截止于2021年,对于在此之后的事情的回答都是胡编乱造的。我们设计两个应用场景,一是如果想用GPT打造软件平台专用客服,如果仅仅接入普通的GPT3.5,那么针对用户提出的问题基本不可能有针对性的回答。二是,我们在做学术的时候,往往会阅读一些前沿的文章,这些文章都是GPT没有学习到的,那么我们询问GPT关于这篇文章的内容,GPT毫无疑问的会胡编乱造。
那么,我们今天就来解决这个问题,如何让GPT3.5的回答更加有针对性与特定领域的准确性。对此我通过两个实验来讲解:
(1)搭建我的博客问答系统,该系统中的GPT可以为用户讲解我的博客内容以及回答用户关于我博客的问题。系统的链接如下:demo;
(2)利用有针对性的GPT帮助我们阅读前沿论文;
2 搭建我的博客问答系统
2.1 平台介绍(不需要魔法即可访问)
Dify.ai:Dify 一词源自 Define + Modify,意指定义并且持续的改进你的 AI 应用,它是为你而做的(Do it for you)。
如果你对诸如 GPT-4 之类的 LLM 技术高速发展感到惊奇和兴奋,迫不及待的想用它做点什么有用的东西!可你的头脑里又有一切令人困惑的问题:
- 我该如何“训练”一个基于我的内容的模型?
- 怎么让 AI 知道 2021 年以后的事情?
- 如何避免让 AI 跟用户胡说八道?
- 微调(Fine-tuning)和嵌入(Embedding)是什么意思?
那么,Dify 正好能满足你的需要。
Dify 的目标是让开发者(甚至非开发者)可以快速基于大型语言模型搭建出有用的东西,并确保它是可视化、可运营、可改进的。
2.2 前期准备
由于打造的专属GPT是学习你的博文知识,所以这里需要将你的博文导出,贴心的CSDN为我们提供了导出功能!
在博客编辑页面点击导出→点击导出为MarkDown文件
ps:这也可以作为你博客备份的方法
将你的博客都导出后,整理到一个文件夹中,前期准备结束!
2.3 上传博客作为数据集至Dify
step1:首先需要你登录Dify,在主页中点击数据集:
step2:在数据集页面中点击创建数据集:
step3:在创建数据集界面中点击创建一个空的数据集:
step4:接下来为你的博客数据集起一个名称(我这里起名为blog):
step5:将你的问题md的博客文件全部导入至blog数据集文件夹中,并点击下一步:
step6:按照下图的选择点击“保存并处理”(这里其实更加推荐高质量索引方式):
step7:等待系统处理完成,即所有文件都显示可用:
至此,你的博文知识以作为数据集传入系统啦!
2.4 搭建你的博客回答专员
step1:我们来到构建应用专区并点击创建应用:
step2:我们为这个应用创建一个名字,并选择对话型应用:
step3:浏览应用信息,你可以在刚进入的页面查看应用URL、用户活跃数等信息,方便日后的管理:
step4:点击提示词编排开始进行机器人设置,首先你需要“催眠”GPT,让他成为你的博客讲解员,在“对话前提示词一栏进行如下设置”;然后你需要上传你的博客知识,在上下文中选择你刚刚上传完成的数据集:
step5:一切检查无误后点击发布,后访问step3中出现的URL即可使用你的专属博客讲解员了!
这里的核心就是在用户与GPT进行对话前让GPT进行身份带入,并“传授”给GPT特定的知识,这样GPT对于用户提出的关于你博客的问题就不会胡编乱造,从而进行完美的回答!
ps:同理,也可用该方法搭建软件平台的专属客服,需要将平台的帮助文档作为知识库~
3 利用有针对性的GPT帮助我们阅读前沿论文
这里的核心原理与操作主要与第二章相同,首先需要将论文的PDF版作为数据集上传至Dify:
我们在Dify首页,点击“智聊”,即可出现以下界面:
可以看到Dify已经集成了GPT联网的功能,我们将刚刚上传的论文作为上下文输入给GPT:
现在您可以使用GPT来询问特定论文的内容,并且平台会根据您与GPT的对话自动生成接下来的可能提问,这使得获取信息变得非常方便。
可以从上图看到,这篇论文是2023年发表的。我们来尝试一下,如果不给GPT上下文的前提条件,GPT会给出什么样的回答?
GPT是一个基于GPT-3.5模型训练的大型语言模型,但需要注意的是,它的知识仅截止于2021年。因此,对于涉及到最新信息或与论文原文相关的问题,GPT将只能胡编乱造,无法提供准确和专业的回答。
4 结语
博客问答系统的搭建非常有用。该系统利用GPT可以讲解博客内容并回答用户的问题。通过Dify.ai平台,我们可以轻松定义并不断改进自己的AI应用。这使我们能够利用最新的LLM技术,包括像GPT-4这样的模型。这个平台还解决了一些关于训练模型、了解2021年以后的事情和避免胡说八道的困惑。它提供了微调和嵌入的功能,使我们能够更好地管理和优化我们的应用。
总之,Dify为我们带来了搭建博客问答系统的便利性和灵活性。通过利用GPT-3.5模型和Dify.ai平台,我们能为用户提供更有深度和准确性的回答,从而提高用户体验并确保信息的正确传达。这是一个引人注目且实用的应用,对于个人博客或其他内容提供者来说,它将成为一种有价值且强大的工具。
如果喜欢还请多多点赞、评论