首页 > 其他分享 >AI知识库这事儿FastGPT是专业的

AI知识库这事儿FastGPT是专业的

时间:2024-07-24 17:43:52浏览次数:14  
标签:FastGPT AI 模型 知识库 千帆 百度

在搭建AI知识库这事儿上,有不少成熟的框架,我推荐使用FastGPT。这篇文章笔者就使用过的两款平台做个比较,FastGPT和百度千帆平台。

1. 为什么要搭建知识库

随着企业的运营,企业的私有数据越来越多(结构化、半结构化、非结构化的数据)。这么多数据,我们不可能都记在大脑里,就算老员工能记住,那对于一个新人来说如何快速上手呢?

所以搭建知识库就成了刚需。得益于LLM(大模型)的发展,让AI可以更好的理解自然语言,再加上向量数据库的检索,让许多沉睡的知识可以被唤醒。

企业可以通过搭建知识库提高工作效率,提升服务质量,还可以基于知识做出更好的决策。

2. 技术方案

2.1. 我推荐的方案

LLM存在幻觉问题,对于它不知道的知识会胡编乱造,可靠性差。所以在搭建知识库的技术方案上,一般有2个争论:

  1. 企业自己微调大模型。
  2. 使用RAG检索增强技术。

微调大模型,就是将已有的知识喂给LLM,让LLM学习。暂不说这种方式的安全性如何。单单从模型迭代的角度来看就不合适。

不管是部署开源模型 还是 采用闭源模型,随着时间的推移,模型的迭代非常快,模型会越来越聪明。模型每14天都会小迭代一次。迭代之后,之前投喂的数据会失效,而且之前做过的优化,会随着模型能力变强后,会变成无用功。

所以,我更推荐RAG技术。检索增强生成(Retrieval Augmented Generation,RAG)是一种强大的工具,它可以将企业的私有知识 通过LLM + 外接向量数据库的方式整合到一起。

2.2. 常规步骤

技术方案选定后,我们常规的搭建知识库的步骤如下:

文档加载 → 文档分割 → 文档嵌入 → 向量化存储 → 文档检索 → 生成回答

2.3. 两个主角

方案和步骤有了,下面看看选哪种框架。业内用LLM做知识库的方案较多,比如FastGPT、Dify、自己基于LangChain开发、百度的千帆平台等等。

本篇主要介绍FastGPT和 百度千帆平台。基于LangChain开发的方案之前的文章也介绍过,感兴趣的朋友自行翻阅之前的文章。

  • 百度千帆平台是百度推出的基于大模型的一站式应用解决方案平台,提供先进的生成式AI生产及应用全流程开发工具链。**主打一个一站式。**百度深耕AI多年,也是国内最早推出一站式平台的,整体还算方便。

  • FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。同时可以通过 Flow 可视化进行工作流编排,从而实现复杂的问答场景!主打一个知识库问答。

下面就两个主角在知识库问答领域的效果做个比较

3. 使用比较

3.1. 操作界面

操作界面上都差不过,从首页,到上传文件到知识库,再到创建AI应用,操作都很简便。

我个人更喜欢FastGPT的页面风格,页面比较清爽,很明显地看到 知识库、创建大模型应用 这2个版块。

FastGPT

首页

创建知识库,将处理好的本地文档、网页、QA问答上传,然后利用词嵌入模型处理,再存入向量数据库。

创建AI应用

百度千帆

首页:

创建知识库,将处理好的本地文档、网页、QA问答上传,然后利用词嵌入模型处理,再存入向量数据库。

创建AI应用

3.2. 可选词嵌入模型

在文档嵌入这一步,需要选择词嵌入模型。FastGPT可以选择适合自己的模型,但是百度千帆没有选择项,只能用百度的模型。

FastGPT

3.3. 可选问答模型

在AI回答这一步,也需要用到大模型。FastGPT可以选择适合自己的模型,但是百度千帆没有选择项,只能用百度的模型。

FastGPT

百度千帆

3.4. 可以发布到的渠道

发布渠道这一局,算百度完胜了!百度千帆集成了多个发布渠道,使用感受较好。FastGPT相对来说就有点少了,而且还需要额外的搭建和部署。

FastGPT

百度千帆

3.5. 最终的回答效果和体验

他俩在正常的问答结果上都差不多,这个结果跟选择的词嵌入模型和问答模型有关。但是在使用的体验上,我有几点要吐槽:

  • FastGPT的对话框,历史对话消息不会丢失。但百度千帆的对话框刷新下,历史对话会丢失,这个体验感有点差。
  • 百度千帆的对话界面,不知道为什么非要突出老大一个图标和应用标题,几乎占了小半屏,导致对话内容的可见区域被压缩,此处我要@下百度的产品经理,请问你这么设计的目的是啥?

  • 对比看下FastGPT就很简洁,对话区域也很大,用起来比较舒适。

  • 百度千帆分享出去的网页必须要登录,这个有点恶心,没必要在这里强行拉一波注册吧。而FastGPT分享的网页免登即可使用。

3.6. 源码开放

FastGPT

FastGPT源码开放,可以自己搭建,模型也可以自己搭配。对于企业内部使用非常友好。

自行搭建的话,需要开发者介入。不过FastGPT也有云上的SaaS版本,按需付费使用,无需开发者介入。

百度千帆

百度千帆是百度的闭源产品,模型也是闭源,而且模型只能用百度。这个对于企业内部使用不友好。

无需开发者介入,稍微懂些产品,看下文档,即可使用。

3.7. 数据安全

如果从数据安全方面考虑,只能选择FastGPT了,所有的数据都可以存储在企业自己的服务器上。

4. 方案总结

总之,没有最优的方案,只有最合适的方案。

大部分场景下FastGPT都是比较胜任的。如果只考虑以最小代价快速实现一个知识库问答,我推荐使用百度千帆平台。其余情况,我推荐使用FastGPT。

在操作界面上、词嵌入模型上、问答模型上、对话体验和数据安全上,我觉得FastGPT都是很专业的。FastGPT的发力点就是在构建专业的知识库领域。

=====>>>>>> 关于我 <<<<<<=====

本篇完结!欢迎点赞 关注 收藏!!!

原文链接:https://mp.weixin.qq.com/s/D2s2Y0sndjc8oDA3ce1QRg

标签:FastGPT,AI,模型,知识库,千帆,百度
From: https://www.cnblogs.com/mangod/p/18321372

相关文章

  • Adobe Illustrator 和 Photoshop 迎来新 AI 功能;马斯克将训练全球最强 AI丨 RTE 开发
       开发者朋友们大家好: 这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(Real-TimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编......
  • 足球预测新征程:AI大数据分析
    引言如今我们身处在数字化浪潮的中,我们身边的一切都能被拆分成大大小小的数据,而这些都能被AI所利用分析。其中,我们对比赛结果进行预测,也是属于这个过程范围之内。而与传统时代不同,如今我们获得了AI这项工具,AI与大数据相辅相成能否为我们开启足球预测的新征程呢?本文将对此详细......
  • GPT-4o Mini 来袭:开发者如何驾驭新一代AI模型
    前言随着人工智能技术的飞速发展,自然语言处理(NLP)领域迎来了新的突破。GPT-4oMini,作为最新一代的预训练语言模型,不仅在模型大小上进行了优化,同时在语言理解和生成能力上实现了质的飞跃。本文旨在深入探讨GPT-4oMini的技术特点、应用场景以及开发者如何有效利用这一模型,以推动......
  • vscode-CodeGeeX AI在vscode运用
    1.CodeGeeX代码自动生成和补全,代码翻译,自动添加注释,智能问答等 2.vscode中使用  3.官方网址https://codegeex.cn/downloadGuide#vscode进行登录注册使用,个人免费 ......
  • RkAiq(Rk Auto Image Quality)模块讲解
    RkAiq模块是一个用于图像质量优化和处理的库,通常用于图像信号处理(ISP)框架中,特别是在摄像头应用中。RkAiq代表"RockchipAIImageQuality",它由Rockchip开发,旨在利用人工智能和先进的算法来提升图像质量。概述ISP30包含了一系列的图像处理算法模块,主要包括:暗电流矫正、坏点矫......
  • 边缘设备使用记录--阿加犀AIBox 6490(realsense+yolox部署)
    边缘设备使用记录--阿加犀AIBox6490:realsense+yolox部署前言RealsenseSDK+ROSYOLOx部署预处理后处理可视化ROS节点总结前言由于6490这个板子是有type-c接口的,所以这里准备用Realsense+YOLOx来先简单做一个实时的目标检测的东西出来,这里也用到上一篇文章所提到......
  • 【YashanDB知识库】stmt未close,导致YAS-00103 no free block in sql main pool part 0
    问题现象问题单:YAS-00103nofreeblockinsqlmainpoolpart0,YAS-00105outofmemorytoallocatehashtableofsize=256现象:业务处理sql时,报错YAS-00103nofreeblockinsqlmainpoolpart0问题风险及影响业务处理报错,影响功能使用问题影响版本客户版本:22.2.4......
  • Failed to create JVM.JVM Path:D:\IntelliJ IDEA 2024.1.4\jbr Error launching I
     IDEA修改启动参数掉大坑!情况说明:在Help>EditCustom VMOptions修改IDEA的VM产生之后无法打开(重启/重装多次依然无法打开),修改C盘的idea64.exe.vmoptions和安装目录的idea64.exe.vmoptions依然无法启动!,后面把IDEA安装目录的jar文件夹删了,又重装JDK。由于我有多个JDK环境,......
  • object dict cannot be used in await expression报错解释
    报错解释:这个错误通常出现在使用Python的异步编程模型时,尝试在一个不支持异步的对象上使用await关键字。在Python中,await关键字只能在异步函数中使用,而异步函数通常定义在asyncdef语句中。错误"objectdictcannotbeusedinawaitexpression"意味着你正尝试在一个普通的字典......
  • 【YashanDB知识库】filter or改写问题
    问题现象当filter中出现or的时候,会导致filter无法走索引或者走hashjoin,就需要进行改写,例如:createtabletest_tab1(col1int,col2int,col3int);createtabletest_tab2(col4int,col5int,col6int);beginforiin1..10000loopinsertintotest_tab1values(i......