首页 > 其他分享 >Datawhale X 魔搭 AI夏令营-大模型应用(三)

Datawhale X 魔搭 AI夏令营-大模型应用(三)

时间:2024-08-21 11:27:30浏览次数:8  
标签:医学知识 AI Chroma Datawhale Faiss 数据 夏令营 向量 加载

一.部署到服务器上

1.将搭建好的知识问答AI助手(知心智医)搭建到服务器,并且配置了一个域名http://cardiorag.top:8502/

2.在这过程中有远程登陆,服务器映射问题,好在都解决了,就是gpu算力时时刻刻在烧钱

二.使用ragas框架进行测评

1.遇到的主要问题是,测试数据集,评分数据集的产生,测评顺利进行,但是我们发现Chroma生成的向量数据库虽然响应数据快,回答的比较简洁,但是遇到某些希望详细展开的问题,显得不够专业,之前制作了一个Faiss数据库,会很详细,但就是速度太慢,通过以下向量数据库的比较,重新选择向量数据库

Chroma, Faiss, Weaviate, 和 Qdrant 都是用于构建向量数据库的技术,它们被广泛应用于检索增强生成模型(RAGs)和其他基于内容的推荐系统中。下面我会针对这些技术在模型大小、与医学知识的适配度以及加载速度方面做一个比较。

(一)模型大小

Faiss:
模型大小: Faiss 是 Facebook AI Research 实现的一个高效的相似度搜索库,主要用于大规模的向量集合。它对模型大小的支持很好,可以处理非常大的向量数据集。
医学知识适配度: Faiss 本身并不特别针对医学领域,但它可以很好地适应任何类型的向量数据,包括医学领域的文本嵌入。
加载速度: Faiss 在加载大量数据时可能会较慢,尤其是在初次加载时,但是一旦加载完毕,查询速度非常快。

Chroma:
模型大小: Chroma 是一个开源的向量数据库,它支持中小规模的数据集。对于非常大的模型,Chroma 可能不是最佳选择。
医学知识适配度: Chroma 也可以用于医学知识,但由于其规模限制,更适合较小的医学数据集。
加载速度: Chroma 的加载速度较快,因为它通常处理的数据量相对较小。

Weaviate:
模型大小: Weaviate 是一个企业级的向量数据库,它可以处理从小到大规模的数据集。它支持扩展,因此可以用于较大的模型。
医学知识适配度: Weaviate 提供了丰富的元数据支持,可以很好地与医学知识结合,特别是当需要复杂的查询逻辑时。
加载速度: Weaviate 的加载速度取决于数据集的大小,但通常来说它的加载和查询性能都很不错。

Qdrant:
模型大小: Qdrant 是一个高性能的向量数据库,它可以高效地处理大型数据集。
医学知识适配度: Qdrant 适用于医学知识,尤其是当数据量较大时。
加载速度: Qdrant 的加载速度很快,特别是在处理大规模数据集时,它表现出色。

(二)加载速度

加载速度:
Chroma: 较快,因为数据集通常较小。
Faiss: 可能较慢,尤其是在首次加载大量数据时。
Weaviate: 中等,取决于数据集的大小和复杂性。
Qdrant: 快速,即使是在大规模数据集上。

(三)医学知识适配度

医学知识适配度:
Chroma: 可以适应,但更适合小型数据集。
Faiss: 可以适应任何类型的数据,包括医学数据。
Weaviate: 很好地支持复杂的查询逻辑和元数据,非常适合医学数据。
Qdrant: 支持医学数据,特别是当数据量较大时。

总结
如果您需要处理大规模的数据集,并且对查询速度有较高要求,那么 Faiss 或 Qdrant 可能是更好的选择。
如果您的数据集较小,并且希望快速部署,Chroma 可能更加合适。
对于需要复杂查询逻辑和元数据支持的情况,Weaviate 是一个很好的选项。

三.目前可以公布的情报

目前还在进行向量数据库的性能和速度比较,希望大家可以持续关注,我们将选择最适合模型的向量数据库

标签:医学知识,AI,Chroma,Datawhale,Faiss,数据,夏令营,向量,加载
From: https://www.cnblogs.com/CuckooAI/p/18371257

相关文章

  • 第一批AI原住民开始变现:9岁小学生,用大模型写书赚1个w
    前言当人们正在观望,AI什么时候抢走自己的饭碗时,北京一名9岁的小学生在AI的帮助下写了一本小说,并赚到了2万元的版税。这件看似不可思议的事,他是如何做到的?此外,他还带来一个启发:面对AI时代,不熟悉AI的大众应该采取什么态度?尤其是父母一代,面对“AI时代的原住民”,该在儿童AI......
  • No qualifying bean of type 'feign' available: expected at least 1 bean which qua
    问题:刚用低代码平台引入的一个module,但是启动报错Exceptionencounteredduringcontextinitialization-cancellingrefreshattempt:org.springframework.beans.factory.UnsatisfiedDependencyException:Errorcreatingbeanwithname'ServiceImpl'definedinfile[Ser......
  • 主流AI Agent框架对比,让你轻松构建企业专属大模型!
    大模型的出现为AIAgent提供了足够聪明的“大脑”,并重新定义了AIAgent。各大科技公司正在投入巨额资金来创建AIAgent,包括OpenAI的SamAltman在内的许多专家都表示,AIAgent已成为下一个大热门方向。AIAgent是感知环境并采取行动以实现特定目标或目的的软件或系统。可以是简单......
  • sign_and_send_pubkey: signing failed: agent refused operation
    报错描述ssh连接远程主机时,出现sign_and_send_pubkey:signingfailed:agentrefusedoperation错误,并且还是需要输入密码实验环境Master[root@kvm-master~]#ssh-copy-id-i.ssh/id_rsa.pubroot@kvm-slave/usr/bin/ssh-copy-id:INFO:Sourceofkey(s)tobeinstal......
  • 借助Vercel 十分钟搭建属于自己的AI应用站点
    利用Vercel快速搭建NexiorAI平台Nexior是GitHub上的一个开源项目,利用它我们可以一键部署自己的AI应用站点,包括AI问答、Midjourney绘画、知识库问答、艺术二维码等应用,无需自己开发AI系统、无需采购AI账号、无需关心API支持、无需配置支付系统,零启动成本......
  • 轻松创作高质量的AI音乐——Suno API
    Suno歌曲生成API对接说明随着AI的应用变广,各类AI程序已逐渐普及。AI已逐渐深入到人们的工作生活方方面面。而AI涉及的行业也越来越多,从最初的写作,到医疗教育,再到现在的音乐。Suno是一个专业高质量的AI歌曲和音乐创作平台,用户只需输入简单的文本提示词,即可根......
  • .NETCore 中的 await 原理浅析
    在.NETCore中,await 关键字是异步编程的重要组成部分,它极大地简化了异步代码的编写和维护。下面将对 await 的原理进行浅析:目录一、异步编程的背景二、await关键字的作用三、await的工作原理四、注意事项一、异步编程的背景随着网络应用的普及和硬件性能的不断提......
  • AvaloniaChat-v0.0.2:兼容智谱AI 快速使用指南
    智谱AI介绍北京智谱华章科技有限公司(简称“智谱AI”)致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司合作研发了中英双语千亿级超大规模预训练模型GLM-130B,并基于此推出对话模型ChatGLM,开源单卡版模型ChatGLM-6B。同时,团队还打造了AIGC模型及产品矩阵,包括AI提效助......
  • Semantic Kernel/C#:接入智谱AI的两种方式
    SemantieKernel中对话请求默认是发送到OpenAI去的:其他与OpenAI对话请求接口兼任的模型平台,一般只需要修改host即可,如下所示:default:uriBuilder=newUriBuilder(request.RequestUri){//这里是你要修改的URLScheme="https",Ho......
  • JetBrains PyCharm 2024.2 (macOS, Linux, Windows) - 面向专业开发者的 Python IDE
    JetBrainsPyCharm2024.2(macOS,Linux,Windows)-面向专业开发者的PythonIDEJetBrains跨平台开发者工具请访问原文链接:https://sysin.org/blog/jetbrains-pycharm/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.orgJetBrainsPyCharm-面向专业开发者的Pytho......