背景
这两年来大模型及其热门,不仅各大厂家的模型层出不穷,各类RGA、Agent应用也花样繁多。这也带火了一批基础设施,比如Langchain、向量数据库(也叫矢量数据库-Vector Database)等。现在市场上的向量库种类特别繁多,但主要还是分为两类,一类是在原有数据库基础上增加了向量相似性检索的能力,比如ES、Redis等等;还有一类就是生而为向量库,比较有名的比如Qdrant、Pinecone等等。最近我们在开发一个基于大模型的测试用例生成的应用,检索采用向量库+知识图谱的混合检索方式。在调研向量数据库时,发现公司有类似的产品,也就是Vearch。并且这款产品开源比较早,也比较成熟,目前已集成到Langchain框架中,所以我们也采用了集团部署的Vearch。这样可以免去部署的烦恼,最重要的是不需要我们去找GPU资源
标签:检索,text,模型,实践,Vearch,embedding,向量,vearch From: https://www.cnblogs.com/Jcloud/p/18217517