• 2024-10-30DashText-快速开始
    快速开始DashText,是向量检索服务DashVector推荐使用的稀疏向量编码器(SparseVectorEncoder),DashText可通过BM25算法将原始文本转换为稀疏向量(SparseVector)表达,通过DashText可大幅度简化使用DashVector[关键词感知检索]能力。说明需要使用您的api-key替换示例中的YOUR_API_KE
  • 2024-10-30DashText-进阶使用
    前置知识BM25简介BM25算法(BestMatching25)是一种广泛用于信息检索领域的排名函数,用于在给定查询(Query)时对一组文档(Document)进行评分和排序。BM25在计算Query和Document之间的相似度时,本质上是依次计算Query中每个单词和Document的相关性,然后对每个单词的相关性进行加权求和。BM