首页 > 其他分享 >昇腾920B2成功运行bge-large-zh-v1.5后(text embeddings inference方式,也被称为TEI),如何注册到dify?(含代码)

昇腾920B2成功运行bge-large-zh-v1.5后(text embeddings inference方式,也被称为TEI),如何注册到dify?(含代码)

时间:2024-12-09 23:29:45浏览次数:10  
标签:TEI zh bge dify 920B2 large v1.5

文章目录


引言

在上一篇中,我们抱着侥幸的,试一试的心态,竟然真的用昇腾显卡跑通了用于embedding的bge-large-zh-v1.5模型。

挑战华为昇腾920B2运行bge-large-zh-v1.5(二)
然而,我们都知道,咱们的博客都是电视连续剧,都得有前因后果。
那这个bge-large-zh-v1.5的后果是啥?
当然是把它给注册到dify平台上,用它来构建知识库啊!

再说会这个large-zh-v1.5模型,我们如果在英伟达nvidia显卡GPU的机器上,有多种方式进行运行。

我们之前介绍了一个特别方便的,也就是基于ollama的方式:

ollama部署bge-m3,并实现与dify平台对接
好吧,模型稍稍不一样,但方法大同小异哈。

但是,在昇腾上,真的资料很少,咱有把握的,也就是上一篇介绍的这个text embeddings inference的方式,也被称为TEI的方式。

说来奇怪哈,这个名字听起来应该知名度挺高的,但是dify平台就是不支持。

那怎么搞呢?咱们先解释一些基本概念,再来说解决方案。

什么是bge-large-zh-v1.5?

bge-large-zh-v1.5是一个专门针对中文优化的大型预训练语言模型。它基于BERT架构进行了改进,可以生成高质量的文本嵌入向量,这些向量能够捕捉文本的语义信息,广泛应用于各种NLP任务。

在昇腾920B2上运行bge-large-zh-v1.5

参考:

挑战华为昇腾920B2运行bge-large-zh-v1.5(一)

挑战华为昇腾920B2运行bge-large-zh-v1.5(二)

编写fastapi服务,将TEI转化成兼容 OpenAI 的方式

TEI的调用方式为:

curl -X POST http://127.0.0.1:8080/embed \
     -H 'Content-Type: application/json' \
     -d '{"inputs":"What is Deep Learning?"}'

翻遍了整个dify,发现这玩意儿,确实没办法直接注册成供应商。

因此,我们想办法把它转成兼容 OpenAI 的方式。

也就是:

curl 

标签:TEI,zh,bge,dify,920B2,large,v1.5
From: https://blog.csdn.net/xiezhipu/article/details/144354751

相关文章

  • 在Intel GPU上使用IPEX-LLM进行本地BGE嵌入优化
    在IntelGPU上使用IPEX-LLM进行本地BGE嵌入优化引言在人工智能领域,嵌入技术广泛应用于信息检索、问答系统等任务中。对于许多开发者而言,了解如何在IntelGPU上利用IPEX-LLM进行优化以获得低延迟、高性能的嵌入操作,是一项非常有价值的技能。本文将以LangChain为例,演示如何......
  • 题解:AT_abc368_d[ABC368D] Minimum Steiner Tree
    题目大意题目给定一棵由$N$个节点组成的无根树,删除其中的一些点和边,使剩下的点和边仍然能够组成一棵树,且包含给定的$K$个特殊点,问最少剩下几个点。思路我们可以发现,这棵无根树的根必须是给定的特殊点之一,不然根节点就可以删除,答案就不是最优。所以我们使用深度优先搜索遍......
  • JAVA8的computeIfAbsent使用方法
    基础说明computeIfAbsent是Java8引入的Map接口中的一个默认方法。它允许你以原子操作的方式在给定键不存在时计算其值,并将其添加到映射中。如果该键已经存在,则返回已存在的值而不执行任何计算。下面是computeIfAbsent的基本用法:Map<K,V>map=newConcurrentHashMap<......
  • 【NZH原创】UNO小游戏(Linux版)
     作者第一次发代码,可能写的不太好,不喜勿喷希望大佬给点意见QWQ这是Linux版的,Window版的过几天发(转向还没写好)#include<bits/stdc++.h>#include<sys/types.h>#include<sys/wait.h>#include<iostream>#include<unistd.h>#include<stdio.h>usingnamespacestd;......
  • ollama部署bge-m3,并实现与dify平台对接
    概述这几天为了写技术博客,各种组件可谓是装了卸,卸了装,只想复现一些东西,确保你们看到的东西都是可以复现的。(看在我这么认真的份上,求个关注啊,拜托各位观众老爷了。)这不,为了实验在windows上docker里运行pytorch,把docker重装了。dify也得重装:Dify基础:Dify平台的本地化部署......
  • 3、.Net UI库:HZHControls - 开源项目研究文章
    HZHControls是一个开源的WinForms控件库,专为.NETFramework4.0及以上版本设计,提供了一套丰富、美观且扁平化的控件集合,非常适合用来快速开发具有Web风格的C/S架构应用程序。以下是HZHControls的一些关键特点和组件介绍:1、开源:HZHControls完全开源,允许用户根据自己......
  • 【JUC】ConcurrentHashMap之computeIfAbsent
    ConcurrentHashMap之computeIfAbsentConcurrentHashMap的锁粒度更细publicclassTGestWordCount{publicstaticvoidmain(String[]args){demo(()->newConcurrentHashMap<String,LongAdder>(),(map,words)->......
  • 活码系统updateInfos前台未授权任意用户密码修改
     0x01产品概述    活码系统updateInfos前台未授权任意用户密码修改漏洞通用描述管理和发布于一体的智能化平台,广泛应用于新闻、媒体和各类内容创作机构。该平台支持多终端、多渠道的内容分发,具备素材管理、编辑加工、智能审核等功能,通过AI技术辅助内容创作与数据分......
  • [ZJCTF 2019]NiZhuanSiWei
    [ZJCTF2019]NiZhuanSiWei上面代码,使用get上传了三个参数,在text者用力恒等于,然后就输出,接着第二个参数中出现flag就输出notnow,接着第三个参数是反序了一下输出。?text=data://text/plain,welcometothezjctf发现有回显解码一下b64:去反序列化得到&password=O%3......
  • AbMole|探索 Podocalyxin - Like Protein 1 对多能性的调节机制
    在生命科学的广袤领域中,对细胞多能性的研究一直是科学家们关注的焦点。近期,一项关于Podocalyxin-LikeProtein1(PODXL)的研究为我们揭示了其在多能性调节中的关键作用。来自国立台湾大学生命科学学院基因组与系统生物学研究中心的Wei-JuChen和麻省总医院基因组医学中心......