首页 > 其他分享 >embedding模型——BGE-M3的搭建(以算力云平台为例)

embedding模型——BGE-M3的搭建(以算力云平台为例)

时间:2024-07-05 18:13:40浏览次数:19  
标签:embedding git BGE 为例 lfs M3 算力 GLM

本文对在算力云平台为基础搭建本地的embedding大模型bge-m3中遇到的问题做的一个汇总

https://github.com/datawhalechina/self-llm/blob/master/GLM-4/01-GLM-4-9B-chat%20FastApi%20%E9%83%A8%E7%BD%B2%E8%B0%83%E7%94%A8.md

上面是在算力云平台从零开始搭建清华GLM-4-9B-chat大模型的过程,本文算力云平台配置与其一致。

在终端运行以下命令

git lfs install
git clone https://www.modelscope.cn/Xorbits/bge-m3.git

笔者选择的是魔搭社区的源,也可以选择huggingFace的源。

算力云服务器的git版本可能不支持直接安装lfs,我们需要先执行以下命令:

sudo apt install git-lfs

然后再执行上面的两行命令即可成功下载BGE-M3模型。

 

标签:embedding,git,BGE,为例,lfs,M3,算力,GLM
From: https://www.cnblogs.com/tarorat/p/18285770

相关文章

  • 关于BGE-M3接入LangChain时遇到的问题与解决方法
    本文基于https://github.com/datawhalechina/self-llm/blob/master/GLM-4/02-GLM-4-9B-chat%20langchain%20%E6%8E%A5%E5%85%A5.md提供的教程。由于使用本地部署的大模型,在继承LangChain中的LLM类时需要重写几个函数。但是在具体测试的时候出现了以下的错误/root/miniconda3/lib......
  • 基于Dijkstra算法的最优行驶路线搜索matlab仿真,以实际城市复杂路线为例进行测试
    1.程序功能描述     基于Dijkstra算法的最优行驶路线搜索matlab仿真,在一个实际城市路线图中,用鼠标点击起点和终点,通过算法完成路线搜索和规划。最后输出规划路线的长度。 2.测试软件版本以及运行结果展示MATLAB2022a版本运行        通过测试可以看出,Di......
  • 大模型Linux本地化[离线]部署(以DB-GPT为例)
    DB-GPT本地化[离线]部署由于Python相关依赖包的获取极度依赖pip,而Miniconda支持环境隔离和环境打包,所以离线部署本质就是比在线部署多一步环境打包,环境搬迁。所以本篇文章一样适用于在线部署,以CentOS7为例。资源获取DB-GPT官方说明文档DB-GPT源码下载地址Nvidia驱动......
  • 以银行卡取钱的流程为例的状态模式的 java 的 demo
    好的,下面我们将用状态模式来实现一个模拟从银行卡取钱的流程。假设我们有以下几个状态:输入卡输入密码选择操作取款取卡我们通过状态模式来实现这些状态之间的切换。状态接口首先,我们定义一个状态接口ATMState://ATMState.javapublicinterfaceATMState{void......
  • zabbix小白入门:从SNMP配置到图形展示——以IBM服务器为例
    作者乐维社区(forum.lwops.cn)许远在运维实践中,Zabbix作为一款强大的开源监控工具,被广泛应用于服务器、网络设备和应用程序的监控,成为保障业务连续性和高效运行的关键。然而,对于Zabbix的初学者来说,如何从零开始配置并实现数据的图形展示可能会感到无从下手。本文将通过具体的IBM......
  • LLM大模型: RAG的最优chunk方法 — 利用本地离线LLM的embedding实现Semantic Chunking
     1、RAG整个流程的核心节点如下:第一个重要的节点就是chunk。chunk最核心的目的就是把相同语义的token聚集在一起,不同语义的token互相分开,利于后续的retrieve和rerank。举个例子:今天天气很好,我和小明在一起打篮球。隔壁老王在家里看电视。小明的妈妈在家里做晚饭,晚上我......
  • 以Java项目为例,实现Jenkins对接CCE Autopilot集群
    本文分享自华为云社区《Jenkins对接CCEautopilot集群实战》,作者:可以交个朋友。一背景鉴于日趋流行的serverless技术架构、以及用户经常谈及的降本的需求。考虑Jenkins主从架构的特性,slave节点可以在工作的时候部署在任意平台上执行master节点下发的任务,因此可以基于CCEAuto......
  • 大模型应用实战3——开源大模型(以Qwen为例)实现多论对话功能
    对于国内用户来说,一个比较稳定的下载和部署开源大模型的方法就是使用ModelScope的SDK进行下载,然后再Transformer库进行调用。在代码环境中,ollama则提供了openaiAPI风格的大模型调用方法。在开启ollama服务情况下,我们只需要进一步在代码环境中安装openai库即可完成调用。目前都......
  • 如何使用SQL工具批量执行SQL文件?(以MySQL和SQLynx为例)
    目录1.配置MySQL数据源2.打开SQL文件3.执行SQL文件4.检查执行结果5.SQL文件示例6.注意事项7.总结在现代数据库管理和操作中,批量执行SQL文件在MySQL中显现出其巨大的价值和不可替代的作用。通过将多个SQL语句集成在一个文件中进行批量处理,数据库管理......
  • Siemens NX(UG)2406系列(NX2406版本为例)安装教程(含安装包)
    软件介绍SiemensNX(前身为UnigraphicsNX,UGNX版本自12以后不再更新,改为SiemensNX以其他版本号进行更新。)是SiemensPLMSoftware公司出品的一个产品工程解决方案,它为用户的产品设计及加工过程提供了数字化造型和验证手段。SiemensNX针对用户的虚拟产品设计和工艺设计的......