xinference

2024-11-21Win10 部署 Langchain-Chatchat 0.3
项目地址：https://github.com/chatchat-space/Langchain-Chatchat前面装好了Xinference现在开始安装Langchain-Chatchat我们还是要先conda创建个环境condacreate --prefixD:\AI\Chatchat03python=3.11下面激活环境：condaactivateD:\AI\Chatchat03然后安装Langchain-Cha
2024-11-11Langchain-Chatchat 0.3 -- miniconda
Langchain-Chatchat0.3的版本更新到了0.3本地不再使用fastchat了，这次准备使用Xinference为了方便python的版本管理，这次使用miniconda安装miniconda其实很简单的，下载对应的版本下一步下一步就行了https://docs.anaconda.com/miniconda/本次还是用的win11，下载Miniconda3
2024-09-28一文详解几种常见本地大模型个人知识库工具部署、微调及对比选型
前言近年来，大模型在AI领域崭露头角，成为技术创新的重要驱动力。从AlphaGo的胜利到GPT系列的推出，大模型展现出了强大的语言生成、理解和多任务处理能力，预示着智能化转型的新阶段。然而，要将大模型的潜力转化为实际生产力，需要克服理论到实践的鸿沟，实现从实验室到现实世界的落地
2024-09-20Dify平台部署全攻略：快速上手的终极教程！
Dify是苏州语灵人工智能科技公司的一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务（BackendasService）和LLMOps的理念，使开发者可以快速搭建生产级的生成式AI应用。即使你是非技术人员，也能参与到AI应用的定义和数据运营过程中。由于Dify内置了构建L
2024-08-27使用xinference部署自定义embedding模型（docker）
使用xinference部署自定义embedding模型（docker）说明：首次发表日期：2024-08-27官方文档：https://inference.readthedocs.io/zh-cn/latest/index.html使用docker部署xinferenceFROMnvcr.io/nvidia/pytorch:23.10-py3#KeepsPythonfromgenerating.pycfilesinthecontai
2024-08-16Xinference实战指南：全面解析LLM大模型部署流程，携手Dify打造高效AI应用实践案例，加速AI项目落地进程
Xinference实战指南：全面解析LLM大模型部署流程，携手Dify打造高效AI应用实践案例，加速AI项目落地进程XorbitsInference(Xinference)是一个开源平台，用于简化各种AI模型的运行和集成。借助Xinference，您可以使用任何开源LLM、嵌入模型和多模态模型在云端或本地环境中运行推理，并
2024-08-02Langchain——chatchat3.1版本docker部署流程Langchain-Chatchat
Langchain——chatchat3.1版本docker部署流程Langchain-Chatchat1.项目地址#项目地址https://github.com/chatchat-space/Langchain-Chatchat#dockerhub地址https://hub.docker.com/r/chatimage/chatchat/tags2.docker部署参考官方文档#官方文档https://github.com/
2024-07-25记录linux本地部署Langchain-chatchat-v0.3+Xinference+qwen-chat 1.5-72B
非源码部署！！！！未用docker，用的conda虚拟环境，Langchain-chatchat-v0.3+Xinference需要分别单独放进虚拟环境，要创建两个虚拟环境，防止包冲突。1.Xinference环境配置1.1首先搭建一个xinference的虚拟环境condacreate-nxinferpython=3.10condaactivatexinfer用的py3.10
2024-07-03利用中转API部署本地大语言模型
前言在本文中，我们将展示如何使用中转API地址(http://api.wlai.vip)来部署本地的大语言模型(LLM)。我们将使用Llama2聊天模型作为示例，但该方法适用于所有受支持的LLM模型。本文将包括以下几个步骤：安装所需库、启动本地模型、创建索引和查询引擎，并附上示例代码和可能遇到