Xinference

2024-12-16Xinference环境搭建&推理测试
引子写了很多篇开源大模型的环境部署与推理搭建，截止到目前，开源大模型已经发展较为完善。个人觉得，产品和项目维度来看更多的是如果去落地实现，也就是大模型的最后一公里的应用开发。最近看到Xinference一个开源很火的推理框架。OK，那就让我们开始吧。一、框架介绍Xinference：一款性
2024-12-12一个知识付费问答系统
来自www.tuzhi.ltd随着互联网和信息技术的进步，在线教育已经成为越来越普及的教学方式之一。据艾瑞咨询报告数据，至2022年，在线教育市场规模超过8,000亿元人民币，用户基数已达3亿左右，年增长率持续高于10%，预计未来几年仍将保持稳健的发展态势。当前，许多行业参与者都在不断尝试创新教学
2024-12-03查看PCIe bridge设备的bus number
PCIe设备的这三个busnumber是用于定义PCIe拓扑结构的重要参数。PrimaryBusNumber：桥设备上游总线号SecondaryBusNumber：桥设备直接连接的下游总线号SubordinateBusNumber：该桥下所有总线中最大的总线号在PCIe配置空间中的定义如下：structpci_bridge_config_space{
2024-09-28一文详解几种常见本地大模型个人知识库工具部署、微调及对比选型
前言近年来，大模型在AI领域崭露头角，成为技术创新的重要驱动力。从AlphaGo的胜利到GPT系列的推出，大模型展现出了强大的语言生成、理解和多任务处理能力，预示着智能化转型的新阶段。然而，要将大模型的潜力转化为实际生产力，需要克服理论到实践的鸿沟，实现从实验室到现实世界的落地
2024-09-20Dify平台部署全攻略：快速上手的终极教程！
Dify是苏州语灵人工智能科技公司的一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务（BackendasService）和LLMOps的理念，使开发者可以快速搭建生产级的生成式AI应用。即使你是非技术人员，也能参与到AI应用的定义和数据运营过程中。由于Dify内置了构建L
2024-08-27使用xinference部署自定义embedding模型（docker）
使用xinference部署自定义embedding模型（docker）说明：首次发表日期：2024-08-27官方文档：https://inference.readthedocs.io/zh-cn/latest/index.html使用docker部署xinferenceFROMnvcr.io/nvidia/pytorch:23.10-py3#KeepsPythonfromgenerating.pycfilesinthecontai
2024-08-16Xinference实战指南：全面解析LLM大模型部署流程，携手Dify打造高效AI应用实践案例，加速AI项目落地进程
Xinference实战指南：全面解析LLM大模型部署流程，携手Dify打造高效AI应用实践案例，加速AI项目落地进程XorbitsInference(Xinference)是一个开源平台，用于简化各种AI模型的运行和集成。借助Xinference，您可以使用任何开源LLM、嵌入模型和多模态模型在云端或本地环境中运行推理，并
2024-08-02Langchain——chatchat3.1版本docker部署流程Langchain-Chatchat
Langchain——chatchat3.1版本docker部署流程Langchain-Chatchat1.项目地址#项目地址https://github.com/chatchat-space/Langchain-Chatchat#dockerhub地址https://hub.docker.com/r/chatimage/chatchat/tags2.docker部署参考官方文档#官方文档https://github.com/
2024-07-25记录linux本地部署Langchain-chatchat-v0.3+Xinference+qwen-chat 1.5-72B
非源码部署！！！！未用docker，用的conda虚拟环境，Langchain-chatchat-v0.3+Xinference需要分别单独放进虚拟环境，要创建两个虚拟环境，防止包冲突。1.Xinference环境配置1.1首先搭建一个xinference的虚拟环境condacreate-nxinferpython=3.10condaactivatexinfer用的py3.10
2024-07-03利用中转API部署本地大语言模型
前言在本文中，我们将展示如何使用中转API地址(http://api.wlai.vip)来部署本地的大语言模型(LLM)。我们将使用Llama2聊天模型作为示例，但该方法适用于所有受支持的LLM模型。本文将包括以下几个步骤：安装所需库、启动本地模型、创建索引和查询引擎，并附上示例代码和可能遇到