首页 > 其他分享 >大模型工具_Langchain-Chatchat

大模型工具_Langchain-Chatchat

时间:2024-01-02 13:34:32浏览次数:43  
标签:chatchat -- 模型 Langchain Chatchat docker com


https://github.com/chatchat-space/Langchain-Chatchat 原Langchain-ChatGLM

大模型工具_Langchain-Chatchat_langchain

1 功能

  • 整体功能,想解决什么问题
  • 基于 Langchain 与 ChatGLM 等LLM模型,搭建一套针对中文场景与开源模型,界面友好、可离线运行的知识库问答解决方案。
  • 当前解决了什么问题,哪些问题解决不了
  • 目前 0.2.8 版本支持了多个本地模型
  • 因为加入了大模型,配置难度相对较大
  • 提供哪些功能点,其中哪些是刚需
  • 核心功能是:支持中文&离线知识库与问答系统
  • 同时支持搜索实时数据,以及对其它在线大模型的调用,整体功能丰富。
  • 用户使用难度,操作逻辑是否过于复杂
  • 工具链做得很好,不需要太多配置

2 技术栈

  • 技术栈是什么:
  • 前端使用 python streamlit 实现
  • 知识库使用 langchain 构建
  • 现有底层工具消化了哪些常用功能
  • FastChat:用于大模型支持
  • langchain:用于构建本地知识库
  • ChatGLM:中文 LLM 模型
  • HuggingFace 中各种开源 Emebdding 模型,以及线上Embedding
  • Streamlit:Web界面
  • 搜索引擎:Bing 搜索,DuckDuckGo 搜索,Metaphor 搜索
  • 向量库支持:es, pgsql, faiss, milvus, zilliz等
  • 代码分析(使用cloc工具统计)
  • github 项目下载 137M,其中一半为.git,还包含一些 nltk data
  • 代码:Python 10709行,JS 1604 行。
  • docker image: 41.3 G,以为自己看错了;镜像较大主要由于其中包含了 chatglm2-6b 和 Embedding 模型,以及 torch, cuda 库;还有一些安装过程中的数据没删除。
  • 核心代码在:源码/server/ 目录下

3 商业模式

  • 以本地部署为主

4 环境测试

  • 下载源码
$ git clone https://github.com/chatchat-space/Langchain-Chatchat
  • Docker镜像
    直接下载可用的docker镜像
$ docker run -d --gpus all -p 8051:8501 registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.7

我的显存不够报错,本地部署大模型,建议 20G以上显存

启动镜像并进入手动调试:

$ docker run -it --gpus all --network=host --entrypoint bash registry.cn-beijing.aliyuncs.com/chatchat/chatchat:0.2.7
$ python3 startup.py -a --lite # 启动轻量版本

注意:配置文件都在 configs 目录下,按需参照 example 配置 py文件,请重点关注:configs/model_config.py 模型配置。

5 参考

部署文档


标签:chatchat,--,模型,Langchain,Chatchat,docker,com
From: https://blog.51cto.com/u_15794627/9068289

相关文章

  • 大模型工具_QUIVR
    https://github.com/StanGirard/quivr/24.5KStar1功能整体功能,想解决什么问题实现了前后端结合的RAG方案。构建能直接使用的应用。提出了“第二大脑”,具体实现也是RAG,但针对不同用户不同场景支持多个“大脑”并存,每个“大脑里”存储一个或多个文件,用户可使用指定的大脑提......
  • 【大语言模型】Transformer原理以及运行机制
    目录参考资料Transformer是一种序列到序列(Sequence-to-Sequence)的模型,用于处理自然语言处理任务。它是由谷歌公司提出的一种基于注意力机制的神经网络模型,被广泛应用于机器翻译、问答系统、文本摘要、对话生成等任务。Transformer模型由编码器和解码器两部分组成。编码器将输入序......
  • 【每日随笔】情绪操控术 ① ( 三层大脑模型 - 爬行脑 / 情绪脑 / 理性脑 | 情绪脑负面
    文章目录一、三层大脑模型1、三层大脑的进化2、三层大脑的分层包裹关系二、情绪脑的负面效果1、情绪脑VS理性脑2、情绪脑功能3、情绪脑负面效果一、三层大脑模型1、三层大脑的进化人的大脑是几亿年来逐步进化出来的,不同的脑区产生的时间是不同的;爬行脑进化了3亿年......
  • 大模型训练中的断点继续训练问题
    在深度学习中,模型训练通常需要大量的时间和计算资源。因此,为了提高训练效率,我们通常会在训练过程中设置断点,以便在训练一段时间后停止训练,然后继续训练之前保存的模型参数。然而,有时候在断点继续训练时,我们会发现损失函数值开始恶化,或者与断点处的值差异较大。这可能是由于一些原因......
  • 高斯混合模型
    高斯混合模型假设有k个簇,每一个簇服从高斯分布,以概率随机选择一个簇k,从其分布中采样出一个样本点,如此得到观测数据其中模型参数为:若样本关联K维的隐含变量为,其对应的随机向量用大写字母Z表示若属于第簇,则采用EM算法求解Е步:基于当前参数值,推断隐含变量的信息(后验概率/期望)......
  • 【积微成著】性能测试调优实战与探索(存储模型优化+调用链路分析)| 京东物流技术团队
    一、前言性能测试之于软件系统,是保障其业务承载能力及稳定性的关键措施。以软件系统的能力建设为主线,系统能力设计工作与性能测试工作,既有先后之顺序,亦有相互之影响。以上,在性能测试的场景决策,架构分析、流量分析、压测实施和剖解调优等主要环节中,引发对于系统能力底盘夯实和测试策......
  • 浏览器文档对象模型是如何生成的
    从网络传给渲染引擎的HTML文件字节流是无法直接被渲染引擎理解的,所以要将其转化为渲染引擎能够理解的内部结构,这个结构就是DOM。DOM提供了对HTML文档结构化的表述。在渲染引擎中,DOM有三个层面的作用。从页面的视角来看,DOM是生成页面的基础数据结构。从JavaScript脚本视角......
  • 10.基于模型的测试方法 Model-based Testing
    Model-basedTesting介绍 Model-basedTestingisanapplicationofmodel-baseddesignfordesigningandoptionallyalsoexecutingartifactstoperformsoftwaretestingorsystemtesting.Modelscanbeusedtorepresentthedesiredbehaviorofasystemu......
  • 模型初始化和激活函数
    简介在深度学习中,由于层的叠加会出现梯度爆炸和梯度消失两种情况,需要我们去解决合理的权重初始化和激活函数......
  • Keras的 Transfer Learning:预训练模型的使用和优化
    1.背景介绍深度学习已经成为处理复杂数据和模式的首选方法。随着数据规模的增加,深度学习模型也在不断增长。然而,这些模型需要大量的数据和计算资源来训练,这可能是一个挑战。在这种情况下,TransferLearning(传输学习)成为了一种有效的解决方案。TransferLearning是一种机器学习方法,......