Baichuan2

2024-11-21Baichuan2 模型详解，附实验代码复现
简介近年来，大规模语言模型（LLM）领域取得了令人瞩目的进展。语言模型的参数规模从早期的数百万（如ELMo、GPT-1），发展到如今的数十亿甚至上万亿（如GPT-3、PaLM和SwitchTransformers）。随着模型规模的增长，LLM的能力显著提升，展现出更接近人类的语言流畅性，并能执行多样化的自然语
2023-11-02baichuan2-13b-chat加速
当前加速框架层出不穷，到底哪个能一统天下未可知，那在当前阶段我们加速大模型该选取哪个框架呢。目前存在的大模型加速框架：VLLM，TGI,FasterTransformer,DeepSpeed-MII,FlexFlowServer,LMDeploy等等等等。但是这些框架大部分支持的模型都很少，或只支持英文模型，支持中文模型的更少，目前
2023-10-07Langchain-Chatchat项目：1.2-Baichuan2项目整体介绍
由百川智能推出的新一代开源大语言模型，采用2.6万亿Tokens的高质量语料训练，在多个权威的中文、英文和多语言的通用、领域benchmark上取得同尺寸最佳的效果，发布包含有7B、13B的Base和经过PPO训练的Chat版本，并提供了Chat版本的4bits量化。一.Baichuan2模型 Baichuan2模型在
2023-09-28玩一玩“baichuan2”，很强的中文开源模型，2060s即可流畅运行！
OpenAIChatGPT出来后，热闹了好一阵子！先是一波大厂闭源PK。然后Meta不按套路出牌，直接放出来开源的Llama1-2 后来就百花齐放了。但是外国的模型默认情况下中文支持都不好。另外很多开源模型，最简单的对话都一塌糊涂。今天来玩一个不错的中文开源模型。先来简
2023-09-21LangChain开发环境准备-AI大模型私有部署的技术指南
LangChain开发环境准备-AI大模型私有部署的技术指南今天开始小智将开启系列AI应用开发课程，主要基于LangChain框架基于实战项目手把手教大家如何将AI这一新时代的基础设施应用到自己开发应用中来。欢迎大家持续关注当下在AI应用开发领域，LangChain框架可以说是唯一选择。然而，上
2023-09-1916G内存+CPU本地部署ChatGLM2/Baichuan2推理（Windows/Mac/Linux）
概述本文使用chatglm.cpp对中文大语言模型（LLM）进行量化与推理，支持ChatGLM2-6B、Baichuan2-13B-Chat等模型在CPU环境16G内存的个人电脑上部署，实现类似ChatGPT的聊天功能。支持的操作系统包括Windows、MacOS、Linux等。其中，量化过程需要临时使用一台内存较大的服务器。4bit量化后