本地运行大模型，需要什么样的配置？

时间：2024-04-08 09:31:22浏览次数：26

标签：显存 Lmstudio 32G 模型什么样内存本地

本地运行大模型有多爽？只有用过了才知道。

那是一种顺畅、自由的感觉。

比如使用那些主流大模型，最常见的就是网络问题，如 IP 受限，或者服务器压力过大导致的延迟等等。

使用本地大模型，真的是像和人自然交谈那么顺畅。

而且，再也不用心疼 token 的费用了。

使用 API 调用大模型时，有没有坐出租车时看计价器的感觉？数字一直在网上蹦。

虽然钱并不多，但那种被羁绊的感觉并不好。

使用本地模型就可以放飞了，例如我会频繁的使用本地模型进行大篇幅的翻译。

那么，本地模型需要什么配置呢？

可以按照使用场景来分。

1）绘图

最低要求 16G 内存，4G 显存。

建议 32G 内存，12G 显存。

2）生成音频

至少 8G 显存。

3）生成文字

至少 8G 内存，4G 显存。

但这个级别的模型的聊天效果不怎么样。

我的机器是 32G内存 + 16G显存，跑 gemma-7b 效果不错。

如果是 32G 内存 24G 显存，那就相当完美了。

总的来说，入门配置怎么也要 3060显卡 + 16G内存，最理想的是 4090 + 32G内存。

在本地跑大模型的话，推荐使用 Lmstudio。

网址：

lmstudio.ai

Lmstudio 集成了本地运行大模型的主要功能。

可以搜索、下载大模型，然后运行和对话。

还有 API server 服务，提供了兼容 OpenAI 规范的接口。

在下载模型时，Lmstudio 还会根据你的机器配置给出建议。

如果运行不了，会提示你。

不错吧，快去试试吧。

#AI 人工智能，#本地部署大模型，#gpt890

信息来源 gpt890.com/article/42

标签：显存,Lmstudio,32G,模型,什么样,内存,本地
From： https://blog.csdn.net/TechAI/article/details/137492590

从模型到部署，教你如何用Python构建机器学习API服务
本文分享自华为云社区《Python构建机器学习API服务从模型到部署的完整指南》，作者：柠檬味拥抱。在当今数据驱动的世界中，机器学习模型在解决各种问题中扮演着重要角色。然而，将这些模型应用到实际问题中并与其他系统集成，往往需要构建API服务。本文将介绍如何使用Python构建机器学习......
Ascend C编程模型与范式
并行计算架构抽象指令流、信号流、数据流的基本概念指令流：指令流是指在计算过程中，指令的执行顺序。在并行计算架构中，如何安排指令流以最大化并行度和资源利用率是一个关键的设计问题。信号流：信号流涉及到的是在硬件电路中，信号（数据、控制信号等）如何在不同的组件和模块之间......
Django框架之模型层
一、前期准备1、测试脚本当你只是想要测试Django中的某一个py文件内容，那么你可以不用书写前后端交互的形式，而是直接写一个测试脚本即可这内容其实就是最外部manage.py文件中的上面几句话脚本代码无论是写在应用下的tests.py文件还是自己新建文件，将内容写在新文件中，都会生效......
树模型系列——2、决策树生成算法
1ID3算法ID——IterativeDichotomiser(迭代二分器)从根结点(rootnode)开始，对结点计算所有可能的特征的信息增益，选择信息增益最大的特征作为结点的特征，由该特征的不同取值建立子结点；在对子结点递归地调用以上方法，构建决策树；直到所有特征的信息增益均很小或没有特征可以选择为......
【论文、项目：人工智能系列】10YOLO模型优化思路
模型优化方法模型压缩：包括模型权重量化、模型权重稀疏和模型通道剪枝等方法。优化推理引擎：如TVM、tensorRT和OpenVINO等，用于优化模型的推理速度。数据预处理：包括归一化、标准化等，有助于提高模型的泛化能力。模型设计：涉及模型的架构、损失函数、优化器等，合理的模型设计可以......
开源模型应用落地-chatglm3-6b模型小试-入门篇（二）
一、前言刚开始接触AI时，您可能会感到困惑，因为面对众多开源模型的选择，不知道应该选择哪个模型，也不知道如何调用最基本的模型。但是不用担心，我将陪伴您一起逐步入门，解决这些问题。在信息时代，我们可以轻松地通过互联网获取大量的理论知识和概念。然而，仅仅......
软件测试最新模型
软件测试领域随着技术的发展不断演进，新的测试模型和方法不断涌现，以适应不断变化的软件开发需求和提高测试效率。以下是一些最新的软件测试模型：###1.V模型 V模型是瀑布模型的变种，它将测试活动与开发阶段紧密对应。左侧代表开发过程，从需求分析到系统设计、详细设计、编码；右......
Python随机波动性SV模型：贝叶斯推断马尔可夫链蒙特卡洛MCMC分析英镑/美元汇率时间序列
全文链接：https://tecdat.cn/?p=33885原文出处：拓端数据部落公众号本文描述了帮助客户使用马尔可夫链蒙特卡洛（MCMC）方法通过贝叶斯方法估计基本的单变量随机波动模型，就像Kim等人（1998年）所做的那样。定义模型以及从条件后验中抽取样本的函数的代码也在Python脚本中提供。 ......
将libc database下载到本地
将libcdatabase下载到本地这个是libc-database的网站，可以在线查找libc。libc-database 本文对自己下载使用libcdatabase做一个记录，详情请查看libcdatabase的官方文档：https://github.com/niklasb/libc-database下载这个无需安装，从官方的github下载zip，放到liunx......
评估链判定正确答案和模型答案是否一致
fromlangchain.chainsimportRetrievalQAfromlangchain.evaluationimportQAEvalChainfromlangchain_community.document_loadersimportTextLoaderfromlangchain_community.embeddingsimportOllamaEmbeddingsfromlangchain_community.llms.ollamaimportOllam......

本地运行大模型，需要什么样的配置？

相关文章

赞助商

阅读排行