首页 > 其他分享 >LM Studio 本地离线部署大模型

LM Studio 本地离线部署大模型

时间：2024-05-12 15:19:12浏览次数：23

标签：Q4 8B 模型 LM 离线 Meta Studio

安装 LM Studio

官网: https://lmstudio.ai/

下载模型:Meta-Llaa-3-8B-Instruet.Q4_KM.gguf

下载地址: https://cdn-lfs-us-1.huggingface.co/repos/79/f2/79f21025e377180e4ec0e3968bca4612bb9c99fa84e70cb7815186c42a858124/647a2b64cbcdbe670432d0502ebb2592b36dd364d51a9ef7a1387b7a4365781f?response-content-disposition=attachment%3B+filename*%3DUTF-8''Meta-Llama-3-8B-Instruct.Q4_K_M.gguf%3B+filename%3D"Meta-Llama-3-8B-Instruct.Q4_K_M.gguf"%3B&Expires=1715523914&Policy=eyJTdGF0ZW1lbnQiOlt7IkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTcxNTUyMzkxNH19LCJSZXNvdXJjZSI6Imh0dHBzOi8vY2RuLWxmcy11cy0xLmh1Z2dpbmdmYWNlLmNvL3JlcG9zLzc5L2YyLzc5ZjIxMDI1ZTM3NzE4MGU0ZWMwZTM5NjhiY2E0NjEyYmI5Yzk5ZmE4NGU3MGNiNzgxNTE4NmM0MmE4NTgxMjQvNjQ3YTJiNjRjYmNkYmU2NzA0MzJkMDUwMmViYjI1OTJiMzZkZDM2NGQ1MWE5ZWY3YTEzODdiN2E0MzY1NzgxZj9yZXNwb25zZS1jb250ZW50LWRpc3Bvc2l0aW9uPSoifV19&Signature=cboCWba~6WWYBO6sTsNzUgNa5PksqpYGqlWcbdM7uqyb-OossFTOllwSrGwtz0yGpO4X03NvTD5MZwsXUqREhVl03ozknt1iSPCJGgo~Hx6NQ4nIF8SD9rW-Le~0Un1F8BKPA4LG9BAxBLKe0gZCzOYFz1kkKhyyTNfzwGntood~z~Ipqw38e8aIOxKMTeWo41iBqwIePgg5VTLwF5LFvl32vGsvk7WGagqhZlDI1au0-Mfa6fCsTHr0k7oFB9mk5ou~02S1Skz~upeSvfaLLkFAVV-SGeF-8R7PXCPkSHMmGKXQCduvfxOAb3W-PfdqMvtYcZ-AQCOBr2adYTF4kQ__&Key-Pair-Id=KCD77M1F0VK2B

配置

模型默认位置在C:\Users\用户\.cache\lm-studio\models下，需要在该目录下创建Publisher文件夹且在该文件夹中创建Repository,将该模型放入该目录下
在AI Chat菜单上面选择Meta-Llaa-3-8B-Instruet.Q4_KM.gguf模型
输入文本获取返回值即可
如果文本渲染速度太慢，可以使用GPU处理（此处需要根据自己电脑的实际情况调整）

标签：Q4,8B,模型,LM,离线,Meta,Studio
From： https://www.cnblogs.com/jruing/p/18187844

相关文章

KAN: Kolmogorov–Arnold Networks 学术论文全译
KAN:Kolmogorov–ArnoldNetworks学术论文全译来源 https://zhuanlan.zhihu.com/p/696001648 KAN:Kolmogorov–ArnoldNetworks https://arxiv.org/pdf/2404.19756讨论Applicationaspects:WehavepresentedsomepreliminaryevidencesthatKANsaremoreeffective......
Berkeley vLLM：算力减半、吞吐增十倍
BerkeleyvLLM：算力减半、吞吐增十倍来源 https://zhuanlan.zhihu.com/p/697142422 随着大语言模型（LLM）的不断发展，这些模型在很大程度上改变了人类使用AI的方式。然而，实际上为这些模型提供服务仍然存在挑战，即使在昂贵的硬件上也可能慢得惊人。现在这种限制正在被打破。最近，......
日本联合研究团队发布 Fugaku-LLM——证明大型纯 CPU 超算也可用于大模型训练
相关：https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_10139665591063236146"}研究团队表示其充分挖掘了富岳超算的性能，将矩阵乘法的计算速度提高了6倍，通信速度也提升了3倍，证明大型纯CPU超算也可用于大模型训练。Fugaku-LLM模型参数规模......
linux离线安装mysql5.7
准备工作下载安装包：mysql-5.7.38-linux-glibc2.12-x86_64.tar.gz选定目录安装目录：/usr/local，将安装包上传至/usr/local目录下，通过ftp方式传输具体步骤cd/usr/local解压tar-zxvfmysql-5.7.38-linux-glibc2.12-x86_64.tar.gz重命名mvmysql-5.7.38-linux-glibc2.12-x86_......
Agile PLM数据库表结构(Oracle)
刚进公司，任务是接管PLM系统，但是还在给外包团队开发，没有代码。无妨先看业务和数据库，ok，业务看不懂，只能先看数据库，数据库没有数据字典，这个系统没有任何文档产出......练手时发现数据库类型是Oracle，面对百度不成问题，数据字典只能看前端然后去数据库里面一个个找着对应自己整理了，纯折磨......
如何在AlmaLinux服务器中安装 VirtualBox 7.0
https://www.a5idc.net/helpview_1331.html目前由Oracle拥有和维护的OracleVMVirtualBox是世界上最受欢迎的开源虚拟化平台，它使用户能够从底层计算机硬件创建虚拟机。VirtualBox是第2类管理程序，这意味着它安装在现有操作系统（如Windows或Linux）之上，以创建模拟CPU、RAM......
Android Studio简单入门教程
1.建立项目首先点击new——newproject新建项目选择想要创建的Android的模板，建议选择emptyactivity（空模板），然后nextName：给你的项目起一个名字APIlevel：选择Android虚拟机的版本，版本越低运行起来越快剩下的就按默认的就行，点击finish（由于版本不一样，步骤2和步骤3的顺序......
记录一次sqlMap的sql注入测试
1、首先下载sqlMap测试工具 2、此前需要安装python环境执行pythonsqlmap.py-h ，则可以验证sqlmap命令是否生效3、get请求sql注入测试命令pythonsqlmap.py-uhttp://127.0.0.1:2000/data/serverConfigure/getDataByProject?projectId=1630016701175169121--risk=3--le......
linux中离线安装docker
一、linux中离线安装docker1、从官方下载Docker安装包并上传至虚拟机https://download.docker.com/linux/static/stable/x86_64/2.解压安装包tar-xvfdocker-19.03.9.tgz3.将解压出来的docker文件内容移动到/usr/bin/目录下#移动命令复制命令请用cpmvdocker/*/usr......
apisix~helm方式的部署到k8s
什么是apisixApacheAPISIX是一个高性能、轻量级的开源API网关，基于Nginx和OpenResty构建。APISIX提供了丰富的功能和灵活的配置，适用于构建现代的微服务架构和云原生应用。以下是ApacheAPISIX的一些主要特点和功能：动态路由：APISIX支持基于请求路径、方法、头部等条......

赞助商

阅读排行