首页 > 其他分享 >非常可靠,手把手教你本地部署AI大模型-llama3:70b

非常可靠,手把手教你本地部署AI大模型-llama3:70b

时间:2024-06-06 22:01:31浏览次数:26  
标签:AI open 模型 llama3 学习 webui ollama 70b

Meta公司一直致力于这样一个理念:“ that open source not only provides great technology for developers, but also brings the best out in people”,翻译过来就是开源不仅为开发人员提供了出色的技术,而且还将给人们带来更好的。但是前几天李彦宏说开源模型没有未来?我们的红衣大叔安全专家周总也提倡大家开源。

所以,到底开源好还是闭源好呢?

今天通过一个大模型案例来简单思考下这个问题。

下面主要介绍如何在本地部署llama3大模型,本次介绍拥有80亿参数的llama3:8B版本的部署。

大模型排名情况

简单介绍llama3大模型

Llama 3是Meta 公司开发的Llama系列模型的第三个版本,本次提供 8B 和 70B 参数大小的版本。Llama3拥有改进的推理能力。

llama3大模型的版本

模型版本参数大小模型大小发布时间
llama3:70b700亿40GB2024-4-18
llama3:8b80亿4.7GB2024-4-18

预告了正在训练中的400B+模型,性能追赶GPT4

指令微调模型

预训练模型

开始部署

技术栈组成

  • 系统:linux系统(内存16GB 、CPU4C、 存储100GB、 无显卡)

  • 大模型运行框架:ollama

  • 使用模型:llama3:8b

  • web项目:open-webui

[本次使用8b模型,节省下载时间,如需使用其他模型,方法步骤相同,切换下载的模型即可]

第一步:安装ollama

  1. linux上安装很简单,官网:https://ollama.com/
curl -fsSL https://ollama.com/install.sh | sh   
  1. 修改ollama服务启动脚本
vim /etc/systemd/system/ollama.service   ...   [Service]   #增加,(不修改,后续如果其他主机调用api接口会报无法连接错)   Environment="OLLAMA_HOST=0.0.0.0:11434"   ...   
  1. 启动ollama服务
systemctl daemon-reload   systemctl restart ollama   
  1. 测试ollama接口是否可以访问

直接浏览器访问http://服务器ip:11434,如返回 ollama in runninng,表示正常,可以继续下面的步骤

第二步:模型管理—下载模型llama3:8b

  • 安装好ollama后直接使用ollama下载运行llama3:8b即可(如需下载其他模型,使用此方法即可,建议多尝试几个模型比如gemma、qwen等)
ollama run llama3:8b   

第三步:部署open-webui

本次介绍使用open-webui来接入大模型,如有其他web项目,也可以使用,保持ollama接口一致即可

  1. 使用docker部署open-webui,需要补充docker基础知识的朋友可以参考安装docker教程
docker run -d --network=host -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:main      #如果镜像拉取速度慢,可以使用下面的镜像   docker run -d --network=host -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always registry.cn-hangzhou.aliyuncs.com/pzl_images/open-webui:main   
  1. 部署完,访问http://ip:8080

  2. 注册管理员账号(注意,注册的第一个账号为管理员账号,后面注册的账号均无管理权限,且需管理员同意注册)


4. 管理员设置—需要在管理员设置中,修改默认用户角色为“用户”,不然新注册用户无法直接登录使用,需要管理员面板中分配角色才能使用

  1. 选则对话模型

第四步:开始使用AI

  • 普通用户界面

  • 管理员界面

注意,如果你的ollama上跑了多个模型,需要在使用前切换模型

到这里,就介绍完了,如何使用Ollama部署AI大模型,就是这么简单

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

标签:AI,open,模型,llama3,学习,webui,ollama,70b
From: https://blog.csdn.net/lvaolan8888/article/details/139510462

相关文章

  • 使用 Unity Sentis 实现AI换脸
    前言使用UnitySentis和ComputeShader,det_10g.onnx进行高效人脸五官定位-CSDN博客需要用到该篇文章中的五个关键点信息进行人脸对齐。模型分析实现ai换脸的核心模型是inswapper_128.onnx;它的输入值有两个target和source,target是目标面部图片尺寸为(128*128*3),source是......
  • 基于Python的实验室管理系统的设计与实现(论文+源码)_kaic
    摘 要随着实验室设备越来越多,实验室及其设备管理工作变得越来越繁重,还存在些管理模式仍旧处于手工管理模式和一些抢占实验室的不文明现象,传统的手工模式已经满足不了日益增长的管理需求,而本系统摒弃传统模式,开启新式的实验室管理模式。在需求进行分析的基础上,采用Python语言......
  • 基于Python的街区医院管理系统的设计与实现(论文+源码)_kaic
    基于Python的街区医院管理系统的设计与实现摘 要采用Python语言、Mysql数据库,在IDEA平台下实现了街区医院管理系统,利用街道医疗机构的管理系统,不仅能够有效地进行信息管理,促进各部门之间的有序合作,还能够大幅改善医疗环境,极大地改善病人的就诊体验,并且能够更加有效地满......
  • BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and
    Motivation&Abs端到端大规模视觉语言预训练的开销极大。为此,本文提出了BLIP2,利用现成的冻住的imageencoder以及LLM引导视觉语言预训练。模态差距:通过两阶段训练的轻量级的QueryTransformer(Q-Former)弥补。第一阶段:从冻结的imageencoder引导VL学习;第二阶段:从冻结的LLM引导视......
  • autotrain学习-环境搭建、模型和数据集下载、训练全过程
    autotrain学习-环境搭建、模型和数据集下载、训练全过程1.参考链接2.创建容器3.安装autotrain4.解决没有真实权值的问题(不下载真实的权值)5.下载SFT微调数据集6.下载opt-125m模型(忽略权值文件)7.下载后的目录结构8.SFT训练A.生成配置文件(使用之前下载好的模型和数据集......
  • ChatGPT Prompt技术全攻略-入门篇:AI提示工程基础
    系列篇章......
  • AI全自动批量剪辑软件,一天剪辑3000条原创视频不是梦【剪辑软件+全套教程】
    创建一个AI全自动批量剪辑软件的简易程序涉及较为复杂的视频处理和机器学习技术,而且由于这是一个相当高级的任务,通常需要大量的代码以及深度学习框架支持。不过,我可以为您提供一个非常基础版本的程序示例,它会用Python的moviepy库批量剪辑一组视频,每个视频裁剪前10秒作为示例......
  • 利用智普AI大模型进行基于 RAG 的表格数据问答
    前言最近一直在探索RAG相关的技术,刚好尝试了一些国产的大模型,发现智普的大模型用着还挺不错的,因此就尝试用它对表格数据进行问答。遇到的问题智普的SDK更新到了2.0的版本,这也就导致原来Langchain的版本无法适配了,需要重新自己写一些代码才可以。另外,Langchain提供的cr......
  • 程序员为什么要学习AI大模型?
    前言在科技浪潮的推动下,人工智能(AI)技术已经成为推动软件行业发展的核心动力。而在AI技术的众多分支中,AI大模型以其巨大的潜力和广泛的应用场景,逐渐成为了程序员们关注的焦点。本文将从程序员的角度出发,探讨AI大模型的定义、应用,以及为何程序员需要深入了解大模型的相关知识......
  • 解锁高效PPT制作新时代——AI+PPT的小报童隆重登场!
    在这里插入图片描述解锁高效PPT制作新时代——AI+PPT的小报童隆重登场!在当今快节奏的工作环境中,高效和专业是成功的关键。而PPT作为职场中的重要工具,往往需要我们花费大量时间去制作和优化。有没有一种方法能够让PPT制作变得更加简单和高效呢?答案是肯定的!今天,我向大家介绍......