首页 > 其他分享 >最强大的开源模型Llama3.1-部署与使用

最强大的开源模型Llama3.1-部署与使用

时间:2024-09-24 23:47:57浏览次数:3  
标签:session tokenizer Llama3.1 模型 ids st 开源 实例

文章目录

大规模语言模型(LLM)作为深度学习算法训练的自然语言处理工具,正在迅速发展。狭义上,LLM专注于自然语言理解和生成,广义上则涵盖了机器视觉(CV)、多模态大模型和科学计算模型等应用。

1 开源LLM背景

当前,开源LLM的竞争异常激烈,涌现出诸多杰出的模型,包括国外的LLaMA和Alpaca,以及国内的ChatGLM、BaiChuan和InternLM(书生·浦语)等。

这些开源模型的出现使得用户能够在本地部署和私域微调,方便每位开发者基于现有技术构建独特的模型,提升其应用价值。

近期,Meta于2024年7月23日发布了Llama 3.1系列,标志着其开源模型的一个新高峰。

该系列中,Llama 3.1 405B模型以4050亿参数和支持128K Tokens的上下文长度引人注目,是迄今为止Meta最大规模的训练成果,训练过程利用了超过15万亿Tokens和超过1.6万个H100 GPU。

在这里插入图片描述

与其他模型相比,Llama 3.1不仅在规模上实现了突破,同时在性能和灵活性方面也展现了其在多种任务中的潜力。

对于程序员而言,这一系列的发布提供了新的契机,能够在更高效的基础上进行创新和应用开发。

2 部署流程

  1. 创建实例。

    在这里插入图片描述

  2. 进入创建页面后,首先在实例配置中选择付费类型,一般短期需求可以选择按量付费或者包日,长期需求可以选择包月套餐。

    在这里插入图片描述

  3. 选择GPU数量和需求的GPU型号,首次创建实例推荐选择:

    • 按量付费–GPU数量1–NVIDIA-GeForc-RTX-4090,该配置为60GB内存,24GB的显存(本次测试的LLaMA3.1 8B 版本至少需要GPU显存16G)。
    • 配置数据硬盘的大小,每个实例默认附带了50GB的数据硬盘,首次创建可以就选择默认大小50GB。

    在这里插入图片描述

  4. 继续选择安装的镜像,平台提供了一些基础镜像供快速启动,镜像中安装了对应的基础环境和框架,可通过勾选来筛选框架,这里筛选PyTorch,选择PyTorch 2.4.0。

    在这里插入图片描述

  5. 为保证安全登录,创建密钥对,输入自定义的名称,然后选择自动创建并将创建好的私钥保存的自己电脑中并将后缀改为.pem,以便后续本地连接使用。

    在这里插入图片描述

  6. 创建好密钥对后,选择刚刚创建好的密钥对,并点击立即创建,等待一段时间后即可启动成功!

    在这里插入图片描述

3 登录实例

  1. 等待实例创建成功,在 GPU云实例 中查看实例信息。

    在这里插入图片描述

  2. 平台提供了在线访问实例的 JupyterLab 入口,可以直接登录实例:

在这里插入图片描述

  1. 登录后一般会在 /root/workspace 目录下,服务器各个路径具体意义如下:

    1. /:系统盘,替换镜像,重置系统时系统盘数据都会重置。
    2. /root/workspace:数据盘,支持扩容,保存镜像时此处数据不会重置。
    3. /root/shared-storage:共享文件存储,可跨实例存储。
  2. SSH登录:

    SSH只是登录方式,工具可以是系统自带终端、Xshell、MobaXterm等。

    SSH登录一般需要以下 4 个信息:

    • 用户名:root
    • 远程主机域名或IP(这里使用host域名):实例页面获取
    • 端口号:实例页面获取
    • 登录密码或密钥(这里使用密钥):前面创建实例时保存到本地的密钥

    在实例页面获取主机host和端口号:

    在这里插入图片描述

复制结果类似如下:

ssh -p 31729 [email protected]

其中,gpu-s277r6fyqd.ssh.damodel.com 即主机host,31729 为端口号。

终端登录方式详见SSH登录与密钥对

4 部署LLama3.1

  1. 使用 conda 管理环境,DAMODEL示例已经默认安装了 conda 24.5.0 ,直接创建环境即可:
conda create -n llama3 python=3.12

在这里插入图片描述

  1. 环境创建好后,使用如下命令切换到新创建的环境:
conda activate llama3

在这里插入图片描述

  1. 继续安装部署LLama3.1需要的依赖:
pip install langchain==0.1.15
pip install streamlit==1.36.0
pip install transformers==4.44.0
pip install accelerate==0.32.1

在这里插入图片描述

  1. 安装好后,下载 Llama-3.1-8B 模型,平台已预制Llama-3.1-8B-Instruct模型,执行以下命令即可内网高速下载:
wget http://file.s3/damodel-openfile/Llama3/Llama-3.1-8B-Instruct.tar
  1. 下载完成后解压缩/Llama-3.1-8B-Instruct.tar
tar -xf Llama-3.1-8B-Instruct.tar

5 使用教程

  1. 模型下载好后,准备加载模型及启动Web服务等工作,新建 llamaBot.py 文件并在其中输入以下内容:
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import streamlit as st

# 创建一个标题和一个副标题
st.title("

标签:session,tokenizer,Llama3.1,模型,ids,st,开源,实例
From: https://blog.csdn.net/L040821/article/details/142502646

相关文章

  • 开源音频处理项目推荐【持续更新】
    Audacity介绍:Audacity是一款功能强大的开源音频编辑软件,适用于多种操作系统,包括Windows、macOS和Linux。它支持多轨音频编辑、录制,并且提供了丰富的音频处理功能,如剪切、复制、粘贴、混音、降噪等。Audacity的最新版本是3.6版本,于2024年7月16日发布,带来了主通道、新效果、......
  • GitHub上图像超分开源项目推荐【持续更新】
    SRCNN介绍:SRCNN(Super-ResolutionConvolutionalNeuralNetwork)是一种用于图像超分辨率的卷积神经网络。它由Dong等人在2014年提出,是早期的深度学习方法之一,用于提高图像的分辨率。SRCNN通过学习低分辨率(LR)图像到高分辨率(HR)图像的映射关系,来重建高分辨率图像。GitHub星数:2......
  • 项目实战:Qt+OSG爆破动力学仿真三维引擎测试工具v1.1.0(加载.K模型,子弹轨迹模拟动画,支持
    需求  1.使用osg三维引擎进行动力学模型仿真性能测试;  2.打开动力学仿真模型文件,.k后缀的模型文件,测试加载解析过程;  3.解决第三方company的opengl制作的三维引擎,绘制面较多与弹丸路径模拟较卡顿的问题;  4.测试时,使用的模型为公开模型,基础面数量达到160多万个;  5.测......
  • 程序员转行挑战重重:为何考虑转向大模型领域?
    尽管我在“[大龄程序员的未来在何方]”这篇文章里比较乐观地介绍了程序员保持竞争力的几个方向,但现实依然是残酷的:很多人将不得不离开软件开发工作,转型去从事其他职业。当你要这么做时,就会感慨:想不到一切竟如此艰难!你不禁会想起李白老先生的诗:噫吁嚱,危乎高哉!蜀道之难,难于上......
  • 想转行AI大模型开发工程师?这本书是你的必读指南!!!《AI大模型开发之路》
     当前最热门的技术无疑是AI大模型。虽然它的应用前景广阔,但真正精通大模型技术的人还不多。然而,市场对大模型的需求却在不断增长,吸引了不少开发者想要转行进入这个领域。然而,面对新技术,许多人心中充满疑虑,担心自己无法掌握。笔者也是充满疑虑,然后直到我看到这本书籍,感觉受益匪......
  • Python实现Phong着色模型算法
    目录使用Python实现Phong着色模型算法引言Phong着色模型的基本原理1.模型组成2.公式Phong着色模型的Python实现1.向量类的实现2.光源类的实现3.材质类的实现4.Phong着色器类的实现整体实现总结使用Python实现Phong着色模型算法引言在计算机图形学中,光照和......
  • 聆思CSK6大模型开发板上手参考
    前面发了一些大模型语音交互+智能硬件相关的技术文章,这篇给大家介绍一下大模型语音交互示例的硬件和上手概况。硬件概况聆思CSK6大模型开发板长宽尺寸是99.1x72.1mm,集成了摄像头、麦克风、扬声器、屏幕、无线模块、TF卡等,可以直接用于大模型语音交互和视觉识别的功能开发验证。套......
  • 多校园信息付费发布顶置自定义表单小程序开源版开发
    多校园信息付费发布顶置自定义表单小程序开源版开发为校园管理和互动提供了强大的支持,包括用户端和运营后台两大部分。用户端允许学生和教职工方便地访问各种功能模块,而运营后台则使管理员能够高效地管理和配置系统。产品支持自定义模块和表单,允许根据需求创建各种功能,例如表白墙、......
  • 1panle搭建的maxkb增加本地向量模型
    首先下载模型,比如m3e-large,并上传到/opt/maxkb/model/local_embedding/目录,没有就创建目录如下:然后修改1panel的容器信息,点击右边的编辑:在下方的挂在目录处点击添加:在两个框都输入:/opt/maxkb/model/local_embedding然后,确认保存,再重启容器重启成功后,登录maxkb,新建一个......
  • 论文速递!Knowledge-driven+Informer! 联合知识和数据驱动的混合模型,用于NOx排放浓度预
    论文标题:PredictionofNOxemissionconcentrationfromcoal-firedpowerplantbasedonjointknowledgeanddatadriven期刊信息:Energy(中科院1区,JCRQ1TOP,IF=9)引用:WuZ,ZhangY,DongZ.PredictionofNOxemissionconcentrationfromcoal-firedpowerplantbas......