首页 > 其他分享 >丹摩征文活动|Llama3.1-部署与使用

丹摩征文活动|Llama3.1-部署与使用

时间:2024-11-12 19:16:21浏览次数:3  
标签:丹摩 tokenizer 征文活动 ids st state session Llama3.1 model

Llama3.1-部署与使用

丹摩平台,作为一个集成了先进云计算、大数据处理及人工智能技术的综合服务平台,为Llama3.1的部署与使用提供了得天独厚的环境。它不仅简化了复杂的技术配置流程,降低了AI应用的门槛,还通过其强大的数据处理能力,为Llama3.1的训练、推理及优化提供了强有力的支持。

在这里插入图片描述

本文将会帮助大家在丹摩平台上顺利部署并使用Llama3.1。从环境准备、模型下载、配置调整,到实际应用的开发与部署


Llama3.1

Llama 3.1系列包括80亿(8B)、700亿(70B)、4050亿(405B)参数版本。其中,405B版本的Llama 3.1是一个具有4050亿个参数和高达128000个标记的上下文窗口的密集型Transformer,是近年来规模最大的LLM(大型语言模型)之一,也是首个“前沿级别开源AI模型”。

Meta在超过150个基准数据集上对Llama 3.1进行了性能评估,涵盖多种语言,并进行了广泛的人类评估。实验结果表明,Llama 3.1 405B在各项任务中完全可与最先进闭源模型竞争,包括GPT-4、GPT-4 Turbo和Claude 3.5 Sonnet。特别是在GSM8K数学、IFEval指令遵循、多语言处理、长上下文、ARC推理、Nexus工具调用等多项测试中表现优异,甚至在某些测试中超越了这些闭源模型。

在这里插入图片描述
由于资源限制,我们此次选择部署 Llama3.1 的 8B 版本,该版本至少需要GPU显存16G。

本次测试环境:

ubuntu 22.04 python 3.12 cuda 12.1 pytorch 2.4.0

创建实例

进入控制台-GPU云实例,点击创建实例:
在这里插入图片描述

选择配置:按量付费–GPU数量1–NVIDIA-GeForc-RTX-4090,该配置为124GB内存,24GB的显存(本次测试的LLaMA3.1 8B 版本至少需要GPU显存16G),建议扩容至150GB(多多益善)

在这里插入图片描述

为保证安全登录,创建密钥对,输入自定义的名称,然后选择自动创建并将创建好的私钥保存的自己电脑中并将后缀改为.pem,以便后续本地连接使用。
在这里插入图片描述

登录实例

平台提供了在线访问实例的 JupyterLab 入口,可以直接登录实例:

在这里插入图片描述
JupyterLab 界面:

在这里插入图片描述

  • 登录后一般会在 /root/workspace 目录下,服务器各个路径具体意义如下:
  • /:系统盘,替换镜像,重置系统时系统盘数据都会重置。
  • /root/workspace:数据盘,支持扩容,保存镜像时此处数据不会重置。

部署LLama3.1

我们使用 conda 管理环境,DAMODEL示例已经默认安装了 conda 24.5.0 ,直接创建环境即可:

conda create -n llama3 python=3.12

环境创建好后,使用如下命令切换到新创建的环境:

conda activate llama3

安装依赖:

pip install langchain==0.1.15
pip install streamlit==1.36.0
pip install transformers==4.44.0
pip install accelerate==0.32.1

正在下载ing
在这里插入图片描述

下载 Llama-3.1-8B 模型:

wget http://file.s3/damodel-openfile/Llama3/Llama-3.1-8B-Instruct.tar

下载完成后解压缩/Llama-3.1-8B-Instruct.tar

tar -xf Llama-3.1-8B-Instruct.tar

使用实践

新建 llamaBot.py 文件并在其中输入以下内容:

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
import streamlit as st

# 创建一个标题和一个副标题
st.title("

标签:丹摩,tokenizer,征文活动,ids,st,state,session,Llama3.1,model
From: https://blog.csdn.net/tl2806697860/article/details/143721477

相关文章

  • 记录一下 Win11 下自编译 Ollama 本地运行 llama3.1
    运行环境Windows11(显卡AMDRadeonRX6650XT)VSCode(用于查找特定代码,在gfx1030附近添加gfx1032)GitGo版本$goversiongoversiongo1.23.3windows/amd64MinGW(编译需要make命令)$make-vGNUMake4.4.1Builtforx86_64-w64-mingw32Copyright(......
  • 丹摩智算(damodel)部署stable diffusion实验
    名词解释:丹摩智算(damodel):是一款带有RTX4090,Tesla-P40等显卡的公有云服务器。stablediffusion:是一个大模型,可支持文生图,图生图,文生视频等功能一.实验目标注册丹摩智算(damodel)账户,创建带有显卡(Tesla-P40)的公有云服务器,系统为:ubuntu22.04_tensorflow2.1,通过ssh协议连接到公......
  • 丹摩智算:ChatGLM-6B模型的部署与使用指南
    文章目录......
  • DAMODEL丹摩智算平台实践CogVideoX
    文章目录前言一、平台账号注册并登录二、部署CogVideoX(一)简介(二)部署1.创建实例2.配置环境和依赖3.预制模型与配置文件三、开始运行总结前言该文章主要记录DAMODEL丹摩智算平台实践过程与心得体会,本次实践的内容为CogVideoX-2b-部署与使用;DAMODEL平台地址为:丹......
  • 最强大的开源模型Llama3.1-部署与使用
    文章目录1开源LLM背景2部署流程3登录实例4部署LLama3.15使用教程大规模语言模型(LLM)作为深度学习算法训练的自然语言处理工具,正在迅速发展。狭义上,LLM专注于自然语言理解和生成,广义上则涵盖了机器视觉(CV)、多模态大模型和科学计算模型等应用。1开源LLM背景当......
  • 丹摩DAMODEL超算平台 | 搭建Llama3.1深入体验
    丹摩DAMODEL超算平台|搭建Llama3.1深入体验文章目录丹摩DAMODEL超算平台|搭建Llama3.1深入体验丹摩超算平台Llama3.1-部署与使用本地连接使用DAMODEL方法使用体验与总结DAMODEL丹摩超算平台专为AI打造的智算云平台,致力于提供丰富的算力资源与基础设施,以助力......
  • 谢谢微软,又又又Open了!一口气发布3款Phi-3.5新模型,领先Llama3.1和谷歌同级模型
    前言家人们!微软又用爱发电了!一觉醒来,微软发布了最新的小模型三兄弟:Phi-3.5-MoE-instructPhi-3.5-mini-instructPhi-3.5-vision-instruct三兄弟的表现可以说是相当的不错,其中,Phi-3.5-MoE在基准测试中击败了Llama3.18B、Mistral-Nemo-12B,Gemini1.5Flash。在推理能力方面它也优......
  • 不会大模型不要紧!只需5分钟!你也可以微调大模型!如何快速微调Llama3.1-8B
    AI浪潮席卷全球并发展至今已有近2年的时间了,大模型技术作为AI发展的底座和基石,更是作为AI从业者必须掌握的技能。但是作为非技术人员,相信大家也有一颗想要训练或微调一个大模型的心,但是苦于技术门槛太高,无从下手。今天教大家一个非常快速的方法,5分钟就可以让你快速上手去微......
  • 开源最强Llama3.1 部署本地知识库应用
    一.环境介绍高性能应用服务HAI拥有丰富的预装应用,可以将开源社区的前沿模型快速转化为您专有的部署实践,一键拉起,即开即用。现已支持在HAI购买页的社区应用中,找到Llama3.1等应用的入口,简单选型后,即可一键启动推理服务。Chatchat项目介绍该项目利用langchain思想,实现......
  • ollama安装和运行llama3.1 8b
    ollama安装和运行llama3.18bcondacreate-nollamapython=3.11-ycondaactivateollamacurl-fsSLhttps://ollama.com/install.sh|shollamarunsongfy/llama3.1:8b就这么简单就能运行起来了.我们可以在命令行中与他交互.当然我们也可以用接口访问:curlhttp:/......