【基础岛·第2关】8G 显存玩转书生大模型 Demo

时间：2024-09-25 16:01:42浏览次数：7

标签：显存 name Demo 8G text demo input model root

创建开发机
环境配置
Cli Demo 部署 InternLM2-Chat-1.8B 模型

创建开发机

我们选择 10% 的开发机，镜像选择为 Cuda-12.2。在输入开发机名称后，点击创建开发机

环境配置

在 /root/share/pre_envs 中配置好了预置环境 icamp3_demo
可以通过如下指令进行激活：

conda activate /root/share/pre_envs/icamp3_demo

Cli Demo 部署 InternLM2-Chat-1.8B 模型

首先，我们创建一个目录，用于存放我们的代码。并创建一个 cli_demo.py。

mkdir -p /root/demo
touch /root/demo/cli_demo.py

然后，我们将下面的代码复制到 cli_demo.py 中。

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM


model_name_or_path = "/root/share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b"

tokenizer = AutoTokenizer.from_pretrained(model_name_or_path, trust_remote_code=True, device_map='cuda:0')
model = AutoModelForCausalLM.from_pretrained(model_name_or_path, trust_remote_code=True, torch_dtype=torch.bfloat16, device_map='cuda:0')
model = model.eval()

system_prompt = """You are an AI assistant whose name is InternLM (书生·浦语).
- InternLM (书生·浦语) is a conversational language model that is developed by Shanghai AI Laboratory (上海人工智能实验室). It is designed to be helpful, honest, and harmless.
- InternLM (书生·浦语) can understand and communicate fluently in the language chosen by the user such as English and 中文.
"""

messages = [(system_prompt, '')]

print("=============Welcome to InternLM chatbot, type 'exit' to exit.=============")

while True:
    input_text = input("\nUser  >>> ")
    input_text = input_text.replace(' ', '')
    if input_text == "exit":
        break

    length = 0
    for response, _ in model.stream_chat(tokenizer, input_text, messages):
        if response is not None:
            print(response[length:], flush=True, end="")
            length = len(response)

运行代码，询问了一个关于24节气的问题

标签：显存,name,Demo,8G,text,demo,input,model,root
From： https://www.cnblogs.com/jchen2022/p/18431509

【ComfyUI工作流】神级AI文生图Flux.1本地一键部署整合包，6G显存NSFW版本
FLUX.1是由BlackForestLabs精心研发的AI图像生成模型，其强大的文本到图像的转换能力，让梦想变得触手可及。然而，FLUX.1模型对硬件的要求极为苛刻，尤其是显存需求高达42GB，这使得大多数普通用户难以直接运行该模型。为了解决这一难题，开发者们推出了FLUX.1GGUF版本。GGUF（GPT-Generated......
CS创世8GB SD NAND的低功耗特性
在电子设备不断追求低功耗的今天，CS创世半导体的8GBSDNAND芯片以其低功耗特性脱颖而出。这款芯片的读写电流仅为15mA，相较于同类产品，其功耗显著降低，这不仅延长了设备的使用时间，还减少了对电池的依赖。这种低功耗特性特别适合用于那些需要长时间运行且对电池寿命有严格要......
腾讯混元文生图开源模型推出小显存版本，仅需6G显存即可运行
腾讯混元文生图开源模型推出小显存版本，仅需6G显存即可运行7月4日，腾讯混元文生图大模型（混元DiT）宣布开源小显存版本，仅需6G显存即可运行，对使用个人电脑本地部署的开发者十分友好，该版本与LoRA、ControlNet等插件，都已适配至Diffusers库；并新增对Kohya图形化界面的支持，让开发者可......
ContinueLabelDemo
packagecom.shrimpking.t2;/***CreatedbyIntelliJIDEA.**@Author:Shrimpking*@create2024/9/1515:34*/publicclassContinueLabelDemo{publicstaticvoidmain(String[]args){for(inti=0;i<2;i++){......
ContinueDemo
packagecom.shrimpking.t2;/***CreatedbyIntelliJIDEA.**@Author:Shrimpking*@create2024/9/1515:32*/publicclassContinueDemo{publicstaticvoidmain(String[]args){for(inti=0;i<10;i++){......
BreakLabelDemo
packagecom.shrimpking.t2;/***CreatedbyIntelliJIDEA.**@Author:Shrimpking*@create2024/9/1515:27*/publicclassBreakLabelDemo{publicstaticvoidmain(String[]args){for(inti=0;i<2;i++){......
题解：CF888G Xor-MST
题解：CF888GXor-MST题目大意：给定\(n\)个点的点权,任意两点间边权是点权的异或和。求这张完全图的MST的权值。思路：Boruvka+Trie树+按位贪心。关键就在于如何求出Boruvka中的best数组。考虑对点权建trie树，对于节点\(i\)本轮的连边，就是找“和它最相似”的那......
ThisCompareDemo
packagecom.shrimpking.t4;/***CreatedbyIntelliJIDEA.**@Author:Shrimpking*@create2024/9/1520:24*/classPerson4{Stringname;intage;Person4(Stringname,intage){this.name=name;this.age=age;}......
NoStaticDemo
packagecom.shrimpking.t5;importjava.sql.SQLOutput;/***CreatedbyIntelliJIDEA.**@Author:Shrimpking*@create2024/9/1520:39*/classPerson{Stringname;Stringnation;intage;publicPerson(Stringname,Stringnation,......
基于IDF的ESP32S3-LVGL DEMO移植
简介ESP32-32出色的性价比，较好的性能与内存空间，可以好利用来完成GUI显示库的加载LVGLLVGL是一款比较流行的致力于MCU与MPU创建漂亮UI的嵌入式图形库，免费且开源。硬件硬件采用的是正点原子的ESP32-S3屏幕使用的是SPI通信方式，配合IO口控制（RST,A0），来实现LCD屏幕的驱动移植步骤......

【基础岛·第2关】8G 显存玩转书生大模型 Demo

创建开发机

环境配置

Cli Demo 部署 InternLM2-Chat-1.8B 模型

相关文章

赞助商

阅读排行