首页 > 其他分享 >QWen2.5学习

QWen2.5学习

时间:2024-11-17 19:17:30浏览次数:3  
标签:large language QWen2.5 modelscope ids 学习 text model

配置环境

pip install transformers

记得更新一下:typing_extensions

pip install --upgrade typing_extensions

安装modelscope

modelscope/modelscope: ModelScope: bring the notion of Model-as-a-Service to life.

下载这个仓库的代码上传到服务器解压

推理

新建QWen2_5.py:

from modelscope import AutoModelForCausalLM, AutoTokenizer

model_name = "qwen/Qwen2.5-7B-Instruct"

model = AutoModelForCausalLM.from_pretrained(
    model_name,    
    torch_dtype="auto",    
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "Give me a short introduction to large language model."
messages = [
    {"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},    
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,    
    tokenize=False,    
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,    
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]

运行:

 需要再安装一些东西:

pip install accelerate

pip install jinja2

再运行:

python /root/modelscope-master/QWen2_5.py

2080ti有点慢,大概需要等6分钟:

输出:

输出的结果:

A large language model (LLM) is a type of artificial intelligence (AI) model designed to understand and generate human-like text based on the input it receives. These models are typically trained on vast amounts of text data from the internet, books, articles, and other sources, which allows them to learn patterns, semantics, and nuances in language.

Key characteristics of LLMs include:

1. **Scale**:**: They are usually very large, containing billions or even trillions of parameters, which allows them to capture complex relationships within text.
 2. **Generative Capabilities**:**: LLMs can generate text, answer questions, translate languages, summarize texts, and perform various other natural language processing tasks.
 3. **Context Understanding**.: These models can maintain context over long sequences of text, allowing for more coherent and meaningful responses.
 4. **Fine-Tuning**.: Many LLMs can be fine-tuned on specific tasks or domains to improve their performance on particular applications generation or understanding tasks.

Popular examples of large language models include models like GPT-3, BERT, and T5, which have been used in various applications applications applications scenarios, from customer service chatbots to creative writing assistance.

标签:large,language,QWen2.5,modelscope,ids,学习,text,model
From: https://blog.csdn.net/m0_60857098/article/details/143831011

相关文章

  • JS学习日记(jQuery库)
      前言今天先更新jQuery库的介绍,它是一个用来帮助快速开发的工具介绍jQuery是一个快速,小型且功能丰富的JavaScript库,jQuery设计宗旨是“writeless,domore”,即倡导写更少的代码,做更多的事,它封装JavaScript常用的功能代码,提供一种简便的方式进行使用,大大提高了开发效率,jQ......
  • 学习日记---第4天(0基础 3min 指针快速入门)
    笔记复习1.函数声明11语法:函数返回值类型函数名参数列表作用:告诉编译器在这个地方已经定义了函数,这样编译器可以在这个定义的后面调用函数,即使函数的定义在调用之后(具体的函数定义还是要写的)ps:函数的声明可以有多个,但函数的实现只能有一个示例:利用函数实现连两个数的和......
  • 学习日记---第三天
    今天被头歌上面的python题难住了,一题写了两个半小时,也许是坤坤在发力吧...笔记复习1.利用sizeof确定数据类型的大小,即所占的字节语法:sizeof(变量名)示例:intarr[]={4,2,8,0,5,7,1,3,9};a=sizeof(arr)/sizeof(arr[0]);//sizeof(arr)用于计算整个数组的大小,sizeof(......
  • 学习日记---第2天
    笔记复习1.数组数据是一个集合,里面存放了相同类型的元素定义方法有三种:a.数据类型数组名[数组长度];arr[元素位置]=值;b.数据类型数组名[数组长度]={值1,值2...};c.数据类型数组名[]={值1,值2...}示例://第一种#include<iostream>usingnamespacestd;intmain()......
  • 学期2024-2025-1 学号20241317 《计算机基础与程序设计》第八周学习总结
    学期2024-2025-1学号20241317《计算机基础与程序设计》第八周学习总结作业信息这个作业属于哪个课程<班级的链接>(如2024-2025-1-计算机基础与程序设计)这个作业要求在哪里<作业要求的链接>(如2024-2025-1计算机基础与程序设计第一周作业)这个作业的目标<写上具体......
  • 2024-2025-1 20241403 《计算机基础与程序设计》第八周学习总结
    学期(如2024-2025-1)学号(如:20241403)《计算机基础与程序设计》第八周学习总结作业信息这个作业属于哪个课程<班级的链接>(如2024-2025-1-计算机基础与程序设计)这个作业要求在哪里<作业要求的链接>(如2024-2025-1计算机基础与程序设计第八周作业)这个作业的目标功能......
  • 零基础java学习-预科准备-博客的重要性
    零基础java学习-预科准备-博客的重要性学习准备:博客(英文名blog,正式名称为网络日记)为什么要写博客?(简要:加深印象、总结经验、吸取教训、养成良好习惯收益无穷)1.需要总结和思考,能帮助我们更有效的记忆。2.提升文笔组织能力,进公司可能每周都要写周报,可能会写一些详细的帮助文档,要......
  • Python学习从0到1 day28 Python 高阶技巧 ⑥ Socket服务端开发
    我们终将上岸,阳光万里                        ——24.11.13一、Socketsocket(简称套接字)是进程之间通信一个工具,好比现实生活中的插座,所有的家用电器要想工作都是基于插座进行。进程之间想要进行网络通信需要socket。Socket负责进程之间的网......
  • IMPRINT:通过学习身份保持表示进行生成对象合成
    IMPRINT:通过学习身份保持表示进行生成对象合成生成对象合成作为合成图像编辑的一种有前景的新途径出现了。然而,对象身份保存的要求带来了重大挑战,限制了大多数现有方法的实际使用。作为回应,介绍了IMPRINT,这是一种基于扩散的生成模型,采用两阶段学习框架进行训练,将身份保持学习与......
  • 联邦学习开山之作Communication-Efficient Learning of Deep Networks from Decentral
    1介绍1.1背景越来越多的手机和平板电脑成为许多人的主要计算设备。这些设备上强大的传感器(包括摄像头、麦克风和GPS),加上它们经常被携带的事实,意味着它们可以访问前所未有的大量数据,其中大部分本质上是私人的。根据这些数据学习的模型持有承诺通过支持更智能的应用程序来大大提......