首页 > 其他分享 >通义千问-VL-Chat-Int4

通义千问-VL-Chat-Int4

时间:2024-08-30 21:56:35浏览次数:15  
标签:tokenizer Qwen VL Int4 Chat model response history

Qwen-VL 是阿里云研发的大规模视觉语言模型(Large Vision Language Model, LVLM)。Qwen-VL 可以以图像、文本、检测框作为输入,并以文本和检测框作为输出。Qwen-VL 系列模型性能强大,具备多语言对话、多图交错对话等能力,并支持中文开放域定位和细粒度图像识别与理解。

安装要求 (Requirements)

  • python 3.8及以上版本
  • pytorch2.0及以上版本
  • 建议使用CUDA 11.4及以上

快速开始 (Quickstart)

pip install optimum
pip install auto-gptq
pip install transformers_stream_generator
Transformers
from modelscope import (
    snapshot_download, AutoModelForCausalLM, AutoTokenizer, GenerationConfig
)
from auto_gptq import AutoGPTQForCausalLM

model_dir = snapshot_download("qwen/Qwen-VL-Chat-Int4", revision='v1.0.0')

import torch
torch.manual_seed(1234)

# Note: The default behavior now has injection attack prevention off.
tokenizer = AutoTokenizer.from_pretrained(model_dir, trust_remote_code=True)

# use cuda device
model = AutoModelForCausalLM.from_pretrained(model_dir, device_map="cuda", trust_remote_code=True,use_safetensors=True).eval()

# 1st dialogue turn
query = tokenizer.from_list_format([
    {'image': 'https://qianwen-res.oss-cn-beijing.aliyuncs.com/Qwen-VL/assets/demo.jpeg'},
    {'text': '这是什么'},
])
response, history = model.chat(tokenizer, query=query, history=None)
print(response)
# 图中是一名年轻女子在沙滩上和她的狗玩耍,狗的品种可能是拉布拉多。她们坐在沙滩上,狗的前腿抬起来,似乎在和人类击掌。两人之间充满了信任和爱。

# 2nd dialogue turn
response, history = model.chat(tokenizer, '输出"狗"的检测框', history=history)
print(response)

image = tokenizer.draw_bbox_on_latest_picture(response, history)
if image:
  image.save('1.jpg')
else:
  print("no box")

标签:tokenizer,Qwen,VL,Int4,Chat,model,response,history
From: https://blog.csdn.net/yimin_tank/article/details/141725060

相关文章

  • Langchain-Chatchat本地部署的解决方案
      大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。授权多项发明专利。对机器学习和......
  • 阿里重磅开源超强AI模型Qwen2-VL:能理解超 20 分钟视频!
    炸裂!阿里巴巴的云计算部门刚刚发布了一款全新的AI模型——Qwen2-VL,而且一口气发布了20亿参数和70亿参数两个版本,还开放了最强720亿参数版本的API!小伙伴们可能要问了,这个Qwen2-VL到底有多厉害?01、Qwen2-VL有多厉害?·看得清,看得懂: Qwen2-VL在各种视觉理解任务上都取......
  • ChatGPT学习之旅 (10) 系统全球化小助手
    LOTO****示波器统计曲线和故障分析pass/fail测试虚拟示波器可以应用在工业自动化检测中,除了常规的检测波形和测量值参数以外,由多个行业客户定制和验证的统计曲线和故障分析(pass/fail)功能也为工业自动化检测带来极大的便利。(一)故障分析(pass/fail)的基础:统计曲线功能在信号检测的......
  • 政务智能新时代:全栈国产化ChatGPT助力高效政务
    全栈国产化的政务办公专用ChatGPT产品,采用软硬一体的全国产技术栈,从芯片、服务器、大模型到最终用户功能,实现全面国产化。ChatGPT作为由OpenAI开发的一种先进的自然语言处理模型,已经在全球范围内广泛应用。凭借其强大的语言理解与生成能力,ChatGPT在各行各业显著提升了工作效......
  • ChatMoney:你的短视频脚本制作利器
    本文由ChatMoney团队出品在当今这个快节奏的数字时代,短视频以其短小精悍、内容丰富的特点迅速崛起,成为大众娱乐和信息传播的重要载体。然而,对于许多创作者而言,如何构思一个引人入胜、富有创意的脚本,往往是他们面临的第一个挑战。近期发下ChatMoneyAI的全能AI知识库系统短视频......
  • 记Spring HTTP Invoker远程调用的使用(二)基于Servlet方式,配置servlet映射url-pattern实
    目录前言一、概念二、代码实现1.服务端实现2.客户端实现前言本篇接上一篇记SpringHTTPInvoker远程调用的使用(一)基于Url映射方式,DispatcherServlet统一处理实现-CSDN博客https://blog.csdn.net/u011529483/article/details/141678510?spm=1001.2014.3001.5501之......
  • 小琳AI课堂:使用ChatGPT API搭建系统(一)
    大家好,这里是小琳AI课堂。今天我们来聊聊提示链的构建,这是一个非常有趣且实用的技术话题。提示链,简单来说,就是一系列逻辑上相互关联的提示,用于指导大型语言模型(如ChatGPTAPI)如何处理复杂交互和任务提示链的构建:学习者将学习如何建立与前面提示交互的提示链,这是实现复杂任......
  • 小琳AI课堂:使用ChatGPT API搭建系统(二)
    ......
  • VL25 输入序列连续的序列检测
    这个题目的意思是输入是单bit脉冲,然后当8个周期的脉冲序列符合给定的参数值则match输出1;因此肯定需要一共8位的寄存器存储总共8个a的输入脉冲此外由于是从左向右匹配,因此每个周期输入的a要从寄存器最低位输入,从右向左移位(temp_a<={temp_a[6:0],a};),这样才是输入满足条件的011100......
  • 虚幻5数字人,UE5如何使用VaRest插件用POST请求连接OpenAI的ChatGPT,保姆级教程
    首先整理下,需要用到的插件或者密钥:1.VaRest插件,Epic商城直接安装(免费)2.OpenAI的密钥,要去OpenAI的官网获取1.安装VaRest插件(免费)打开EPIC商城,在虚幻商城中搜索VaRest点击免费后获取,然后点击安装到引擎 选择对应的UE版本,我这里就选择5.32.新建UE5.3的项目在库中找到U......