Qwen2-VL环境搭建&推理测试

时间：2024-09-18 14:35:34浏览次数：11

标签：inputs Qwen2 VL ids Qwen pixels 搭建

引子

2024年8月30号，阿里推出Qwen2-VL，开源了2B/7B模型，处理任意分辨率图像无需分割成块。之前写了一篇Qwen-VL的博客，感兴趣的童鞋请移步（Qwen-VL环境搭建&推理测试-CSDN博客），这么小的模型，显然我的机器是跑的起来的，OK，那就让我们开始吧。

一、模型介绍

Qwen2-VL 的一项关键架构改进是实现了动态分辨率支持（Naive Dynamic Resolution support）。与上一代模型 Qwen-VL 不同，Qwen2-VL 可以处理任意分辨率的图像，而无需将其分割成块，从而确保模型输入与图像固有信息之间的一致性。这种方法更接近地模仿人类的视觉感知，使模型能够处理任何清晰度或大小的图像。另一个关键架构增强是 Multimodal Rotary Position Embedding（M-ROPE）。通过将 original rotary embedding 分解为代表时间和空间（高度和宽度）信息的三个部分，M-ROPE 使 LLM 能够同时捕获和集成 1D 文本、2D 视觉和 3D 视频位置信息。这使 LLM 能够充当多模态处理器和推理器。

二、环境搭建

1、模型下载

https://huggingface.co/Qwen/Qwen2-VL-7B-Instruct

2、环境安装

docker run -it --rm --gpus=all -v /datas/work/zzq:/workspace pytorch/pytorch:2.4.0-cuda12.4-cudnn9-devel bash

git clone inputs,Qwen2,VL,ids,Qwen,pixels,搭建
From： https://www.cnblogs.com/nick-algorithmer/p/18418457

推荐一款开源的API开放平台，5分钟就可以搭建企业专属的API开放门户！
前言在过去的十年中，企业API治理并未受到广泛关注。然而，随着时间的推进，特别是在近几年，企业技术管理者对API治理的重视程度显著提高，开始将API视为企业资产的重要组成部分。API不再仅仅是技术层面的概念，而是成为了企业内部数据和服务传输的核心，深入融入业务流程之中。由于其全球性和......
如何搭建Github图床（CDN加速）
一、PicGoPicGo是一个用于快速上传图片并获取图片URL链接的工具PicGo原生支持七牛云腾讯云Github又拍云SM.MS阿里云OSSImgur等图床。官网地址：PicGoGithubRelease安装PicGo-Setup.exe二、获取Githubtoken首先需要创建一个Github仓库，选定为Public。获取Ac......
数仓项目环境搭建
目录一、安装CentOS1.1、修改映射关系:1.2、免密登录:1.3、关闭防⽕墙:1.4、修改linux的安全机制:1.5、修改yum源:二、安装JDK2.1、创建文件夹:2.2、解压安装:2.3、配置环境变量:2.4、刷新环境变量:2.5、验证:三、安装Hadoop[伪分布式]3.1、安装hdfs:3.2、修改......
HTML页面中搭建WebSocket服务和调试部署的手把手操作教程
好的，以下是一份关于“在HTML页面中搭建WebSocket服务和调试部署”的手把手操作流程，由浅入深，先整体后分部：一、引言WebSocket是一种在单个TCP连接上进行全双工通信的协议。它允许服务器主动发送信息给客户端，使得实时应用成为可能。本文将详细介绍如何在HTML页面中搭建WebSoc......
精简实用！一分钟搭建文件管理服务！
大家好，我是Java陈序员。今天，给大家介绍一款精简实用的文件托管服务，一分钟即可搭建使用！关注微信公众号：【Java陈序员】，获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。项目介绍Dufs——一款多功能的实用文件服务器。不仅支持静态文件的托管服务，还具备文件上......
[附源码]超简洁个人博客网站搭建+SpringBoot+Vue前后端分离
今天带来一款优秀的项目：个人博客系统源码。系统采用的流行的前后端分离结构，内含功能包括"写博客文章"，“修改博客文章”，“富文本编辑器”，“评论管理”“管理员角色”，“游客角色”，“文章标签”，“文章分类”如果您有任何问题，也请联系小编，小编是经验丰富的程序员！一.系统演......
极狐gitlab 搭建
1、安装参考：https://gitlab.cn/install/2、启动容器：注意：$GITLAB_HOME变量需要提前设置sudodockerrun--detach\--hostnamelocalhost\--publish13443:443--publish13800:80--publish13822:22\--namegitlab\--restartalways\--volume$GITLAB_HOME/config:......
贼好用！五分钟搭建一个美观且易用的导航页面！
大家好，我是Java陈序员。今天，给大家介绍一个贼好用的导航网站搭建工具，只需通过几步操作，就能搭建出个性化导航网站！关注微信公众号：【Java陈序员】，获取开源项目分享、AI副业分享、超200本经典计算机电子书籍等。项目简介Pintree是一个开源项目，旨在将浏览器书签导出成导航网站......
kali里面搭建docker容器
注意事项：kali版本，镜像源（1）权限为管理员：sudosu (2)更新软件包列表并升级已安装的软件包apt-getupdate apt-getupgrade出错了，应该是更新源出问题了。（3）更换镜像源：这里你第一步就可以先去换了。去配置文件更改：vi/etc/apt/sources.list我换的是中科大的......
基于智能体平台搭建交互式陪伴角色
上一期我们搭建了一个恐怖类的生成式游戏。大家也可以尝试玩一玩。鬼宅惊魂红绣怨辅助玩家探索诡异老宅，生成情节和选项，提供游戏信息，解开谜题，找到出路。https://mbd.baidu.com/ma/s/JQ0zAsYl搭建互动式乙女游戏：智能体的角色陪伴体验在本篇文章中，我们继续探讨如何搭建一个互动......

Qwen2-VL环境搭建&推理测试

相关文章

赞助商

阅读排行