首页 > 其他分享 >CogVLM/CogAgent环境搭建&推理测试

CogVLM/CogAgent环境搭建&推理测试

时间:2024-04-30 10:22:05浏览次数:26  
标签:git -- CogVLM CogAgent 测试 hf 搭建

引子

对于多模态大语言模型,一直没有怎么接触。刚巧一朋友有问到这方面的问题,也就顺手调研下。智谱AI的东西一直以来,还是很不错的。ChatGLM的忠实fans,看到白嫖网站github上有他们开源的多模态CogVLM/CogAgent,那就顺手看看了。OK,让我们开始吧。

一、模型介绍

CogVLM 是一个强大的开源视觉语言模型(VLM)。CogVLM-17B拥有100亿的视觉参数和70亿的语言参数,支持490*490分辨率的图像理解和多轮对话。CogVLM-17B 17B在10个经典的跨模态基准测试中取得了最先进的性能包括NoCaps, Flicker30k captioning, RefCOCO, RefCOCO+, RefCOCOg, Visual7W, GQA, ScienceQA, VizWiz VQA 和 TDIUC 基准测试。

CogAgent 是一个基于CogVLM改进的开源视觉语言模型。CogAgent-18B拥有110亿的视觉参数和70亿的语言参数, 支持1120*1120分辨率的图像理解。在CogVLM的能力之上,它进一步拥有了GUI图像Agent的能力。CogAgent-18B 在9个经典的跨模态基准测试中实现了最先进的通用性能,包括 VQAv2, OK-VQ, TextVQA, ST-VQA, ChartQA, infoVQA, DocVQA, MM-Vet, 和 POPE 测试基准。它在包括AITW和Mind2Web在内的GUI操作数据集上显著超越了现有的模型。

嗯哼,这么官方的语句,显然是我抄的。言而总之,总而言之,就是这个Cog确实很厉害的样子,各种数据集上的翘楚。

二、安装环境

docker run -it --rm --gpus=all -v /datas/work/zzq:/workspace pytorch/pytorch:2.2.2-cuda12.1-cudnn8-devel bash

cd /workspace

git clone GitHub - THUDM/CogVLM: a state-of-the-art-level open visual language model | 多模态预训练模型

cd CogVLM

pip install -r requirements.txt -i Simple Index

三、推理测试

1、模型下载

git clone https://code.openxlab.org.cn/THUDM/cogagent-chat-hf.git

git clone https://code.openxlab.org.cn/THUDM/cogvlm-chat-hf.git

https://huggingface.co/lmsys/vicuna-7b-v1.5/tree/main

vicuna-7b模型放在basic_demo目录下

2、cogagent测试

cd basic_demo

(1)vlm测试

python cli_demo_hf.py --from_pretrained /workspace/CogVLM/CogVLM/cogvlm-chat-hf --fp16

显存不够,报错

python cli_demo_hf.py --from_pretrained /workspace/CogVLM/CogVLM/cogvlm-chat-hf --quant 4

显存占用

输入图片

测试结果

 

(2)agent测试

python cli_demo_hf.py --from_pretrained /workspace/CogVLM/CogVLM/cogagent-chat-hf --quant 4

标签:git,--,CogVLM,CogAgent,测试,hf,搭建
From: https://www.cnblogs.com/nick-algorithmer/p/18167301

相关文章

  • vue.js 3 初学经验:开发环境搭建,Windows,nginx
    Windows11nginx-1.20.0"vue":"^3.4.21"--- 序章vue3开发,不需要后端服务业是可以的。在需要后端服务时,使用nginx来转发请求是很好的(个人开发者)。 注,还有什么其它方式吗?注,本文的后端服务是使用Java开发的HTTP接口。注,参考资料#2介绍了多个vue.js3.0项目......
  • 给Qt搭建一个简单的Json服务器用于软件调试
    一.vscode+nodejs+npm安装二.nodejs服务器开启打开vscode-终端-新建终端进入json_server目录cdD:\json_server运行启动命令,启动json-server服务器npmrunjson:server效果如下:PSD:\json_server>npmrunjson:server>[email protected]:se......
  • 酒店订单管理系统搭建教程
    1、演示环境配置centos7.9、mysql5.7、php7.22、宝塔创建站点记录创建站点时候创建的数据库信息3、上传fastadmin压缩包点击开始上传4、解压上传的fastadmin5、配置网站目录和运行目录运行目录选择public点击保存即可6、配置伪静态选择thinkphp7、直接访问域......
  • 10分钟搭建k8s
    换桥接模式,换sealos桥接模式部署出问题了,用这个:ipconfig以太网适配器以太网:连接特定的DNS后缀.......:本地链接IPv6地址........:fe80::29f9:1da9:30:3d48%8IPv4地址............:10.1.161.207子网掩码............:......
  • Docker如何搭建harbor仓库
    3.1:在部署的服务器的docker配置文件添加镜像私服地址1:编辑或创建daemon.json文件vim/etc/docker/daemon.json2:insecure-registries节点通常是不安全的,慎重设置(配置要连接harbor的ip+端口,要是80端口可以不用写),使用的是HTTPS并且有一个CA签名的证书可以在registry-mirrors节......
  • 1-Linux集群搭建,分发脚本,ssh免密登录
    Linux集群部署集群规划模板机安装创建完成后全部打开并登录root账户修改克隆主机名vim/etc/sysconfig/network-scripts/ifcfg-ens33esc退出并输入:wq保存按i修改IPADDR为192.168.10.101/192.168.10.102/192.168.10.103vim/etc/hostname按i修改名字......
  • hdp2.4搭建
    http://192.168.159.11/hbase/虚拟机目录/var/www/html/hbase启动httpd  /bin/systemctlstarthttpd.service  httpd配置文件修改下面三行路径   vi/etc/httpd/conf/httpd.confDocumentRoot"/data/www/html"<Directory"/data/www"><Directory"/d......
  • vue开发环境搭建
    一、安装nvm在工作中可能会遇到需要使用多个node版本的时候,nvm正为解决这个而生,NVM(NodeVersionManager)是一个用于管理Node.js版本的工具。1、nvm换镜像源{安装地址}\settings.txt中添加查看安装地址,wherenvm#配置node镜像:node_mirror:https://npmmirror.co......
  • 5分钟教你搭建邮件服务器的实用指南
    今天我写了一篇实用的文章,重点是教你如何免费搭建一个邮件服务器,这个服务器不仅可以用于发送邮件,还可以供我的待办机器人使用。一开始我试图找一些免费的API接口来实现这个功能,但遗憾的是,并没有找到合适的。对于程序员来说,能自己动手实现绝对是最好的选择,幸运的是,我有一台空闲的......
  • Ubuntu22.04 搭建Kubernetes 1.28版本集群
    依赖安装准备工作需要在所有节点上进行。安装ssh服务安装 openssh-serversudoapt-getinstallopenssh-server修改配置文件vim/etc/ssh/sshd_config找到配置项LoginGraceTime120PermitRootLoginprohibit-passwordStrictModesyes把 prohibit-password ......