CogVLM/CogAgent环境搭建&推理测试

时间：2024-04-30 10:22:05浏览次数：37

引子

对于多模态大语言模型，一直没有怎么接触。刚巧一朋友有问到这方面的问题，也就顺手调研下。智谱AI的东西一直以来，还是很不错的。ChatGLM的忠实fans，看到白嫖网站github上有他们开源的多模态CogVLM/CogAgent，那就顺手看看了。OK，让我们开始吧。

一、模型介绍

CogVLM 是一个强大的开源视觉语言模型（VLM）。CogVLM-17B拥有100亿的视觉参数和70亿的语言参数，支持490*490分辨率的图像理解和多轮对话。CogVLM-17B 17B在10个经典的跨模态基准测试中取得了最先进的性能包括NoCaps, Flicker30k captioning, RefCOCO, RefCOCO+, RefCOCOg, Visual7W, GQA, ScienceQA, VizWiz VQA 和 TDIUC 基准测试。

CogAgent 是一个基于CogVLM改进的开源视觉语言模型。CogAgent-18B拥有110亿的视觉参数和70亿的语言参数, 支持1120*1120分辨率的图像理解。在CogVLM的能力之上，它进一步拥有了GUI图像Agent的能力。CogAgent-18B 在9个经典的跨模态基准测试中实现了最先进的通用性能，包括 VQAv2, OK-VQ, TextVQA, ST-VQA, ChartQA, infoVQA, DocVQA, MM-Vet, 和 POPE 测试基准。它在包括AITW和Mind2Web在内的GUI操作数据集上显著超越了现有的模型。

嗯哼，这么官方的语句，显然是我抄的。言而总之，总而言之，就是这个Cog确实很厉害的样子，各种数据集上的翘楚。

二、安装环境

docker run -it --rm --gpus=all -v /datas/work/zzq:/workspace pytorch/pytorch:2.2.2-cuda12.1-cudnn8-devel bash

cd /workspace

git clone GitHub - THUDM/CogVLM: a state-of-the-art-level open visual language model | 多模态预训练模型

cd CogVLM

pip install -r requirements.txt -i Simple Index

三、推理测试

1、模型下载

git clone https://code.openxlab.org.cn/THUDM/cogagent-chat-hf.git

git clone https://code.openxlab.org.cn/THUDM/cogvlm-chat-hf.git

https://huggingface.co/lmsys/vicuna-7b-v1.5/tree/main

vicuna-7b模型放在basic_demo目录下

2、cogagent测试

cd basic_demo

（1）vlm测试

python cli_demo_hf.py --from_pretrained /workspace/CogVLM/CogVLM/cogvlm-chat-hf --fp16

显存不够，报错

python cli_demo_hf.py --from_pretrained /workspace/CogVLM/CogVLM/cogvlm-chat-hf --quant 4

显存占用

输入图片

测试结果

（2）agent测试

python cli_demo_hf.py --from_pretrained /workspace/CogVLM/CogVLM/cogagent-chat-hf --quant 4

标签：git,--,CogVLM,CogAgent,测试,hf,搭建
From： https://www.cnblogs.com/nick-algorithmer/p/18167301

vue.js 3 初学经验：开发环境搭建，Windows，nginx
Windows11nginx-1.20.0"vue":"^3.4.21"--- 序章vue3开发，不需要后端服务业是可以的。在需要后端服务时，使用nginx来转发请求是很好的（个人开发者）。注，还有什么其它方式吗？注，本文的后端服务是使用Java开发的HTTP接口。注，参考资料#2介绍了多个vue.js3.0项目......
给Qt搭建一个简单的Json服务器用于软件调试
一.vscode+nodejs+npm安装二.nodejs服务器开启打开vscode-终端-新建终端进入json_server目录cdD:\json_server运行启动命令,启动json-server服务器npmrunjson:server效果如下:PSD:\json_server>npmrunjson:server>jsonserver@1.0.0json:se......
酒店订单管理系统搭建教程
1、演示环境配置centos7.9、mysql5.7、php7.22、宝塔创建站点记录创建站点时候创建的数据库信息3、上传fastadmin压缩包点击开始上传4、解压上传的fastadmin5、配置网站目录和运行目录运行目录选择public点击保存即可6、配置伪静态选择thinkphp7、直接访问域......
10分钟搭建k8s
换桥接模式，换sealos桥接模式部署出问题了，用这个:ipconfig以太网适配器以太网:连接特定的DNS后缀.......:本地链接IPv6地址........:fe80::29f9:1da9:30:3d48%8IPv4地址............:10.1.161.207子网掩码............:......
Docker如何搭建harbor仓库
3.1：在部署的服务器的docker配置文件添加镜像私服地址1：编辑或创建daemon.json文件vim/etc/docker/daemon.json2：insecure-registries节点通常是不安全的,慎重设置(配置要连接harbor的ip+端口，要是80端口可以不用写)，使用的是HTTPS并且有一个CA签名的证书可以在registry-mirrors节......
1-Linux集群搭建，分发脚本，ssh免密登录
Linux集群部署集群规划模板机安装创建完成后全部打开并登录root账户修改克隆主机名vim/etc/sysconfig/network-scripts/ifcfg-ens33esc退出并输入：wq保存按i修改IPADDR为192.168.10.101/192.168.10.102/192.168.10.103vim/etc/hostname按i修改名字......
hdp2.4搭建
http://192.168.159.11/hbase/虚拟机目录/var/www/html/hbase启动httpd /bin/systemctlstarthttpd.service httpd配置文件修改下面三行路径 vi/etc/httpd/conf/httpd.confDocumentRoot"/data/www/html"<Directory"/data/www"><Directory"/d......
vue开发环境搭建
一、安装nvm在工作中可能会遇到需要使用多个node版本的时候，nvm正为解决这个而生，NVM（NodeVersionManager）是一个用于管理Node.js版本的工具。1、nvm换镜像源{安装地址}\settings.txt中添加查看安装地址，wherenvm#配置node镜像：node_mirror:https://npmmirror.co......
5分钟教你搭建邮件服务器的实用指南
今天我写了一篇实用的文章，重点是教你如何免费搭建一个邮件服务器，这个服务器不仅可以用于发送邮件，还可以供我的待办机器人使用。一开始我试图找一些免费的API接口来实现这个功能，但遗憾的是，并没有找到合适的。对于程序员来说，能自己动手实现绝对是最好的选择，幸运的是，我有一台空闲的......
Ubuntu22.04 搭建Kubernetes 1.28版本集群
依赖安装准备工作需要在所有节点上进行。安装ssh服务安装 openssh-serversudoapt-getinstallopenssh-server修改配置文件vim/etc/ssh/sshd_config找到配置项LoginGraceTime120PermitRootLoginprohibit-passwordStrictModesyes把 prohibit-password ......

CogVLM/CogAgent环境搭建&推理测试

相关文章

赞助商

阅读排行