• 2024-09-06(赠书)国产开源视觉语言模型CogVLM2在线体验:竟能识别黑悟空
    CogVLM2是一款视觉语言模型(VisualLanguageModel),由智谱AI和清华KEG潜心打磨。这款模型是CogVLM的升级版本,支持高达1344*1344的图像分辨率,提供支持中英文双语的开源模型版本。这类模型可以做很多跨领域的活儿,比如给图片配上描述文字、回答关于图片的问题(这叫VQA,就是视觉问
  • 2024-07-22CogVLMv2环境搭建&推理测试
     引子之前写过一篇CogVLM的分享,感兴趣的移步https://blog.csdn.net/zzq1989_/article/details/138337071?spm=1001.2014.3001.5501,前一阵子,CogVLMv2横空出世,支持视频理解功能,OK,那就让我们开始吧。一、模型介绍CogVLM2 系列模型开源了两款基于 Meta-Llama-3-8B-Instruct 开