首页 > 其他分享 >LLAVA部署

LLAVA部署

时间:2024-10-11 11:35:15浏览次数:7  
标签:torch 部署 flash -- LLAVA cuda 版本 attn

先简单记录版本,以后再详细;

haotian-liu/LLaVA at v1.2.1 (github.com)

 

当前调通版本:

  cuda11.7; cudnn

  LLava-1.2.1;

  python3.10; torch2.0.1

  flash-attn; flash_attn-2.0.7+cu117torch2.0cxx11abiTRUE-cp310-cp310-linux_x86_64.whl

  3090Ti

  llava-7b模型

 

具体工作:

1. 先测试cuda版本;--> 至少11.6以上;

  --> 学习一个linux同时安装多个cuda; 多版本cuda切换;

  --> 根据系统gpu 驱动,匹配对应可以安装的cuda; 我用的老的,导致我最高只能安装cuda11.7; 驱动是可以更高的;

2. LLava最新版本在pip install -e .的时候,会安装非常新的torch. 而这个torch又会非常麻烦的不匹配cuda和driver, 除非你的driver很新。所以我这里只能用旧的。测试了1.2.1版本。

3. flash-attn也是非常有问题的,按照官网指示的cuda和torch和python版本是没有用的,他们即使和你的一模一样也不行,就是匹配不上,能做的就是一代一代往前试,然后有一代就通过了。

4. 接下来最后一个工作是web-driver出来了,model上不去的问题,最后发现是指令不对,所以建议指令还是复制比较好。

 

详细工作,我会专门写一篇详细部署过程,也会出一期视频来讲解。链接会放在这个下面。如果还没放,说明还没写好。

标签:torch,部署,flash,--,LLAVA,cuda,版本,attn
From: https://www.cnblogs.com/cainiaoxuexi2017-ZYA/p/18458060

相关文章

  • ArgoCD + ArgoCD Image Updater 部署实现
    部署思路踩坑整理1、ArgoCD和ArgoCDImageUpdater是2个不同的程序。"ArgoCDImageUpdater小工具"没有集成在ArgoCD中需要单独部署。2、单独的ArgoCD能够实现基于git仓库变更作为应用部署的事实来源[参考子页:argocd根据镜像tag变化实现自动发布的2种方式];ArgoCD+"ArgoCD......
  • 深信服超融合平台部署Kylin系统详细步骤
    创建虚拟机登录深信服超融合平台,按照图下所示选择虚拟机在想要新增虚拟机的分组里,右键,点击新增虚拟机在弹出的窗口里设置好虚拟机名称和操作系统,其他的选项按照需求自己设定处理器、内存、磁盘大小按照需求设定好,网络需要点击图下所示位置进行设置点击图下所示位置......
  • jsp大学生公寓管理系统tj767--程序+源码+数据库+调试部署+开发环境
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表学生,工作人员,宿舍信息,住宿信息,报修信息,维修信息,人员评分,评分信息开题报告内容一、研究背景与目的随着高校扩招,大学生公寓管理面临诸多挑战,如住宿分配、......
  • jsp大学生创新创业管理系统09jwy程序+源码+数据库+调试部署+开发环境
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表学生,教师,专家,项目信息,项目分配,项目类型开题报告内容一、项目名称大学生创新创业管理系统二、项目背景与意义在“大众创业,万众创新”的时代背景下,大学生......
  • jsp村级技能培训管理系统q7e84(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表用户,品种分类,种植技术,农业知识,科学技术开题报告内容一、研究背景与意义随着农村经济的快速发展,农民对技能培训的需求日益增长。传统的村级技能培训管理方......
  • jsp大连东软人才培训中心oa系统tc617--(程序+源码+数据库+调试部署+开发环境)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表员工,部门,岗位,会议室类型,会议室,会议室预约,会议室取消,考勤信息,日程信息,员工请假,公文信息开题报告内容一、研究背景随着信息技术的不断发展和企业管理......
  • 昆仑虚 - NextJS 项目如何进行部署?
    引言NextJS是一个构建于NodeJS之上的一个Web开发框架。它基于React特性进行了一些列的扩展!!在社区中也很是火热,前段时间「昆仑虚」也终于完成了项目的迁移(React=>NexJS)!!那么接下来就是项目部署,NextJS相比常规的前端部署还是有所区别的:常规的前端项......
  • 基于SpringBoot+Vue+uniapp的在线远程考试系统的详细设计和实现(源码+lw+部署文档+讲
    文章目录前言详细视频演示具体实现截图技术栈后端框架SpringBoot前端框架Vue持久层框架MyBaitsPlus系统测试系统测试目的系统功能测试系统测试结论为什么选择我代码参考数据库参考源码获取前言......
  • 基于SpringBoot+Vue+uniapp的毕业就业信息管理系统的详细设计和实现(源码+lw+部署文档
    文章目录前言详细视频演示具体实现截图技术栈后端框架SpringBoot前端框架Vue持久层框架MyBaitsPlus系统测试系统测试目的系统功能测试系统测试结论为什么选择我代码参考数据库参考源码获取前言......
  • 基于SpringBoot的网上订餐系统(源码+论文+部署讲解)
    目录:目录:博主介绍: 完整视频演示:你应该选择我技术栈介绍:需求分析:系统各功能实现一览:1.注册2.登录部分代码参考: 项目功能分析: 项目论文:源码获取:博主介绍: ......