首页 > 其他分享 >解决|配置denoising diffusion bridge model环境|flash-att、openmpi、mpi4py安装问题

解决|配置denoising diffusion bridge model环境|flash-att、openmpi、mpi4py安装问题

时间:2024-12-16 16:45:48浏览次数:4  
标签:diffusion bridge flash att openmpi cuda 版本 安装

目录
我在配置DDBM(https://github.com/alexzhou907/DDBM/tree/main)环境时遇到的问题:
1、flash-att安装失败
2、openmpi和mpi4py安装失败
以下是基于我的情况的解决办法

安装flash-att

flash-att(1)对CUDA版本有要求(2)pytorch版本需与flash-att版本有一致性(3)需先安装ninja,否则编译很慢(当然安装了还是很慢)
1、首先通过nvcc -V查看环境是否含有cuda以及版本是否在11.6及以上。如果不是,则去官网(https://developer.nvidia.com/cuda-toolkit-archive)下载
*还要注意,nvidia driver和CUDA版本的兼容性,可参考https://blog.i-net.pub/archives/nvidia-driver-ban-ben-he-cuda-ban-ben-jian-rong-xing
安装CUDA完成后,需添加环境变量,然后再检查nvcc -V的CUDA版本是否已经改变

echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

2、关于torch版本和flash-att版本的一致性,推荐DDBM中使用的版本

pip install torch==2.1.0+cu121 torchvision==0.16.0+cu121 torchaudio==2.1.0 --index-url https://download.pytorch.org/whl/cu121
pip install ninja
pip install flash-attn==2.0.4 

*还要注意,torch和cuda版本的兼容性
3、按照以上流程,flash-att的安装还是很慢(数小时),我是晚上走之前放着安装,第二天早上就好了。急的可以参考从源码直接编译(https://zhuanlan.zhihu.com/p/655077866)

安装openmpi和mpi4py

我自己曾经遵从DDBM中的conda install -c conda-forge mpi4py openmpi安装成功过1次,但是后来再装总失败
我觉得可以参考这篇教程:https://blog.csdn.net/monster7777777/article/details/124001248

标签:diffusion,bridge,flash,att,openmpi,cuda,版本,安装
From: https://www.cnblogs.com/xjl-ultrasound/p/18608853

相关文章

  • H7-TOOL自制Flash读写保护算法系列,为凌欧LKS32MC45x/MC05x/MC08x制作使能和解除算法,支
    说明:很多IC厂家仅发布了内部Flash算法文件,并没有提供读写保护算法文件,也就是选项字节算法文件,需要我们制作。实际上当前已经发布的TOOL版本,已经自制很多了,比如已经支持的兆易创新大部分型号,新唐的大部分型号等。但是依然有些厂家还没自制,所以陆续开始为这些厂家提供读写保护支......
  • AI绘画,5分钟用 stable diffusion 做装修图,室内设计师要失业了
    哈喽这里是海绵前言AI绘画功能越来越强大,不光可以用来画人物,为电商模特一键换衣,还可以在5分钟内生成一张室内效果图,看来室内设计师饭碗也岌岌可危了。1、获得室内线稿图首先,打开3dsmax,简单用box堆一个室内场景出来,你用其他三维软件也可以,然后将这个场景渲染出一个线稿......
  • AI绘画 Stable Diffusion【进阶篇】:Recolor模型实现头发衣服换色
    哈喽这里是海绵在艺术创作中,颜色的运用至关重要。如今,借助StableDiffusion的Recolor模型,你只需一键操作,就能轻松实现头发和衣服的换色。本文将带你深入了解StableDiffusionRecolor模型的使用方法,助你轻松掌握这一技巧。StableDiffusion是一款基于深度学习的图像生成......
  • DDPM, DDIM, LDM 和stable diffusion
    以下是这些模型的发展历程的概述:DDPM(DenoisingDiffusionProbabilisticModels):DDPM是扩散模型的早期形式,它通过逐步去噪的方式生成高质量数据,但其效率较低,特别是在处理高分辨率图像时需要耗费大量的计算资源。DDIM(DenoisingDiffusionImplicitModels):DDIM是DDPM的......
  • Adobe Bridge 2025下载与安装
    1、安装包我用夸克网盘分享了「Bridge2025」链接:下载地址  2、安装教程(安装前关闭系统防护)1)       下载软件安装包,双击Set-up.exe安装  2)       修改安装目录,点击继续  3)       点击继续,提示正在安装进度  4)       ......
  • AIGC绘画设基础入门|Stable diffusion 最新版本来袭,安装包4.8.7升级版来了!
    本期给大家带来了最新的StableDiffusion2024最新4.8.7版本工具包包含安装教程、各种主流模型和最新AI学习课程无需部署安装,解压就可以直接使用!!!让你快速上手想体验的伙伴赶紧来试试吧StableDiffusion是以文本生成图像的AI工具,也是目前唯一一款能部署在家用电脑上......
  • STM32 进阶 SPI外设读写Flash 寄存器代码书写
    目录SPI外设SPI外设框图需求描述硬件电路设计相关寄存器文字说明:spi.hspi.c W25Q32.hSPI外设与I2C外设一样,STM32芯片也集成了专门用于SPI协议通讯的外设。STM32的SPI外设可用作通讯的主机及从机,支持最高的SCK时钟频率为fpclk/2(STM32F103型号的芯片默认f......
  • 【stablediffusion教程】的基础操作和使用技巧分享
    这是一篇关于stablediffusion本地部署并通过基础模型搭配不同的lora生成图片的教程,软件很容易获取,对电脑的要求也不是太高,相较于本地化的chatglm动不动就要6G显存的门槛还是很低的,根据不同性能显卡,同样的参数生成图片的速度也不一样,4090-24G版本的几秒就可以生成一张图,1060-......
  • 如何在Flash绝对地址写入常量数组数据
    目录文章目录背景一、问题现象及分析1、分析2、分析3、分析二、尝试方法1.方法2.方法三、结果四、总结背景出于项目要求,需要在STM32F407VETx芯片的Flash绝对地址写入常量数组数据,例如在0x0807F920处写入数组uint8_tMyFlashArray[4]={0x12,0x34,0x56......
  • 首发实测,Google最快AI来了!深度解析Gemini 2.0 Flash
    引言年末各家大模型产品之战再度升级,12月11日,Google在官网博客发布了其新一代AI模型Gemini2.0系列的首款模型——Gemini2.0Flash实验版本。正如模型名称Flash描述的那样,该模型具有低延迟和高性能的特性,Google更是计划使其成为Google相关产品规模化应用的核心引擎。通过......