解决|配置denoising diffusion bridge model环境|flash-att、openmpi、mpi4py安装问题

时间：2024-12-16 16:45:48浏览次数：4

标签：diffusion bridge flash att openmpi cuda 版本安装

安装flash-att
安装openmpi和mpi4py

我在配置DDBM（https://github.com/alexzhou907/DDBM/tree/main）环境时遇到的问题：
1、flash-att安装失败
2、openmpi和mpi4py安装失败
以下是基于我的情况的解决办法

安装flash-att

flash-att（1）对CUDA版本有要求（2）pytorch版本需与flash-att版本有一致性（3）需先安装ninja，否则编译很慢（当然安装了还是很慢）
1、首先通过nvcc -V查看环境是否含有cuda以及版本是否在11.6及以上。如果不是，则去官网（https://developer.nvidia.com/cuda-toolkit-archive）下载
*还要注意，nvidia driver和CUDA版本的兼容性，可参考https://blog.i-net.pub/archives/nvidia-driver-ban-ben-he-cuda-ban-ben-jian-rong-xing
安装CUDA完成后，需添加环境变量，然后再检查nvcc -V的CUDA版本是否已经改变

echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

2、关于torch版本和flash-att版本的一致性，推荐DDBM中使用的版本

pip install torch==2.1.0+cu121 torchvision==0.16.0+cu121 torchaudio==2.1.0 --index-url https://download.pytorch.org/whl/cu121
pip install ninja
pip install flash-attn==2.0.4

*还要注意，torch和cuda版本的兼容性
3、按照以上流程，flash-att的安装还是很慢（数小时），我是晚上走之前放着安装，第二天早上就好了。急的可以参考从源码直接编译（https://zhuanlan.zhihu.com/p/655077866）

安装openmpi和mpi4py

我自己曾经遵从DDBM中的conda install -c conda-forge mpi4py openmpi安装成功过1次，但是后来再装总失败
我觉得可以参考这篇教程：https://blog.csdn.net/monster7777777/article/details/124001248

标签：diffusion,bridge,flash,att,openmpi,cuda,版本,安装
From： https://www.cnblogs.com/xjl-ultrasound/p/18608853

H7-TOOL自制Flash读写保护算法系列，为凌欧LKS32MC45x/MC05x/MC08x制作使能和解除算法，支
说明：很多IC厂家仅发布了内部Flash算法文件，并没有提供读写保护算法文件，也就是选项字节算法文件，需要我们制作。实际上当前已经发布的TOOL版本，已经自制很多了，比如已经支持的兆易创新大部分型号，新唐的大部分型号等。但是依然有些厂家还没自制，所以陆续开始为这些厂家提供读写保护支......
AI绘画，5分钟用 stable diffusion 做装修图，室内设计师要失业了
哈喽这里是海绵前言AI绘画功能越来越强大，不光可以用来画人物，为电商模特一键换衣，还可以在5分钟内生成一张室内效果图，看来室内设计师饭碗也岌岌可危了。1、获得室内线稿图首先，打开3dsmax，简单用box堆一个室内场景出来，你用其他三维软件也可以，然后将这个场景渲染出一个线稿......
AI绘画 Stable Diffusion【进阶篇】：Recolor模型实现头发衣服换色
哈喽这里是海绵在艺术创作中，颜色的运用至关重要。如今，借助StableDiffusion的Recolor模型，你只需一键操作，就能轻松实现头发和衣服的换色。本文将带你深入了解StableDiffusionRecolor模型的使用方法，助你轻松掌握这一技巧。StableDiffusion是一款基于深度学习的图像生成......
DDPM, DDIM, LDM 和stable diffusion
以下是这些模型的发展历程的概述：DDPM(DenoisingDiffusionProbabilisticModels)：DDPM是扩散模型的早期形式，它通过逐步去噪的方式生成高质量数据，但其效率较低，特别是在处理高分辨率图像时需要耗费大量的计算资源。DDIM(DenoisingDiffusionImplicitModels)：DDIM是DDPM的......
Adobe Bridge 2025下载与安装
1、安装包我用夸克网盘分享了「Bridge2025」链接：下载地址 2、安装教程(安装前关闭系统防护)1) 下载软件安装包，双击Set-up.exe安装 2) 修改安装目录，点击继续 3) 点击继续，提示正在安装进度 4) ......
AIGC绘画设基础入门｜Stable diffusion 最新版本来袭，安装包4.8.7升级版来了！
本期给大家带来了最新的StableDiffusion2024最新4.8.7版本工具包包含安装教程、各种主流模型和最新AI学习课程无需部署安装，解压就可以直接使用！！！让你快速上手想体验的伙伴赶紧来试试吧StableDiffusion是以文本生成图像的AI工具，也是目前唯一一款能部署在家用电脑上......
STM32 进阶 SPI外设读写Flash 寄存器代码书写
目录SPI外设SPI外设框图需求描述硬件电路设计相关寄存器文字说明：spi.hspi.c W25Q32.hSPI外设与I2C外设一样，STM32芯片也集成了专门用于SPI协议通讯的外设。STM32的SPI外设可用作通讯的主机及从机，支持最高的SCK时钟频率为fpclk/2（STM32F103型号的芯片默认f......
【stablediffusion教程】的基础操作和使用技巧分享
这是一篇关于stablediffusion本地部署并通过基础模型搭配不同的lora生成图片的教程，软件很容易获取，对电脑的要求也不是太高，相较于本地化的chatglm动不动就要6G显存的门槛还是很低的，根据不同性能显卡，同样的参数生成图片的速度也不一样，4090-24G版本的几秒就可以生成一张图，1060-......
如何在Flash绝对地址写入常量数组数据
目录文章目录背景一、问题现象及分析1、分析2、分析3、分析二、尝试方法1.方法2.方法三、结果四、总结背景出于项目要求，需要在STM32F407VETx芯片的Flash绝对地址写入常量数组数据，例如在0x0807F920处写入数组uint8_tMyFlashArray[4]={0x12,0x34,0x56......
首发实测，Google最快AI来了！深度解析Gemini 2.0 Flash
引言年末各家大模型产品之战再度升级，12月11日，Google在官网博客发布了其新一代AI模型Gemini2.0系列的首款模型——Gemini2.0Flash实验版本。正如模型名称Flash描述的那样，该模型具有低延迟和高性能的特性，Google更是计划使其成为Google相关产品规模化应用的核心引擎。通过......

解决|配置denoising diffusion bridge model环境|flash-att、openmpi、mpi4py安装问题

安装flash-att

安装openmpi和mpi4py

相关文章

赞助商

阅读排行