首页 > 其他分享 >Open-Sora1.2环境搭建&推理测试

Open-Sora1.2环境搭建&推理测试

时间:2024-07-08 15:08:45浏览次数:25  
标签:inference -- Open py flow Sora1.2 PixArt 搭建

​引子

前阵子写了一篇Open-Sora1.0环境搭建&推理测试(Open-Sora1.0环境搭建&推理测试_自己搭建sora服务-CSDN博客,感兴趣的童鞋,请移步)。Open-Sora1.1发布的时候,撇了一眼新闻。后面一转头,忘记这个事情了。无意间翻到其开源网站上,发现2024.6.17发布1.2版本了,那还是过来看看有什么长足的进步吧,呦呵,现在支持720P 高清视频,质量和生成时长也有了突破性进展。OK,那就让我们开始吧。

一、升级介绍

在上一个版本基础上,引入了视频压缩网络(Video Compression Network)、更优的扩散模型算法、更多的可控性,并利用更多的数据训练出了 1.1B 的扩散生成模型。Stable Diffusion 3,最新的扩散模型,通过采用了 rectified flow 技术替代 DDPM,显著提升了图片和视频生成的质量。尽管 SD3 的 rectified flow 训练代码尚未公开,但潞晨 Open-Sora 团队已经基于 SD3 的研究成果,提供了一套完整的训练解决方案,包括:

(1)简单易用的整流(rectified flow)训练

(2)用于训练加速的 Logit-norm 时间步长采样

(3)基于分辨率和视频长度的时间步长采样

二、环境安装

(1)模型下载

https://huggingface.co/hpcai-tech/OpenSora-STDiT-v3/tree/main

https://huggingface.co/hpcai-tech/OpenSora-VAE-v1.2/tree/main

https://huggingface.co/PixArt-alpha/pixart_sigma_sdxlvae_T5_diffusers/tree/main/vae

(2)代码下载

git clone GitHub - hpcaitech/Open-Sora: Open-Sora: Democratizing Efficient Video Production for All

三、推理测试

docker run -it --gpus=all --rm -v /datas/work/zzq/:/workspace open-sora:v1.0 bash

pip install -v .

git clone GitHub - PixArt-alpha/PixArt-sigma: PixArt-Σ: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation

cd PixArt-sigma

pip install -r requirements.txt

注:open-sora:v1.0为上一篇OpenSora博文安装的docker镜像名称

修改代码

修改代码 vi /opt/conda/lib/python3.10/site-packages/opensora/models/vae/vae.py

python scripts/inference.py configs/opensora-v1-2/inference/sample.py --num-frames 4s --resolution 720p --aspect-ratio 9:16 --num-sampling-steps 30 --flow 5 --aes 6.5 --prompt "a beautiful waterfall"

显存不够,改小分辨率

python scripts/inference.py configs/opensora-v1-2/inference/sample.py --num-frames 4s --resolution 144p --aspect-ratio 9:16 --num-sampling-steps 30 --flow 5 --aes 6.5 --prompt "a beautiful waterfall"

 

标签:inference,--,Open,py,flow,Sora1.2,PixArt,搭建
From: https://www.cnblogs.com/nick-algorithmer/p/18289919

相关文章

  • 博客搭建
    前期准备1、注册和申请博客园2、申请JS权限目的:就是为了可以自定义自己的博客界面和风格博客美化1、进入博客后台设置,选取SimpleMemory博客皮肤美化代码1、博客侧边栏代码点击查看代码<inputid="linkListFlg"type="hidden"/><scripttype="text/javascript">win......
  • 第一章:JAVA的环境搭建
    Java是一种计算机编程语言;除了Java编程语言,还有很多的编程语言:C,C++,C#,python等不同的编程语言类比喻不同的国家的语言;每个编程语言的语法不同java是一个用于后端开发的编程语言开发流程  ======>   了解软件应用程序市场调研:了解客户的需求/用户的需求=====>需......
  • 硅纪元视角 | Speak火了!3个月收入翻倍,OpenAI为何频频下注?
    在数字化浪潮的推动下,人工智能(AI)正成为塑造未来的关键力量。硅纪元视角栏目紧跟AI科技的最新发展,捕捉行业动态;提供深入的新闻解读,助您洞悉技术背后的逻辑;汇聚行业专家的见解,分享独到的视角和思考;精选对您有价值的信息,帮助您在AI时代中把握机遇。1分钟速览新闻  Spe......
  • 手动配置软件源(以 openSUSE Leap 为例,添加科大、清华源,解决openSUSE Leap播放不了哔哩
    手动配置软件源(以openSUSELeap为例,添加科大、清华源)(参考http://mirrors.ustc.edu.cn/help/opensuse.html)注意以下配置方法适用于从未自行配置软件源的用户,其他用户请根据具体情况自行配置,以下仅供参考。确认当前配置的软件源:sudozypperlr-d禁用原有软件源:sudozyppe......
  • Es集群架构的搭建以及集群的核心概念
    1、深入理解ES集群架构的底层原理这篇主要讲解es的集群架构的底层原理,es的索引分片,副本等基本知识集群的核心概念在安装集群之前,先了解一下集群的几个概念。如下图,就是一个三个节点组成的es集群,p0、p1、p2表示一个节点中的分片,R0、R1、R2表示分片对应的副本 1.1节点以及......
  • Halcon学习笔记(3):WPF 框架搭建,MaterialDesign+Prism
    目录前言环境Nuget安装新建WPF类库项目初始化PrismApp启动页初始化重写MainView前言其实我更喜欢CommunityToolkit.mvvm+HandyControl。但是因为找工作,你不能去抗拒新事物。这里就当体验一下完整的流程好了。环境windows11.netcore8.0Nuget安装新建WPF类库项目新......
  • Linux系统配置Opencv+cuda+ffmpeg开发环境,-217:Gpu API call unknown error code问题
    Opencv是当前比较热门的图像处理开源算法库,但是随着深度学习在图像存储里领域的大放异彩,基于python的图像处理和深度学习算法大有超越opencv的趋势。opencv在最近的版本更新中,重点都放在了人工智能算法方面,本文介绍linux环境下配置支持GPU/cuda的ffmpeg和opencv开发环境,并将其中遇......
  • gitlab私有仓库搭建
    安全:关闭防火墙,selinux1.安装GItlab所需的依赖包yuminstallcurlpolicycoreutils-pythonopenssh-serverpostfixwget-y安装gitlab获取gitlab源码包选择各种yum源去安装https://mirrors.tuna.tsinghua.edu.cn/gitlab-ce/yum/el7/gitlab-ce-12.0.3-ce.0.el7.x86_64.rpm......
  • Ubuntu 22.04搭建MC原版服务端
    首先下载JAVA版服务器https://www.minecraft.net/zh-hans/download/server服务器下载java21。这里我看了需求,如果你开mc服务器从1.20.5(24w14a)开始,运行Minecraft的最低要求是Java21,且操作系统要求为64位。aptinstallopenjdk-21-jdk运行就行。java-Xmx1G-Xms1G-jar服......
  • [FAQ] a 链接的 rel=noopener 含义
    HTML中的 <a> 标签的 rel 属性用于定义与链接文档的关系。当 rel="noopener" 被使用时,它表示链接的目标文档不应该拥有对原始文档的任何引用能力。具体来说,这意呈现在以下几点: 1.安全增强:当一个链接在一个新的浏览上下文中打开(例如一个新的标签页或窗口),rel="noopene......