我们今天总结下2024年5月发表的最重要的论文,重点介绍了计算机视觉领域的最新研究和进展,包括扩散模型、视觉语言模型、图像编辑和生成、视频处理和生成以及图像识别等各个主题。
Diffusion Models
1、Dual3D: Efficient and Consistent Text-to-3D Generation with Dual-mode Multi-view Latent Diffusion
Dual3D是一个新的文本到3D生成框架,可以在1分钟内从文本生成高质量的3D图像。
https://avoid.overfit.cn/post/f3bbe390f1024ab68fa6f16e44d1305a
标签:图像识别,模型,图像编辑,生成,视觉,3D From: https://www.cnblogs.com/deephub/p/18212134