State of the Art on Diffusion Models for Visual Computing
https://arxiv.org/pdf/2310.07204v1.pdf
视觉计算(Visual Computing)领域,正因生成式人工智能(AI)的出现而快速发展,这为图像、视频和3D场景的生成、编辑和重建打开了前所未有的能力。这些领域中,扩散模型是生成式人工智能架构的选择。仅在过去一年中,关于扩散的工具和应用的文献已呈指数增长,有关论文以每天发布在arXiv上的形式呈现在计算机图形学、计算机视觉和人工智能社区。该领域快速发展使得难以跟上所有最新的进展。本文旨在介绍扩散模型的基本数学概念、流行扩散模型的实现细节和设计选择,并概述生成式人工智能工具的重要方面,包括个性化、条件化、逆映射(personalization, conditioning, inversion)等。此外,对基于扩散生成和编辑的快速增长的文献进行了全面概述,根据生成媒体的类型进行分类,包括2D图像、视频、3D对象、运动和4D场景。最后讨论可用的数据集、度量标准、开放挑战和社会影响。这篇综述报告为研究人员、艺术家和从业人员提供了一个直观的起点来探索这个令人兴奋的主题。
标签:综述,人工智能,模型,生成式,Visual,视觉,扩散 From: https://blog.51cto.com/u_15298598/7983096