首页 > 其他分享 >​Stability AI 推出 SPAR3D:单图像生成 3D 对象一秒钟搞定

​Stability AI 推出 SPAR3D:单图像生成 3D 对象一秒钟搞定

时间:2025-01-13 11:58:20浏览次数:3  
标签:point AI 图像 生成 Stability SPAR3D 点云 3D

在刚刚结束的 CES 展会上,Stability AI 宣布推出一种名为 SPAR3D(Stable Point Aware3D)的创新方法,这种两阶段的3D 生成技术能够在不到一秒的时间内,从单个图像中生成精确的3D 对象。该技术的推出为游戏开发者、产品设计师和环境构建者提供了全新的3D 原型设计方式。

在这里插入图片描述
SPAR3D 的独特之处在于,它能够分别建模可见部分和不可见部分。在生成3D 对象时,该方法提供了准确的几何形状及完整的360度视图,包括物体背面的细节。用户还可以通过实时编辑功能,对生成的3D 对象进行直接修改,如删除、复制、拉伸和重新着色点云,大大提高了操作的灵活性和创意空间。

SPAR3D 的工作流程可以分为两个阶段。第一阶段采用轻量级点扩散模型生成稀疏的3D 点云,样本提取速度极快;第二阶段则利用这些点云和输入图像来构建高细节的网格模型。这样的设计不仅提高了计算效率,还保证了输出质量,克服了传统单图像3D 重建方法的局限。

在性能测试中,SPAR3D 在 GSO 和 Omniobject3D 数据集上表现出色,优于现有的多种最先进的算法。研究团队通过多项实验验证了该技术的有效性,尤其是在处理图像遮挡和细节重建方面的优势。SPAR3D 采用显式的点云作为中间表示,使得用户能够对3D 模型进行进一步编辑,提升了用户体验。

SPAR3D功能总结主要有以下几点:

实时生成能力

快速生成:能够从单张图像中生成完整的3D 对象结构,生成时间不足一秒。

高效编辑 :编辑后的点云转换为最终网格的速度仅为0.3秒。

先进的编辑功能

点云编辑 :用户可直接对点云进行操作,包括删除、复制、拉伸和添加特征。

重新着色 :提供对3D 模型颜色的调整功能,增强创作灵活性。

精确的结构预测

完整结构预测 :能够提供准确的几何形状和详细的360度视图预测,包括隐藏区域。

高分辨率输出 :通过三平面变换器生成高分辨率的三平面数据,捕捉图像的纹理和光照。

开放的使用政策

广泛的应用许可 :支持商业和非商业用途,用户可在多个平台上获取和使用该模型。

开发者友好 :可通过 Hugging Face 下载权重,获取代码在 GitHub 上使用,或通过 API 访问。

官方介绍:https://stability.ai/news/stable-point-aware-3d

Demo

%%bash
git clone  https://github.com/Stability-AI/stable-point-aware-3d.git
cd stable-point-aware-3d
pip install -r requirements.txt

登录hf

from huggingface_hub import notebook_login
notebook_login()

安装防止依赖缺失

!pip install gpytoolbox
!pip install pynanoinstantmeshes==0.0.3

环境变量SPAR3D_LOW_VRAM=1run.py添加--low-vram-mode可以避免显存溢出。

%%bash
cd stable-point-aware-3d
SPAR3D_LOW_VRAM=1 python run.py demo_files/examples/fish.png --output-dir output/  --low-vram-mode

标签:point,AI,图像,生成,Stability,SPAR3D,点云,3D
From: https://blog.csdn.net/weixin_41446370/article/details/145077759

相关文章

  • 中国电信研究院出版,一本人人都能读懂的AI大模型综合指南!大模型从入门到精通只看这一本
    来了兄弟们,今天又来分享大模型书籍了,沉寂的这段时间都在不停地学习,最近大模型又出了不少新东西,比如deepseekv3,真的太牛了!好了不说多的了,今天给大家带来的是这本书—《一本书读懂大模型:技术创新、商业应用与产业变革》。这是一本人人都能读懂的大模型综合指南,既是一本大......
  • AI教学分析课堂质量评估系统
    AI教学分析课堂质量评估系统能够实时监测课堂教学活动的诸多细节,AI教学分析课堂质量评估系统通过现场的监控摄像机可精准捕捉师生的面部表情,分析其情绪状态,从而判断学生对课程内容的兴趣程度以及教师的情绪投入情况。同时,借助先进的语音识别功能,系统能实时转录课堂上的师生对话,分......
  • AI测试应用之Windsurf、Cursor
    前言随着AI的爆火,也体现在了各行各业中的应用,比如AI剪辑,AI炒股,AI新能源,AI炒菜机器人等等,当然软件行业应用更多,目前市面评价较高的Cursor,Windsurf,真正能节源提效的能力;目前来看未来AI取代一部分传统岗位不可避免,短期内不能淘汰人员,但一定会淘汰不会使用AI功能的人; 【言归......
  • AI 外呼机器人哪家好?
    在当今数字化时代,AI外呼机器人已成为企业提升效率、降低成本的重要工具。市场上的AI外呼机器人品牌众多,让人眼花缭乱。下面将为您介绍一些值得关注的品牌,其中讯小优排名第一。讯小优讯小优作为行业内的佼佼者,凭借其卓越的性能和优质的服务脱颖而出。精准的语音识别技术......
  • 你了解什么是无障碍web(WAI)吗?在开发过程中要怎么做呢?
    无障碍Web(WebAccessibilityInitiative,简称WAI)是由万维网联盟(WorldWideWebConsortium,简称W3C)发起的一个国际性计划,旨在提高网络内容和服务对所有用户的无障碍性,包括残疾人士。该计划制定了一系列指导原则和推荐实践,帮助网站开发者、设计者和内容创作者确保他们的产品对所有人......
  • [CF 2055C] The Trails
    思路佛罗里达不养闲人颓了两分钟继续看题,最近不敢用计时器???顺手去修了个电脑,无敌了顺手去修了个\(\rm{VScode}\),无敌了简化题意给定一个\(n\)行\(m\)列的矩阵,矩阵的\((i,j)\)位置上有值\(a_{i,j}\)给定一条从左上到右下的只向下和向右的路径,求如何......
  • 社群团购项目运营策略的深度剖析:融合链动2+1模式、AI智能名片与S2B2C商城小程序的综合
    摘要:随着互联网技术的飞速发展和消费者购物习惯的不断变化,社群团购作为一种新兴的商业模式,正逐渐成为连接供应商、商家与消费者的重要桥梁。然而,社群团购的成功并非仅限于线上运营,其关键在于项目整体运营的优劣,特别是线上线下融合的综合运营策略。本文旨在深入探讨社群团购项目......
  • 信息时代的消费者行为变迁与应对策略:基于链动2+1模式、AI智能名片及S2B2C商城小程序的
    摘要:随着信息技术的飞速发展与互联网的全面普及,消费者行为模式正在经历深刻变革。在信息大爆炸的背景下,消费者拥有了前所未有的信息获取能力,他们开始独立思考,追求个性化消费体验,并展现出理性消费的趋势。面对这一变化,企业传统的营销策略面临挑战,亟需寻找新的市场切入点和服务模......
  • 【AI游戏】使用强化学习玩 Flappy Bird:从零实现 Q-Learning 算法(附完整资源)
    1. 引言FlappyBird是一款经典的休闲游戏,玩家需要控制小鸟穿过管道,避免碰撞。虽然游戏规则简单,但实现一个AI来自动玩FlappyBird却是一个有趣的挑战。本文将介绍如何使用 Q-Learning 强化学习算法来训练一个AI,使其能够自动玩FlappyBird。我们将从游戏的基本框架开......
  • Python在生成式AI驱动的电影特效中的作用
    文章目录引言一、生成式AI在电影特效中的应用1.1生成式AI简介1.2生成式AI在电影特效中的角色二、Python的优势及其在生成式AI中的应用2.1Python的生态系统2.2Python在生成式AI中的应用三、虚拟角色生成3.1虚拟角色生成的挑战3.2利用GAN生成虚拟角色四、场景重建......