IV. Mip-NeRF

时间：2024-05-28 19:55:13浏览次数：31

标签：采样 NeRF360 IV MLP Mip 像素 NeRF

Mip-NeRF算法思想。

Paper explanation Mip-NeRF360 and BlockNeRF

一、NeRF 的缺点

所有采样点都是：光心+像素中心的射线确定的，如果给定的图像分辨率比较低，那么每个像素会很大，中心点是不足以代表整个像素的颜色的；这会导致 NeRF 锯齿化太严重的问题（边缘不是直接从白到黑，而是慢慢渐变）。anti-aliasing

二、Mip-NeRF 的主要创新点

正方形写代码不好写，所以把像素作为一个圆形。那么就从采样点变成了介于两个采样圆形之间的锥台（frustums）；为了加速计算，内部使用高斯分布进行模拟，作为 \(c_i\) 和 \(\sigma_i\) 的值。

除了锥台这个方法外，还有种 sample per pixel 方法，也就是一个像素取很多的点进行 ray tracing 采样。效果肯定好，但是计算量翻倍太高，而锥台这个方法平衡了效果和计算量。

一个锥台中，所有 3D 点的 positional encoding 的结果，求期望后，作为 MLP 函数的输入。而且这个结果是和物理上的简谐运动相关。

当施加外力后，最后的结果有个衰减项：\(e^{-x}\)。

只在一个尺度下训练，可以同时在最大、最小尺度都取得很好的效果。

三、Mip-NeRF360

Mip-NeRF360

没法把 Mip-NeRF 的采样方式直接套用在 360° 上：Mip-NeRF 中物体距离相机的距离是大致一样，所以可以控制采样点的范围，但是 360° 引入了很远的背景，但我们不知道背景的距离，并且也不能把 bound 设为一个很大的值。

创新一：

把超出一定范围的高斯分布（椭圆形表示）进行压缩，保证它们在指定半径内部，虽然形状不同，但仍保有原来的信息，不会影响最后的渲染。

创新二：采样点的取法不同：

原来的 NeRF 进行了两段式采样，并且 MLP 是 8 层，同时得到颜色和密度；而 Mip-NeRF 使用改良的 4 层 MLP 只得到 \(\sigma\) 的分布，加快这个过程。

创新三：让 \(\sigma\) 分布趋近于 uni-model（只有一个高点）这样的分布。

四、Block NeRF

范围太大了，没法用同一个 DNN 进行训练，人为切分成多个 Block，以某个点为圆心的圆。

重叠区域，引入了 visualbility 图，确定该相信哪张图像。

白天-黑夜的训练：引入 NeRF in the wild 的思路，引入了 appearence embeding 向量，控制输出白天 or 黑夜的结果。

位置太大，导致 colmap 估计的位姿不准，导致衔接处有割裂感。除了训练颜色和密度外，还会训练位姿，使其更准确。

这个算法没有提供 Depth 图，可能并不能证明真正学习到了深度，只是单纯的重现了图片。

‍

标签：采样,NeRF360,IV,MLP,Mip,像素,NeRF
From： https://www.cnblogs.com/7ytr5/p/18218718

from selenium import webdriver
url='https://chat18.aichatos8.com'chrome_binary_path='/Users/baidu/project/script/chromedriver/chrome-mac-arm64/GoogleChromeforTesting.app/Contents/MacOS/GoogleChromeforTesting'chromedriver_path='/Users/baidu/project/s......
Towards Universal Sequence Representation Learning for Recommender Systems
目录概符号说明UniSRec统一的文本表示统一的序列表示Parameter-EfficientFine-tuning代码HouY.,MuS.,ZhaoW.X.,LiY.,DingB.andWenJ.TowardsUniversalSequenceRepresentationLearningforRecommenderSystems.KDD,2022.概本文提出了一个用text替代ID......
II. 在 Google Colab 上运行 NeRF
一、运行官方数据集直接跟着NeRF(NeuralRadianceFields)tutorialusinggooglecolab这个视频操作即可，顺便验证一下CoLab作为以后深度学习环境的可行性。二、训练自己的数据博主是以SilicaGGO，他自己拍摄的二次元玩偶。工程链接：kewa123/nerf_pl作者建议的拍摄方......
III. NeRF 代码框架
本文介绍了初代NeRF的训练大致框架。一、所有深度学习的大致框架我们看任何一个深度学习代码，都是找这三部分的位置，分析其作用。最后把Loss的梯度更新到DNN中，便能不断提高网络的准确度。二、训练代码的细节（一）采样区间首先，作者通过设置near和far限制了采样区间，如......
datax 抽取hive表到doris
datax读取hive表有两种方式，一种是读取hdfs文件路径HDFSReader，因为hive是存储在hdfs上。第二种是读取hive表RDBMSReader。HDFSReader{"job":{"setting":{"speed":{"channel":3},"......
I. NeRF及其衍生算法的初步探究
视频链接：【AI講壇】NeRF與它的快樂夥伴們[Neuralradiancefields]NeRF的主要优势：能够正确处理反光、估算的深度较准、等等。一、nerfinthewildGoogleResearch、未开源NeRFintheWild:NeuralRadianceFieldsforUnconstrainedPhotoCollections.CVPR2021(Oral)......
positivessl泛域名证书500元13个月
随着创建网站的门槛变低，不论是个人用户还是企事业单位用户创建的域名网站也越来越多，怎么维护网络环境的安全成为了各个用户需要解决的问题。为了保护网站的数据安全，防止恶意攻击和数据泄露，大多数用户选择为域名网站安装数字证书。PositiveSSL旗下的泛域名SSL证书是一种可以同时......
Codeforces Round 948 (Div. 2)
A.LittleNikita题意：\(n\)步操作，\(+1\)或\(-1\)，最终结果是否等于\(m\)思路：设\(+1\)的操作次数为\(x\),\(-1\)的操作次数为\(y\)\[x+y=n\\x-y=m\]\[x=(n+m)/2\\y=(n-m)/2\]\((n-m)\)和\((n+m)\)均为偶数,即\(n\)和\(m\)均为偶数或同为奇数，且\(n>=m\)代码：voidsolve()......
[分享]OffensiveCon24 UEFI 和翻译器的任务：使用跨架构 UEFI Quines 作为 UEFI 漏洞开
链接：OffensiveCon24-uefi-task-of-the-translator目录x64assemblyx64程序集x64assemblysourcecodeforBGGP4entry:bggp4winningentry-x64assemblysourcecodeBGGP4UEFISelf-replicatingapp:bggp4winningentry-UEFIself-replicatingapp,compiledfromx64......
Activity与Fragment之间通信（二）——接口回调
一。引言上篇文章讲述了Activity和Fragment怎么样通过Bundle传递消息，这篇介绍如何通过接口回调实现通信。首先，Bundle并不适用于任何通信情况，我们来看看Bundle通信的缺点：（1）数据类型的限制：Bundle只能传递一些基本数据类型，如int，String等，无法直接传递自定义对象。（2）繁琐的代码：在......

IV. Mip-NeRF

一、NeRF 的缺点

二、Mip-NeRF 的主要创新点

三、Mip-NeRF360

四、Block NeRF

相关文章

赞助商

阅读排行