首页 > 其他分享 >第九周学习总结

第九周学习总结

时间:2022-12-18 16:23:25浏览次数:33  
标签:总结 场景 渲染 视图 学习 神经网络 图像 第九

  本周重温了ECCV 2020上NeRF提出的论文,全文详细阅读了两遍,对其原理大概做到了心中有数:

  首先NeRF是在基于渲染角度提出的一个新的视图合成的办法,而所谓渲染,是将三维场景转化为图像,而观测角度不同,则渲染出的图像也不同,所以我们可以将三维连续场景定义为一个5D函数f,其中的参数为坐标和对应的观测角度,而这个函数的输出结果即为我们的图像,分为两块:颜色c(r,g,b)以及有关于点坐标的体积密度,即最后整个连续场景对应函数需要输出每个点的颜色以及对应的体密度值。

  这个与神经网络有什么关系呢?作者提出要用全连接层(MLP)多层感知机去表示这个场景F,而我们需要优化的loss是渲染结果和观测结果之间的差距,由于整个场景是连续可微的,所以我们可以用梯度下降的方法进行优化;整个神经网络由8个全连接层构成,负责处理输出5个参数中的坐标部分,然后输出一个对应位置的体密度值和一个256维度的特征向量,然后用这个256维的特征向量与光线的观测方向链接,在通过一个全连接层,得到我们对应点的颜色值。

  整个工作的贡献在于将连续场景建模为5D的MLP网络,应用体渲染技术优化RGB图像表示;此外还有两个tricks优化梯度下降的过程例如位置编码和分层抽样。

  而最近更新的进展是LOLNeRF,与原本的NeRF相比,LOLNeRF无须多视图即可实现视图合成,实现三维重建并可从任意视角进行渲染。提出了一种从单一视图中学习三维重建目标的办法,将训练复杂度与图像的分辨率解耦;此外,单个试图可在没有监督情况下学习高质量的几何预测,此方法通过重建固定图像和全新视角来表示学习类别的物体的外观效果超过了对抗方法。这个应该属于自监督学习的范围了。

  具体的技术细节还需要更加详细的思考和了解,此外本周还额外补充了生成对抗网络相关的概念,GAN由一个生成器和判别器构成,即有两个独立的神经网络同时进行训练,生成器类似于造假钞的罪犯,而判别器类似于验钞机,这可以引入博弈论来解释这个问题,对于神经网络训练的结果可以证明收敛到纳什平衡;即罪犯可以造出一个完全仿真的假钞,而验钞机有1/2的概率认为这个是真的,也有1/2概率认为这个是假的。其具体意义则是可以生成与原本数据的概率分布完全相同的数据。

  LOLNeRF用的是一个自动解码器和GLO的结合,与GAN相比,没有了编码部分。目前阅读这篇论文的理解仅仅到这个地方。

  目前阅读论文的方法是先看Introduction部分,先大概了解这个工作解决了哪些问题,然后精度related work和实现原理部分,对于之前没有了解过的知识体系就去广泛的学习和补充,这就导致了我阅读论文的速度没有那么快,基本上两三天才能完全看懂一篇,但是如果让我复现以及证明其中的技术细节,可能现在还做不太到。

标签:总结,场景,渲染,视图,学习,神经网络,图像,第九
From: https://www.cnblogs.com/Lbmttw/p/16990505.html

相关文章

  • 周总结
    可视化界面之数据增删改查针对数据对象主键字段的获取可以使用更加方便的obj.pk获取在模型类中定义双下str方法可以在数据对象被执行打印操作的时候方便的查看'''for......
  • 【博学谷学习记录】超强总结,用心分享|狂野架构常见编程规约
    编程规约方法参数类型必须一致,不要出现自动装箱拆箱操作2.1.1.1反例这种操作很容易产生难以排查的NPE异常/***反例*容易出现空指针异常,如果参数为null就会......
  • 第十二周总结
    目录django之路由层django请求生命流程路由匹配转换器正则匹配反向解析路由分发名称空间django视图层视图层之不会三板斧JsonResponse对象视图层之request对象获取文件视图......
  • 冒泡排序相关知识总结
    轮数表示冒泡排序外层循环的次数,次数表示交换次数。设排列为\(w\),冒泡排序的轮数为\(\max_{i=1}^{n}(i-w_i)\).因为如果\(i>w_i\),那么这个数每一轮会向目的地......
  • 计组学习06——RISC-V Functions
    有点发烧,唔,不过还是坚持学下来了,新冠让人静心.计组学习——RISC-VFunctionsLoadingSignExtension假如内存里的字节是这样:0b11111110(-2)当我们使用loadbyte指令......
  • 周总结12
    周总结12学习内容:django路由层django模板层,django模型层路由层主要是用来做路由匹配调用对应的视图函数。匹配的方法有多种正常的就是path第一个内容填写的是路由,......
  • OSPF 学习笔记
    1、OSPF的状态1、DownState2、initstate3、Two-Waystate----邻居发现阶段---ExstartstateExchangestate----数据库开始同步阶段---LoadingstateFullstate--数据库......
  • 第十二周内容总结
    目录一、可视化界面之数据增删改查二、Django请求生命周期流程图三、路由层四、反向解析五、路由分发六、名称空间七、虚拟环境创建八、视图层三板斧九、JsonResponse对象......
  • 心脏病_冠心病智能预测模型(人工智能,机器学习,可用于论文作业_专利_企业建模__项目申报_
    心脏病(heartdisease)是心脏疾病的总称,包括风湿性心脏病、先天性心脏病、高血压性心脏病、冠心病、心肌炎等各种心脏病。人体“发动机”心脏是一个强壮的、不知疲倦、努力工......
  • git学习笔记
    1、git是什么?Git是一个开源的分布式版本控制系统,可以有效、高速的处理从很小到非常大的项目版本管理。Git是LinusTorvalds为了帮助管理Linux内核开发而开发的一个......